![](https://s.togetter.com/static/web/img/placeholder.gif)
Machine Learning Casual Talks #3 まとめ #MLCT
![](https://s.togetter.com/static/web/img/placeholder.gif)
#MLCT Hivemallによるロジスティック回帰のバッチ処理の話 バッチによるロジスティック回帰の学習とオンラインの確率算出はサービス分離
2015-04-30 20:13:59![](https://s.togetter.com/static/web/img/placeholder.gif)
@chezou 数十GBでロジスティック回帰かけて、係数だけを取り出せれば、AmazonMLでもいいのかも。 予測は自前でヤルとして。 #MLCT
2015-04-30 20:15:21![](https://s.togetter.com/static/web/img/placeholder.gif)
freakout CTRのロジスティック回帰 3日分のimpression&click(300GB) #MLCT logistic regresisonでもローカルキャッシュを利用して繰り返し学習できるようにしないとな...
2015-04-30 20:15:41![](https://s.togetter.com/static/web/img/placeholder.gif)
#MLCT subsamplingが重要 Criteoのpaper-> simple and scalable response prediction for display advertising
2015-04-30 20:16:38![](https://s.togetter.com/static/web/img/placeholder.gif)
subsampling の論文、これだ。 olivier.chapelle.cc/pub/ngdstone.p… negative sample を間引く、ってやつだったかな。 #MLCT
2015-04-30 20:17:00![](https://s.togetter.com/static/web/img/placeholder.gif)
#MLCT で出てきた Subsamplingの論文 / “A Simple and scalable response prediction for display advertising OLIVIER CHAPELLE, C…” htn.to/n3LAra
2015-04-30 20:17:43![](https://s.togetter.com/static/web/img/placeholder.gif)
#MLCT 広告クリック率は0.2%とか言われているのでpositive exampleを増やさないとダメなんですよね。adtech/ctr predictionの著名なtips
2015-04-30 20:18:42![](https://s.togetter.com/static/web/img/placeholder.gif)
positive:negative=1:500だからなぁ...batchの学習器がCTR predictionでうまくいかないのもそこに原因があったような #MLCT
2015-04-30 20:20:20