Machine Learning Casual Talks #3 まとめ #MLCT

ABテストの環境どうしてるのか気になる #MLCT

2015-04-30 20:08:09

みんな大好きロジスティック回帰 #MLCT CTRを予測して、CTRにクリック時のチャージを掛け算して入札している感じかな。

2015-04-30 20:11:38

Hivemallだ！ #MLCT

2015-04-30 20:12:20

Hivemallでロジスティック回帰ｷﾀ━(ﾟ∀ﾟ)━! #MLCT

2015-04-30 20:12:33

そうか、だから Amazon MLもロジスティック回帰ベースなんだ #MLCT

2015-04-30 20:12:58

学習用は直近3日分のログなのか #MLCT

2015-04-30 20:13:10

直近3日のログで予測 #MLCT

2015-04-30 20:13:20

HivemallでCTR予測 #MLCT

2015-04-30 20:13:53

Shunsuke Wada @letusfly85

#MLCT Hivemallによるロジスティック回帰のバッチ処理の話バッチによるロジスティック回帰の学習とオンラインの確率算出はサービス分離

2015-04-30 20:13:59

@chezou 数十GBでロジスティック回帰かけて、係数だけを取り出せれば、AmazonMLでもいいのかも。予測は自前でヤルとして。 #MLCT

2015-04-30 20:15:21

freakout CTRのロジスティック回帰 3日分のimpression&click(300GB) #MLCT logistic regresisonでもローカルキャッシュを利用して繰り返し学習できるようにしないとな...

2015-04-30 20:15:41

やまかつ @yamakatu

学習データ3日分か、曜日とかあまり意識する必要がない世界なのかな #MLCT

2015-04-30 20:15:46

Subsamplingか　#MLCT

2015-04-30 20:15:52

Subsamplingの話 #MLCT

2015-04-30 20:15:52

@tokoroten 係数とかの情報は多分出てこないと思うんですよねー #MLCT

2015-04-30 20:16:05

同じ論文を参考にしている #MLCT

2015-04-30 20:16:09

なんかこのデータを見る限り、広告のCTRが0.08%に見えるぞ・・・ #MLCT

2015-04-30 20:16:20

#MLCT subsamplingが重要 Criteoのpaper-> simple and scalable response prediction for display advertising

2015-04-30 20:16:38

Subsamplingの割合 0.08:99.92 って広告だとCVR 0.08%くらいか。高いな #MLCT

2015-04-30 20:16:58

KOMIYA Atsushi @komiya_atsushi

subsampling の論文、これだ。 olivier.chapelle.cc/pub/ngdstone.p… negative sample を間引く、ってやつだったかな。 #MLCT

2015-04-30 20:17:00

うちのサービスも同じような状況なので、Negative側のデータはランダムサンプリングで削ってますねー #MLCT

2015-04-30 20:17:37

#MLCT で出てきた Subsamplingの論文 / “A Simple and scalable response prediction for display advertising OLIVIER CHAPELLE, C…” htn.to/n3LAra

2015-04-30 20:17:43

不均衡データだけど、不均衡すぎるのが広告の世界だからなー #MLCT

2015-04-30 20:18:24

#MLCT 広告クリック率は0.2%とか言われているのでpositive exampleを増やさないとダメなんですよね。adtech/ctr predictionの著名なtips

2015-04-30 20:18:42