第39回 データマイニング+WEB @東京 ( #TokyoWebmining 39th ) - 捗る機械学習・自然言語処理 祭り -
- hamadakoichi
- 2734
- 0
- 1
- 5
#TokyoWebmining の自己紹介タイム怖いな〜w 浜田さんからテーマ発表コミットの無茶ぶりされる確率かなり高いぞw
2014-10-11 13:21:48広告領域と機械学習 CTR予測最前 - slideshare slideshare.net/tsubosaka/toky… #TokyoWebmining
2014-10-11 13:41:26#TokyoWebmining RT @tsubosaka: 今日の発表資料です slideshare.net/tsubosaka/toky…
2014-10-11 13:57:28#NLPStudy LT枠が埋まらないようなので、LT枠を削り発表枠をひとつ増やしました。 繰り上がりで@smzkng さんに発表していただきたいと思いますが、可能でしょうか?
2014-10-11 14:10:31FacebookのCTR予測の話。決定木を使って特徴量を変換。非線形な変換と次元削減。boosted decision trees。 #TokyoWebmining
2014-10-11 14:15:12うーん。決定木を使ったFeatureの選定が今ひとつしっくり来ない/Tokyowebmining ctr-predict slideshare.net/tsubosaka/toky…
2014-10-11 14:21:32ふむー、Feature hashing を使ってしまうと、どの属性の効き目の良し悪しがわからなくなるのが嫌だ、という理由もあるとか。あと精度がちょっと落ちた、と。 #TokyoWebmining
2014-10-11 14:29:04Feature Hashingだと、どの特徴量が効いてるか分からないから、モデルの中身を解釈する必要がある時に適用するのは辛いですね。 #TokyoWebmining
2014-10-11 14:30:11imp のログと click のログの紐付け、オンラインでやるんだね。例えば HashQueue などのデータを使う、と。 #TokyoWebmining
2014-10-11 14:39:08よく効く特徴量:Historical と Context だと、Historical の方がいい。Historical = ユーザの CTR や広告の CTR などの *実績値* #TokyoWebmining
2014-10-11 14:43:17impとclickをインメモリでjoinする(timeoutしたら無視)というのはなるほど。溢れる部分を無視して良いなら、オンライン学習時には確かにこのやり方が良さそう。 #TokyoWebmining
2014-10-11 14:44:43impとclickのjoinは、timeout型じゃなくてHashedQueueで待ち合わせ。dequeue時までに対応するclickが無かったら、negative exampleとして学習。Queueは充分長い?っぽい。 #TokyoWebmining
2014-10-11 14:59:52スライドあげました 「捗るリコメンドシステムの裏事情(ハッカドール)」 #hackadoll slideshare.net/mosa_siru/ss-4… #TokyoWebmining
2014-10-11 15:16:511件のコメント b.hatena.ne.jp/entry/www.slid… “広告領域と機械学習 CTR予測最前線 #TokyoWebmining 39” htn.to/bDjpja
2014-10-11 15:18:53#TokyoWebmining 39 / “捗るリコメンドシステムの裏事情(ハッカドール)” htn.to/3VMxfr
2014-10-11 15:21:0815:25 - 16:25 2. 「捗るリコメンドシステムの裏事情」 (講師: @mosa_siru )(発表25分+議論35分) #TokyoWebmining
2014-10-11 15:23:07