機械学習CROSSまとめ
冷蔵庫を注文した後の確認ページで、「この冷蔵庫を買った人には、この冷蔵庫もお勧めです」をリコメンド ww 購買ログと閲覧ログをゴッチャに解析したのでは、とのこと。 #cross2014a
2014-01-17 15:04:15CDは閲覧ログでリコメンド、冷蔵庫みたいに一つあれば事足りるのは購買ログで解析するのが良いのね。ふむ。 #cross2014a
2014-01-17 15:05:18村上さん: 正常なソフトと不正なものを分離するという仕事をしているが、それは不可能なんではないかという考え方もある。それをうまく切るのはできないと考えることがたまにあります。データの性質や偏りによっては機械学習が適用できない場合もありそう #cross2014a
2014-01-17 15:05:52油井さん: 学習データをもっとくれくれと言って集めてきても、特徴がいっぱいあってもノイズをうまく除去してくれるとは限らない。劇的な変化に対して過去のデータからの学習が予測に役立たないことがある。特徴選択というトピックで扱われる問題 #cross2014a
2014-01-17 15:07:50「データが多ければ多いほど良い。ノイズはアルゴリズムでちゃんと弾ける」訳ではないのこと。アベノミクスによる環境変化とか。 #cross2014a
2014-01-17 15:08:19福島さん: 問題の設定がうまくない場合もある。100個の中にスパムが1個あるときに「全部スパムではない」と答えると精度が高いと評価されてしまう。そういうミスは結構ハマりやすい #cross2014a
2014-01-17 15:08:43福島さん: リコメンドエンジンも「好きな物」がたくさんないとうまくいかない。不動産リコメンドエンジンも不動産は営業が集めてくるので、十分な数が集まらず失敗する #cross2014a
2014-01-17 15:09:40推薦エンジンに向いているのは、ニュース、映画(?)とかとか、数が多くてデータ取得に営業が必要ないもの。その反対が不動産。なるほど。 #cross2014a
2014-01-17 15:10:40小宮さん: 「ビッグデータの使い方・活かし方」という本があり、マーケティングへの活用事例が結構出ています #cross2014a
2014-01-17 15:11:38ブログ書いた。 #CROSS2014 「機械学習 CROSS」セッションでお話しました - ALBERT Engineering Blog http://t.co/HEr6ysqgah
2014-01-20 11:02:39機械学習CROSSの後半資料もSlideshareに置きました(主にパネルディスカッションのお題のみですが) http://t.co/wOQqasA2KH #cross2014a #cross2014
2014-01-20 11:27:59