機械学習CROSSまとめ
平手さん: 機械学習の結果と専門家によるマーケティングで一致する部分があるよね、という事例もあった。人間ではできなかったところを機械学習が切り拓く #cross2014a
2014-01-17 14:43:39小宮さん: 利益追求が大事。技術のほうはどうでもいい。精度は重要とはいえほどほどであって、その上で利益最大化できるのがうれしい。このリコメンドがなんでされたのか、適切なのか判断できることが精度よりも大切 #cross2014a
2014-01-17 14:43:46比戸さん: CTRなど金額の大小によって誤判定のインパクトからリコメンドの活用度合を変えたりということはある? 小宮さん: ありますね #cross2014a
2014-01-17 14:44:52村上さん: 機械学習でうまくいかなかったときに、究極的にはそれを人間が正解かどうか判断できる、という前提に立っている。セキュリティーは何に対するかで考える。人間不要の世界が来たとして、機械学習のことがわかる人がセキュリティーの専門家になるのだろう #cross2014a
2014-01-17 14:47:45油井さん: 将棋・チェスでコンピュータが勝てるのは、いいデータがあるから。専門家の経験はデータ可が可能で、そこは対立軸ではないと思う #cross2014a
2014-01-17 14:48:51福島さん: 機械学習で勝つパターンは、トレーニングデータがいいとき。将棋やチェスは勝ちの条件が明確、かついいデータがたまっている。そういうとき人間は勝てないと思う。もうプロ棋士が負けたりしている。一方難しいのは価値判断が明確に決まらない部分 #cross2014a
2014-01-17 14:51:50福島さん: モデルの解釈性で問題になるのは失敗時の説明もあるが、モデルのパラメータがチューニングにおいて、教科書的には特徴量の抽出のハイパーパラメータをやるが、実際には外れたデータが来たときにどうするかが困る #cross2014a
2014-01-17 14:51:58人間が解釈しやすいfeatureを選ぶのと、機械にselectionさせるのとどっちが実用的なんだろうなー。 #cross2014a
2014-01-17 14:52:28比戸さん: 論文レベルではデータ固定でアルゴリズムのチューニング勝負だったでしょうけど 福島さん: 企業してからはモデルを変えるよりも特徴量を変えた方がうまく効くということに気づいた。人がどういう記事が好きかどうかは曖昧なので #cross2014a
2014-01-17 14:53:53#cross2014a 機械学習は人間に勝てるか?という議論。 「勝った」と判断するのがまた人間の脳だからどこまでもパラドクスだと思う。 問題領域と勝ち負けの基準が明確なら機械学習の方がたぶん強い
2014-01-17 14:54:32「好きな記事」そのものが曖昧。言われてみれば、自分一人でも気分によってクリックしたりしなかったりするもんね (^^;; #cross2014a
2014-01-17 14:54:46比戸さん: アカデミックな評価と実用の評価とは基準が違う。一方で新しい手法はアカデミアから来る。論文ではよさそうなのに使ってみたらダメダメということがある。これから機械学習をやってみようという人はどのように学んだらよいか #cross2014a
2014-01-17 14:54:51ニュースのクリック、ユーザの開きたくなる理由ドメインによって違うようですしね… http://t.co/DWCaa23qBg #cross2014a
2014-01-17 14:56:01田島さん: 機械学習は1回でポンといいモノが入るわけではない。KPIを決めておく。売上なのかクリックなのか。それができないとプロジェクトが迷走してしまう。やりながらKPIが上がっていく、上げることを楽しむのが大事 #cross2014a
2014-01-17 14:56:09まずは目的を決めることが大事。「クリックさせたい」vs「いや、それだと見た目がさー」 // 機械学習だけじゃなくても意識しときたい。 #cross2014a
2014-01-17 14:57:17油井さん: どういったアルゴリズムを適用したかなやんだとき、複数の手法で予測した結果を統合するアンサンブル学習という手法がある。データサイエンティストのコンペティションサイトで、上位の人の結果をマージしたらうまくいったという例がある。安定した結果を得られる #cross2014a
2014-01-17 14:57:21田島さん: KPI設定の失敗は細かくいろいろある。失敗した例としては国によってマーケット規模を推定するようなこと。為替がががっと変わってモデルがダメになってしまったことがある。時間軸が短く、確実に構造が同じだよね、というところで生かせると思う #cross2014a
2014-01-17 14:59:47平手さん: よい学習データが得られるところがいいというのはある。これを抽出したい、に対してこういうのではない、ということがよくわかっているのがよい。不正検知は、ダメだったというのはよく上がってくるが、うまくいった例はこないので難しい。正例・不例の用意が重要 #cross2014a
2014-01-17 15:01:20小宮さん: 機械学習は手段という観点をくり返しますが、機械学習のアウトプットをそのまま顧客に渡すのではなく、ドメイン知識で解釈したものを出すべき #cross2014a
2014-01-17 15:02:11小宮さん: これはひどいの例: 冷蔵庫の商品ページで別の冷蔵庫を出すのはおかしい。一家に冷蔵庫は2台必要ない。冷蔵庫を買った人には同じメーカーの電子レンジをすすめるようなフィルタを入れるのがよいと思う #cross2014a
2014-01-17 15:03:15小宮さん: 購売ログではなく閲覧ログを元にリコメンドしてしまうとそういう変な例になってしまうと思われる #cross2014a
2014-01-17 15:04:03