#mixi_engineers #3 データマイニング

http://atnd.org/events/24397 誰でも編集可です。
4
しましま @shima__shima

本日 mixi さんのセミナー http://t.co/7pVafJxX で2番目にお話をさせていただく神嶌です.拡張版資料を http://t.co/oKlg55Jj の「推薦システムに関する講演・講義資料」にて配布しています. #mixi_engineers

2012-02-02 09:18:51
しましま @shima__shima

前半は推薦システムのアルゴリズムについて,メモリベース型手法,行列分解,確率モデルと,どういった拡張があるかということについて概念的な話させていただきます.アルゴリズムの詳細までは時間的に無理なので,そのあたりは資料をご覧下さい. #mixi_engineers

2012-02-02 09:24:10
しましま @shima__shima

後半は,推薦システムの研究トピックについて,一般のニュースサイトなどではみかけないようなものをいくつか紹介させていただきます:サクラ攻撃,ソーシャル推薦,バンドワゴン効果・人気バイアス,Webコンテンツ最適化,フィルターバブル など #mixi_engineers

2012-02-02 09:26:02
Eiji Iwazawa @iwazer

高村先生(東京工業大学)による「機械学習の基礎と評判分析」 #mixi_engineers

2012-02-02 19:07:22
kakuit @kakuit

最初のセッションは「機械学習の基礎と評判分析」について東工大の高村先生(@hjtakamura#mixi_engineers

2012-02-02 19:07:42
S.Nakamura @lrnkmr

高村さんはすずかけのスナップショットから。久しくすずかけに行っていないなあ… #mixi_engineers

2012-02-02 19:09:18
Yoh Okuno @yoh_okuno

すずかけ台ツイートの評判分析.「すずかけ台には良い教授がたくさんいる」はポジティブに判定される. #mixi_engineers

2012-02-02 19:10:09
kakuit @kakuit

Twitter上の意見を使った評判分析、ポジティブ/ネガティブ分類を実例を通して機械学習の基礎を紹介。コンテンツ入手→前処理→分類器→出力の4ステップ #mixi_engineers

2012-02-02 19:10:23
Eiji Iwazawa @iwazer

Twitterのつぶやきのネガティブなものとポジティブなものに自動で分ける、というのを例にとって説明 #mixi_engineers

2012-02-02 19:10:31
Eiji Iwazawa @iwazer

まずは前処理としておなじみの形態素分析。そして品詞やストップワード削除(意味のない動詞など)によるフィルタリング。 #mixi_engineers

2012-02-02 19:12:26
kakuit @kakuit

前処理:まず形態素解析(Chasen,MeCab,JUMANなど)、品詞によって助詞のような必要ない単語を除外、意味のない動詞(ストップワード)も除外 #mixi_engineers

2012-02-02 19:12:32
kakuit @kakuit

すずかけ台には良い教授がたくさんいる→「すずかけ台/良い/教授/たくさん」 #mixi_engineers

2012-02-02 19:12:48
Eiji Iwazawa @iwazer

その結果、分類器でポジティブ判定をする。それをどう作るかが機械学習の主題。 「ナイーブベイズ分類器」 #mixi_engineers

2012-02-02 19:13:47
kakuit @kakuit

分類器:ナイーブベイズ分類器を紹介。確率的分類器の一種でしっかり理解するのは大変だけど説明。まずツイート生成の仕組みを勝手に決める。仮定として、ツイートの単語数→ポジネガ→単語を長さ分選び出されているとする。 #mixi_engineers

2012-02-02 19:15:02
Yoh Okuno @yoh_okuno

高村先生が生成モデルっぽい説明をしている #mixi_engineers

2012-02-02 19:15:06
たむたむ🏫 @tamtam180

これって単語の係り受けとかも考慮するのかな? #mixi_engineers

2012-02-02 19:15:17
WADA Kazuya @wdkz

#mixi_engineers がトレンドワードになってる!!

2012-02-02 19:16:54
kakuit @kakuit

ツイート全体の評価極性(ポジティブorネガティブ)は、長さ4の確率、ツイート全体のポジ/ネガの確率、各単語のポジ/ネガ確率の掛け合わせ #mixi_engineers

2012-02-02 19:17:45
Yoh Okuno @yoh_okuno

尤度関数が最大になるようにパラメータを決定する(キリッ #mixi_engineers

2012-02-02 19:18:57
(あんちべ! 俺がS式だ) @AntiBayesian

「ラグランジュ未定乗数法でパラメタを決めます。別にラグランジュ未定乗数法は難しいものではなくて偏微分ちょっとかますだけで簡単です」こわい… #mixi_engineers

2012-02-02 19:21:23
りすお@労働者 @risuosan

やっぱ生成モデルはグラフィカルモデル使わないと逆にきついような #mixi_engineers

2012-02-02 19:21:24
1 ・・ 13 次へ