- seikoudoku2000
- 5280
- 0
- 14
- 1
本日 mixi さんのセミナー http://t.co/7pVafJxX で2番目にお話をさせていただく神嶌です.拡張版資料を http://t.co/oKlg55Jj の「推薦システムに関する講演・講義資料」にて配布しています. #mixi_engineers
2012-02-02 09:18:51前半は推薦システムのアルゴリズムについて,メモリベース型手法,行列分解,確率モデルと,どういった拡張があるかということについて概念的な話させていただきます.アルゴリズムの詳細までは時間的に無理なので,そのあたりは資料をご覧下さい. #mixi_engineers
2012-02-02 09:24:10後半は,推薦システムの研究トピックについて,一般のニュースサイトなどではみかけないようなものをいくつか紹介させていただきます:サクラ攻撃,ソーシャル推薦,バンドワゴン効果・人気バイアス,Webコンテンツ最適化,フィルターバブル など #mixi_engineers
2012-02-02 09:26:02すずかけ台ツイートの評判分析.「すずかけ台には良い教授がたくさんいる」はポジティブに判定される. #mixi_engineers
2012-02-02 19:10:09Twitter上の意見を使った評判分析、ポジティブ/ネガティブ分類を実例を通して機械学習の基礎を紹介。コンテンツ入手→前処理→分類器→出力の4ステップ #mixi_engineers
2012-02-02 19:10:23Twitterのつぶやきのネガティブなものとポジティブなものに自動で分ける、というのを例にとって説明 #mixi_engineers
2012-02-02 19:10:31まずは前処理としておなじみの形態素分析。そして品詞やストップワード削除(意味のない動詞など)によるフィルタリング。 #mixi_engineers
2012-02-02 19:12:26前処理:まず形態素解析(Chasen,MeCab,JUMANなど)、品詞によって助詞のような必要ない単語を除外、意味のない動詞(ストップワード)も除外 #mixi_engineers
2012-02-02 19:12:32その結果、分類器でポジティブ判定をする。それをどう作るかが機械学習の主題。 「ナイーブベイズ分類器」 #mixi_engineers
2012-02-02 19:13:47分類器:ナイーブベイズ分類器を紹介。確率的分類器の一種でしっかり理解するのは大変だけど説明。まずツイート生成の仕組みを勝手に決める。仮定として、ツイートの単語数→ポジネガ→単語を長さ分選び出されているとする。 #mixi_engineers
2012-02-02 19:15:02ツイート全体の評価極性(ポジティブorネガティブ)は、長さ4の確率、ツイート全体のポジ/ネガの確率、各単語のポジ/ネガ確率の掛け合わせ #mixi_engineers
2012-02-02 19:17:45「ラグランジュ未定乗数法でパラメタを決めます。別にラグランジュ未定乗数法は難しいものではなくて偏微分ちょっとかますだけで簡単です」こわい… #mixi_engineers
2012-02-02 19:21:23