しましまのKDD2012まとめ

しましまのKDD2012の参加・聴講記録 http://kdd2012.sigkdd.org/
0
しましま @shima__shima

KDD2012@北京,VPN経由で Twitter に繋ぐ.Dropbox は無理と聞いていたが,これが生きてるのは助かる.

2012-08-11 23:47:31
しましま @shima__shima

ホテルまでの,タクシーの運転手さん,最初はラジオに合わせて鼻歌歌ってたり機嫌がよかったが,渋滞にはまって,車にこすられて,前の車エンストしてたら機嫌悪くなってた…

2012-08-11 23:51:15
しましま @shima__shima

展覧会場で行われているが,隣で中国婚博会なるものが開催されており,日傘でアイアイ傘のカップルがあふれている

2012-08-12 21:40:30
しましま @shima__shima

午前中は,ソーシャルネット関連のチュートリアル.資料配布場所 http://t.co/9uwvl2RX

2012-08-12 21:40:39
しましま @shima__shima

前半はソーシャルネットってこんなものっていう一般的によく知られた話. @ymatsuo 先生の@コスメの分析の例は取り上げられてた

2012-08-12 21:41:02
しましま @shima__shima

後半の一つ目は,伝播モデルのパラメータが分かったネットが与えられたとして,影響力を最大にする集合を見つける.問題としては列モジュラ最適化に落とせる.並の多項式時間では遅いので,貪欲アルゴリズムで近似解にし,さらにハッシュとか,近傍だけ見るとかして高速化する.

2012-08-12 21:41:26
しましま @shima__shima

そのあとは,viral marketing で,元から同じような嗜好の人が繋がっているため相関ができる homophily と,友人の影響で嗜好に影響がでる causality とを分離する.

2012-08-12 21:41:46
しましま @shima__shima

正しい時間順で計算した確率と,時間をランダムに置換したデータとを比べて影響を見る方法.統計でいうサロゲートみたいなことをしていた.

2012-08-12 21:41:49
しましま @shima__shima

その他,ランダムに選んだ2者が似ている確率を帰無確率とした検定を使うとかも

2012-08-12 21:41:59
しましま @shima__shima

午後は,Learning to Rank のチュートリアル.基本は知ってる話で,最近は大きなブレイクスルーはない感じ.

2012-08-12 21:42:06
しましま @shima__shima

LtoR用コーパスの紹介:MSR の LETOR http://t.co/bcrinh5A Y! LtoR Challenge http://t.co/qKaKLEoO MSの新版 http://t.co/gR7KmNHz

2012-08-12 21:42:15
しましま @shima__shima

最後の上界とかの話は知らなかった.クエリごとに適合文書が変わるあたりで,普通の分類問題とはだいぶ違う趣に.

2012-08-12 21:42:25
しましま @shima__shima

Opening Plenary,参加者 1210 で過去最高.見た雰囲気は8割以上は中国,Keynote は http://t.co/yF9KYM4x で配信予定

2012-08-12 21:42:36
しましま @shima__shima

来年の KDD2013 は 8/11-14 シカゴで開催.個人的には,去年は北京とニューヨークで競っていたからニューヨークを実は期待していたのだが.シカゴは去年行ったなぁ…

2012-08-12 21:42:47
しましま @shima__shima

採択率 : Research Track 133 / 734 = 18.1%, Industry Track 30 / 113 = 26.5%

2012-08-12 21:42:54
しましま @shima__shima

プレビュービデオ KDD madness http://t.co/l1jp9dzS 凝ったビデオが紹介されててウケてた.これ http://t.co/ohZfZAAL

2012-08-12 21:43:06
しましま @shima__shima

KDD Cup http://t.co/6zoqEXzG それぞれ上海交通大と国立台湾大の学生さんの集団+Stackingの技で1位だったが,元鷲尾研のRendleさんが一人で挑んでどちらも2位と3位に入ってた

2012-08-12 21:43:49
しましま @shima__shima

授賞式:これなかった学生さんの代わりに先生がもらってたけど,学生の顔写真をノートPCに映しながら受け取ってた.受賞者発表の前に,パワポをめくりすぎて受賞者がだれかわかったけど,みんな大人の対応をしていた一場面もあった.

2012-08-12 21:44:59
しましま @shima__shima

基調講演一つ目 Baidu の偉い人 http://t.co/S0mk3TcG 画像の中の文字認識とか,背景ノイズがあるときの音声認識とか,まぁ難しいところは,需要はあってもいつまで残ってしまうね.

2012-08-13 20:56:01
しましま @shima__shima

二つ目の基調講演は Jawei Han 先生 http://t.co/WDBSZzwJ FP-tree とか,お弟子さんの仕事だけど PrefixSpan とか深さ優先系のメジャーなアルゴリズムはこの一派が総なめにしている.

2012-08-13 20:58:02
しましま @shima__shima

今回は,引用ネットみたいに著者や論文のノードがあって,執筆とか共著とかの関係のリンクで繋がっているヘテロなネットが対象.DB系・アルゴリズム系の人なので,スキーマの抽出みたいな感じで共通パターンを出してくるとか.リンクの局所パターンでやる方がメトリックを決めるよりいいよ (続く)

2012-08-13 21:00:04
しましま @shima__shima

(続き) とかは,統計というか確率の方からみたら,その辺はいろいろ工夫できるよとか思った.

2012-08-13 21:01:03
しましま @shima__shima

今日聞いた一般セッション http://t.co/O3NfK3mm は,A4: Supervised learning, B1: Social opinions, C6: Industry Practice Expo Invited Talks の三つ

2012-08-13 21:04:47
しましま @shima__shima

Learning from Crowds in the Presence of Schools of Thought クラウドソーシングで,ワーカーが良いと結果は一致し易いと共に,クラスタへの分類とかのタスクがより明確であれば結果は一致しやすいというのを同時に利用する

2012-08-13 21:06:32
しましま @shima__shima

Social Sampling サンプリングで統計量の偏りが小さくなるようにしたい.ソーシャルネットがあり近傍の人に各ノードの結果が影響されるときには,そのことを利用して予測誤差の上界を小さくできますよという話.iidじゃないからそれを使うということだが統計だといろいろあるかな?

2012-08-13 21:08:38