SIGIR2012勉強会

2012年12月16日に開催されたSIGIR2012勉強会(http://qwik.jp/dbreading/74.html)の当日tweetをまとめました。 #dbreadingタグがついたもののうち、紹介された論文に内容に関するものだけを抽出してます。
0
Yukino Baba @yukino

画像がプライベートな写真かパブリックな写真かを推定。画像特徴量+タグ情報だけを利用。 使った画像特徴:Face Detection、色ヒストグラム、エッジ特徴、SIFT。正解セットはクラウドソーシングで作成。http://t.co/1djYZaIi #dbreading

2012-12-16 14:25:02
ponta(冷凍保存完了) @_akisato_

何か,普通にCVPRとかACMMMとかICMRとかに出てきそうな問題設定がたくさん.研究コミュニティ同士で問題の取り合いをしている典型例… #dbreading

2012-12-16 14:24:13
ponta(冷凍保存完了) @_akisato_

解説されて,結局なんだよstraightforwardじゃん,という研究が,通すのは難しいけど通ったときに評価が抜群に良い,典型的なパターン.コロンブスの卵を評価できるかどうか,評価する側のスキルも問われる #dbreading

2012-12-16 14:17:04
Yukino Baba @yukino

top-kだけ合ってればいいじゃん、という枠組み。「top-k内の順序が保たれ、top-k文書とそれ以外のペア誤りが最小になるように」損失を設定。この枠組用の新しい評価指標も提案。 http://t.co/SUBeZc6Y #dbreading

2012-12-16 14:15:50
Yukino Baba @yukino

質問応答の回答提示をランキング問題とする。訓練データ内の<質問、回答>ペアの関係と同じような関係を持つ回答を上位に持ってくる。関係は構文木の木構造カーネルで捉える。 http://t.co/9BXyF1jE #dbreading

2012-12-16 14:12:16
ponta(冷凍保存完了) @_akisato_

QAで質問に対する回答を提示する問題をlearning to rankで定式化,か.こういう問題転用は面白くて良いよね. #dbreading

2012-12-16 14:08:44
Yukino Baba @yukino

テキストから抽出した場所(Toponym)の緯度・経度を特定する。Toponymの共起が地理的な関係を反映してることに着目した。記事自体の地理的特性(発行者の所在地とか)混ぜるとかえって悪くなったりする。http://t.co/xGJuaft2 #dbreading

2012-12-16 14:07:59
Yukino Baba @yukino

Twitterからの固有名抽出。ツイートを、wikipediaとWebコーパスを使ってフレーズに分割。「固有名と固有名は同時に現れやすい」ことに着目してスコア伝搬。http://t.co/s1UG98Ka #dbreading

2012-12-16 13:59:38
ponta(冷凍保存完了) @_akisato_

classicalな分野だと,やはり既存手法をしっかり調査して比較した上で,様々な角度での検証が必要になるんだなぁ… #dbreading

2012-12-16 13:18:54