第2回 自然言語処理勉強会@東京 (#tokyotextmining)
- kimukou2628
- 5113
- 0
- 8
- 0
論文2: Generalized syntactic and semantic models of query reformulation #tokyotextmining
2010-09-25 13:52:47hitting timeの方がランダムウォークでクエリ推薦するよりもよい。パーソナライズした方が意味のある言葉が引っかかるようになる #tokyotextmining
2010-09-25 13:53:35スライド見た。まじめな内容のキャッチにこのタイトルを持ってくるセンスに脱帽 RT: @nokuno: 自己紹介終わり、@y_benjo さんの発表「「あずにゃんに関連する検索キーワード」→「あずにゃん ペロペロ」を実現するクエリ推薦技術について」 #Tokyotextmining
2010-09-25 13:56:48Generalized edit distance 単語単位で一般化、Sorted 辞書順にソート #tokyotextmining
2010-09-25 13:57:25ランダムウォーク 近傍、hitting time 近傍の近傍 までみるのでトピックドリフトがおきにくい #tokyotextmining
2010-09-25 14:00:47Generalized edit distance = 文字単位でレーベンシュタイン距離を考えるのではなく単語単位で正規化した PMI を類似度 f としてコスト行列を考える #tokyotextmining
2010-09-25 14:01:04OKモデル(Oommen and Kashap)ってご存じの方いますか? by @y_benjo さん #tokyotextmining
2010-09-25 14:01:13IPアドレスや、国情報を付加するだけで 検索情報としてヒットする情報自体が違ってくる #tokyotextmining
2010-09-25 14:02:38Oommen and Kashyap Model → 連続した二つのクエリに挿入削除置換を全て数え正規化する → 削除した確率が大きくなりすぎるので damping factor で正規化し直し #tokyotextmining
2010-09-25 14:05:01ニューラルネットが強いのは、教師ありだから当たり前で、教師なしでそれに迫るのがすごいってことかな。 #tokyotextmining
2010-09-25 14:05:16