WWW2012勉強会

2012年7月21日に開催されたWWW2012勉強会(http://qwik.jp/dbreading/56.html)の当日tweetをまとめました。 #dbreadingタグがついたもののうち、紹介された論文に内容に関するものだけを抽出してます。
0
Yukino Baba @yukino

http://t.co/G9BP3eZ2 Twitterにおける犯罪者(スパマー)を分析。犯罪者/そのサポートのコミュニティが各々ある。犯罪者アカウントは全体から探索ではなく既知の犯罪者から辿る。効率的に探す手法を提案。サポートアカウント発見用のスコアも提案。#dbreading

2012-07-21 22:43:37
Yukino Baba @yukino

http://t.co/BIsph4ro 文書中のエンティティ表現の曖昧性解消をしたい。周辺文章と対象エンティティのWikipedia記事を比較するやり方→記事全体を見るとノイジー&範囲を絞ると情報不足。記事中でエンティティに言及してる箇所の判定手法を提案。#dbreading

2012-07-21 22:41:13
Yukino Baba @yukino

http://t.co/TnWI6L2p あるエンティティ集合に言及する文章を特定したいけど語義曖昧性が問題。「エンティティへのある言及が多くの正しい言及と似たコンテキストだったら、その言及は正しいだろう」としてPageRank風アルゴリズムを利用。#dbreading

2012-07-21 22:32:20
Yukino Baba @yukino

http://t.co/uThTyw8k Webユーザの行動はマルコフ連鎖でモデル可能か?複数ページ間の遷移行動&1ページ内での行動(EyeTracking等)で検証。k階マルコフ過程を構築して尤度を評価。特に1ページ内の場合マルコフ連鎖ではモデル化不可能。#dbreading

2012-07-21 22:07:23
Yukino Baba @yukino

http://t.co/1Q3MwqvP LDAにおける変分ベイズ法によるパラメータ推定をMapReduceの形式にして並列化。Mahoutでの実装と比較して、処理速度・事後分布の近似精度が改善。#dbreading

2012-07-21 18:27:45
Yukino Baba @yukino

http://t.co/IZ22Lvki グラフ更新時にBetweenness centrality (BC)を効率的に計算したい。グラフ更新によって変更があったMinimum Union Cycle内のノードはBC更新可能性があるのでそこだけ再計算。#dbreading

2012-07-21 18:12:51
Yukino Baba @yukino

http://t.co/182KP1e9 クラウドソーシングを使ってEntity Linkingを解決したい。ワーカーの信頼性を測るのにFactor Graphを利用。#dbreading

2012-07-21 18:06:13
Yukino Baba @yukino

http://t.co/1suhOwuF エッジの有無が部分的にしかわかっていないグラフからコミュニティを発見したい。エッジ情報既知の領域から、グラフ構造が類似しているノードペア集合を取得してノード間の距離関数を学習、距離にもとづいてクラスタリング。#dbreading

2012-07-21 18:05:32
Yukino Baba @yukino

http://t.co/GZ9gZTtE ソーシャルグラフから、ユーザの興味にもとづくコミュニティ発見。メッセージの中身、ソーシャルグラフ構造、Interaction typeを考慮したメッセージの生成モデルを構築。#dbreading

2012-07-21 17:57:23
chiemi @chiemi

r12-3 更新のあるグラフに対して媒介中心性を差分的に求める方法。変更のあったMinimum Union Cycle内のノードは更新可能性がある #dbreading

2012-07-21 17:57:17
Takanori Ueda / 上田 高徳 @t_u

ログインに携帯使うとか発想が新しすぎる #dbreading

2012-07-21 17:40:37
Yukino Baba @yukino

http://t.co/FNkAVfKA パスワードに偏りがあると簡単に推測されちゃう。パスワードの分布が一様になるようユーザのパスワード選択を誘導するスキーマを提案。#dbreading

2012-07-21 17:33:14
Yukino Baba @yukino

http://t.co/RpLwSPBV Webベースのコラボレーションツール(例Google Docs)は重要。でもシングル用のWebエディタをマルチユーザ用にするのは大変→変換アプローチを提案。JavaScriptで提供、Webエディタに簡単に統合できる。#dbreading

2012-07-21 17:14:09
chiemi @chiemi

r24-2 Twitterのフォローの理由を推定。言語的特性と行動特性から分析。密なコミュニケーションと、当たり障りのないコミュニケーションに綺麗に分かれた。 #dbreading

2012-07-21 17:01:25
Yukino Baba @yukino

http://t.co/ds2THR4u 仮説:社会的地位の低い人はついつい偉い人の口調をまねてしまう。Wikipedia上でのAdminと一般Editorのトークを分析して口調の模倣度合いを検証。Adminになる前は模倣するけどなったあとは模倣しない。#dbreading

2012-07-21 17:00:18
chiemi @chiemi

r24-1 社会的地位の低い人は上の人の口調をまねてしまう、という社会心理学上の仮説を、大規模データ分析で検証。接続詞や副詞等の意味のない言語特性に着目。模倣度合いの違いを確認した。おもろい #dbreading

2012-07-21 16:58:26
Yukino Baba @yukino

http://t.co/XYtuD9El クエリ→エンティティ判定→アクション列挙(「ライオンキング」クエリなら"read review", "buy ticket")。クエリ中のcontext word、クリック先ページの情報、エンティティタイプなどを利用。#dbreading

2012-07-21 16:55:44
Takanori Ueda / 上田 高徳 @t_u

今度からこういうネタスライドを入れるか。しかしSIGMODとかでは難しそうだ #dbreading

2012-07-21 16:55:05
chiemi @chiemi

r20-3 検索結果を返す時、結果に対するアクションを提示する。クエリログを使って適切なアクションを学習。結局クエリ意図の推定かとbyけやっきー #dbreading

2012-07-21 16:51:46
Yukino Baba @yukino

http://t.co/WNSqFtQR 検索結果閲覧時のカーソル・スクロール動作から文書がrelevantかどうか判定。既存は閲覧時間を利用→長時間ならrelevantとは限らない。relevantのときにどういう行動をするのかを定義。 #dbreading

2012-07-21 16:46:43
chiemi @chiemi

r20-2 ニュースの鮮度をクリック頻度から推測。クエリとクリック情報を教師なし学習。 #dbreading

2012-07-21 16:46:35
chiemi @chiemi

r20-1 ユーザの興味が閲覧文書に関連があるかどうかをマウスの動きで判定する。 #dbreading

2012-07-21 16:43:52
Yukino Baba @yukino

http://t.co/2uI0GdUe 検索ログを何かに使う際(「満足度評価」「検索興味予測」「クエリの提案」)、タスク単位に分類してから使う方がいいよという話。#dbreading

2012-07-21 16:25:38
Yukino Baba @yukino

http://t.co/Kz4XffbS クエリの裏にある構造(属性)を推定したい。「トヨタ カローラ」だったら「【メーカー】 【ブランド】」。クエリテンプレートにもとづくクエリの生成モデルを構築(テンプレート選択→語数決定→クエリ語を生成) #dbreading

2012-07-21 16:18:09
1 ・・ 4 次へ