WWW2012勉強会 (2ページ目)

chiemi @chiemi

r27-3 クエリの裏にある構造を推定。LDAを使う。#dbreading

2012-07-21 16:18:02

chiemi @chiemi

r27-1 2方向（Specialization, Movement）のクエリ推薦提示法。クエリログとクリックログからクエリとEntityの関連を求め、適切なカテゴリを求める。 #dbreading

2012-07-21 16:13:46

Yukino Baba @yukino

http://t.co/2S2jxoC6 検索エンジンで、二種類のクエリ推薦：Specialization（「京都」→「京都観光」）とParallel movement（「京都観光」→「大阪観光」）の提示方法（インターフェース）を提案。#dbreading

2012-07-21 16:11:23

Yukino Baba @yukino

http://t.co/ASOZOlFH 集合内から特定の評価基準が最大のアイテムを見つけるタスクをクラウドソーシングでやる（例．一番綺麗な写真を見つける）。１タスクで雇うワーカー数／比較させるアイテム数をパラメータ化して、パラメータ選択手法を提案。#dbreading

2012-07-21 15:50:47

Yukino Baba @yukino

http://t.co/u58khwPq 検索システムと人のインタラクションを統合するためのシステムを提案。クエリ例「サッカー選手10名の中で一番人気がある人」。#dbreading

2012-07-21 15:45:53

Yukino Baba @yukino

http://t.co/Avj9HUEb ユーザ定義のコンポーネントを組み込んで、自由にカスタマイズできるRich Internet Applicationを設計するためのフレームワークを構築。他のコンポーネントの支障がでないか・セキュリティを考慮。#dbreading

2012-07-21 15:40:15

Yukino Baba @yukino

http://t.co/ddArI3X7 同じ情報を提供するはずの複数情報源が、更新遅延やミスで異なる値を発信→どれを信じるか？本来の更新系列の推測、更新遅延・ミスの推測。Semi-Markovianでモデル化。#dbreading

2012-07-21 15:35:25

Yukino Baba @yukino

http://t.co/CaxlgOZS データのクリーニングをクラウドソーシングで。SQLベースの宣言的言語で記述・実行可能。回答の信頼度を、ワーカーの信頼度を考慮してPageRank的に見積もる。#dbreading

2012-07-21 15:31:14

chiemi @chiemi

r22-1 ベストペーパ。SPARQLでパスを列挙する演算はバッグ意味論に基づくので中間データ量が爆発する。グラフDBに使う存在意味論を使って中間データを削減。 #dbreading

2012-07-21 15:21:54

Yukino Baba @yukino

http://t.co/ApFJ2fq0 SNSでは情報の拡散が重要。似てるユーザを推薦するのではなく、情報拡散の促進を考慮したユーザ推薦。AさんにBさんを推薦すると、Bさんと繋がってるCさんDさんに情報が届く可能性が高まる、とか。#dbreading

2012-07-21 15:14:03

chiemi @chiemi

r18-2 (1)SNSで繋がってる人が同じ行動を取るのはSocial InfluenceなのかHomophilyか。(2)繋がりが強いほど同じページを見るのはどちらか→(1)Social Influence,(2)繋がりが強いほどHomophily #dbreading

2012-07-21 15:10:27

Takanori Ueda / 上田高徳 @t_u

こうやってみると WWW はデータ解析祭りだなぁ。Y研でもっと読むべき。 #dbreading

2012-07-21 15:06:53

Yukino Baba @yukino

http://t.co/D1LdH6la 人々のニュースに対する興味期間が昔より短くなってるんじゃないか？ニュース中の個人名に着目し、出現期間を計測して調べてみました（1920年〜）→むしろ長くなってる。#dbreading

2012-07-21 14:49:39

Yukino Baba @yukino

http://t.co/1rWa2uVb 現時点のニュースから未来のニュースを予測するというタスク。150年間のニュース記事を利用。ニュース中のObject, Actionを判別して、似ているObject同士を関連付けていく。人間より高精度で予測できたらしい。#dbreading

2012-07-21 14:46:27

chiemi @chiemi

r31-2 視聴者が興味を持つ期間に変化が起きているかを調査。結果その逆だったことが分かった #dbreading

2012-07-21 14:42:12

chiemi @chiemi

r31-1 情報の整理方法の一つであるMetro Mapを良いものにする。網羅性，Lineの接続数、一貫性，の順に重視して指標を定義。#dbreading

2012-07-21 14:38:03

Yukino Baba @yukino

http://t.co/WIEmZEZM 情報を見つけやすくするため、ニュースを路線図で表現（話題が路線に対応）。良質な路線図を作るために、路線図の一貫性（記事の類似性）・網羅性、路線の接続性に着目。#dbreading

2012-07-21 14:37:26

Yukino Baba @yukino

http://t.co/Ei7jKwXM スパムコメントを判定するのは人間でも結構難しい（ぱっと字面を見るだけじゃわからない）。ミクロ経済学でのシグナリング理論を利用。低いシグナリングコスト（発信における障壁）で利益大のコメントは、スパムの可能性が高い。#dbreading

2012-07-21 14:32:41

chiemi @chiemi

どちらもスパムっぽくないが… #dbreading

2012-07-21 14:27:56

Yukino Baba @yukino

http://t.co/53fgeRc2 スパムコメント判定。ある３人が「同じ商品に最高の評価、同時期に評価、他の商品に評価してない、登録直後の商品への評価」→グループスパム。個人じゃなくグループで判定することが大事。グループスパム判定用の特徴量を提案。#dbreading

2012-07-21 14:26:54

Yukino Baba @yukino

http://t.co/v1kEATya あるタスクを達成するためのチーム編成を最適化する手法の提案（必要スキルを持ったメンバーの調達、コミュニケーションの円滑化、負担の分散）。#dbreading

2012-07-21 14:06:33

Yukino Baba @yukino

http://t.co/PCobLKle 写真へのコメントを用いた画像検索リランキング。クエリとの関連度だけじゃなくてAestheticも考慮したい→コメントから綺麗な写真かどうか判断。コメントから色んな観点（光量とか構図とか）に対するpos/negを判定。#dbreading

2012-07-21 14:01:08

Yukino Baba @yukino

http://t.co/us7YWwpI コメントをランキングしたい。複数の尺度（コメントへの評価、新しさ、コメントの質）を集約。尺度は欠損している場合もある（コメントが短すぎて質が測れないとか）。Hodge Decompositionで統合ランキングを作成。#dbreading

2012-07-21 13:54:12

chiemi @chiemi

r1-2 推薦システム設計に制御理論アプローチを適用。推薦制度を維持するためのモデルの更新間隔を維持するためにフィードバック制御を使うらしい。 #dbreading

2012-07-21 13:40:58

chiemi @chiemi

r1-1 Yahoo!Music radio stationの楽曲推薦システムに協調フィルタリングを適用する。プレイリスト(station)を途中まで聞いたときに次に聞く曲の候補を推薦。station,時間,直近楽曲との親和性を考慮。 #dbreading

2012-07-21 13:37:27

いま話題のタグ