WWW2012勉強会
r27-1 2方向(Specialization, Movement)のクエリ推薦提示法。クエリログとクリックログからクエリとEntityの関連を求め、適切なカテゴリを求める。 #dbreading
2012-07-21 16:13:46http://t.co/2S2jxoC6 検索エンジンで、二種類のクエリ推薦:Specialization(「京都」→「京都 観光」)とParallel movement(「京都 観光」→「大阪 観光」)の提示方法(インターフェース)を提案。#dbreading
2012-07-21 16:11:23http://t.co/ASOZOlFH 集合内から特定の評価基準が最大のアイテムを見つけるタスクをクラウドソーシングでやる(例.一番綺麗な写真を見つける)。1タスクで雇うワーカー数/比較させるアイテム数をパラメータ化して、パラメータ選択手法を提案。#dbreading
2012-07-21 15:50:47http://t.co/u58khwPq 検索システムと人のインタラクションを統合するためのシステムを提案。クエリ例「サッカー選手10名の中で一番人気がある人」。#dbreading
2012-07-21 15:45:53http://t.co/Avj9HUEb ユーザ定義のコンポーネントを組み込んで、自由にカスタマイズできるRich Internet Applicationを設計するためのフレームワークを構築。他のコンポーネントの支障がでないか・セキュリティを考慮。#dbreading
2012-07-21 15:40:15http://t.co/ddArI3X7 同じ情報を提供するはずの複数情報源が、更新遅延やミスで異なる値を発信→どれを信じるか? 本来の更新系列の推測、更新遅延・ミスの推測。Semi-Markovianでモデル化。#dbreading
2012-07-21 15:35:25http://t.co/CaxlgOZS データのクリーニングをクラウドソーシングで。SQLベースの宣言的言語で記述・実行可能。 回答の信頼度を、ワーカーの信頼度を考慮してPageRank的に見積もる。#dbreading
2012-07-21 15:31:14r22-1 ベストペーパ。SPARQLでパスを列挙する演算はバッグ意味論に基づくので中間データ量が爆発する。グラフDBに使う存在意味論を使って 中間データを削減。 #dbreading
2012-07-21 15:21:54http://t.co/ApFJ2fq0 SNSでは情報の拡散が重要。似てるユーザを推薦するのではなく、情報拡散の促進を考慮したユーザ推薦。AさんにBさんを推薦すると、Bさんと繋がってるCさんDさんに情報が届く可能性が高まる、とか。#dbreading
2012-07-21 15:14:03r18-2 (1)SNSで繋がってる人が同じ行動を取るのはSocial InfluenceなのかHomophilyか。(2)繋がりが強いほど同じページを見るのはどちらか→(1)Social Influence,(2)繋がりが強いほどHomophily #dbreading
2012-07-21 15:10:27http://t.co/D1LdH6la 人々のニュースに対する興味期間が昔より短くなってるんじゃないか?ニュース中の個人名に着目し、出現期間を計測して調べてみました(1920年〜)→むしろ長くなってる。#dbreading
2012-07-21 14:49:39http://t.co/1rWa2uVb 現時点のニュースから未来のニュースを予測するというタスク。150年間のニュース記事を利用。ニュース中のObject, Actionを判別して、似ているObject同士を関連付けていく。人間より高精度で予測できたらしい。#dbreading
2012-07-21 14:46:27r31-1 情報の整理方法の一つであるMetro Mapを良いものにする。 網羅性,Lineの接続数、一貫性,の順に重視して指標を定義。#dbreading
2012-07-21 14:38:03http://t.co/WIEmZEZM 情報を見つけやすくするため、ニュースを路線図で表現(話題が路線に対応)。良質な路線図を作るために、路線図の一貫性(記事の類似性)・網羅性、路線の接続性に着目。#dbreading
2012-07-21 14:37:26http://t.co/Ei7jKwXM スパムコメントを判定するのは人間でも結構難しい(ぱっと字面を見るだけじゃわからない)。ミクロ経済学でのシグナリング理論を利用。低いシグナリングコスト(発信における障壁)で利益大のコメントは、スパムの可能性が高い。#dbreading
2012-07-21 14:32:41http://t.co/53fgeRc2 スパムコメント判定。ある3人が「同じ商品に最高の評価、同時期に評価、他の商品に評価してない、登録直後の商品への評価」→グループスパム。個人じゃなくグループで判定することが大事。グループスパム判定用の特徴量を提案。#dbreading
2012-07-21 14:26:54http://t.co/v1kEATya あるタスクを達成するためのチーム編成を最適化する手法の提案(必要スキルを持ったメンバーの調達、コミュニケーションの円滑化、負担の分散)。#dbreading
2012-07-21 14:06:33http://t.co/PCobLKle 写真へのコメントを用いた画像検索リランキング。クエリとの関連度だけじゃなくてAestheticも考慮したい→コメントから綺麗な写真かどうか判断。コメントから色んな観点(光量とか構図とか)に対するpos/negを判定。#dbreading
2012-07-21 14:01:08http://t.co/us7YWwpI コメントをランキングしたい。複数の尺度(コメントへの評価、新しさ、コメントの質)を集約。尺度は欠損している場合もある(コメントが短すぎて質が測れないとか)。Hodge Decompositionで統合ランキングを作成。#dbreading
2012-07-21 13:54:12r1-2 推薦システム設計に制御理論アプローチを適用。推薦制度を維持するためのモデルの更新間隔を維持するためにフィードバック制御を使うらしい。 #dbreading
2012-07-21 13:40:58r1-1 Yahoo!Music radio stationの楽曲推薦システムに協調フィルタリングを適用する。 プレイリスト(station)を途中まで聞いたときに次に聞く曲の候補を推薦。station,時間,直近楽曲との親和性を考慮。 #dbreading
2012-07-21 13:37:27