WWW2012勉強会
Yahoo! インターネットラジオでの楽曲推薦.stattion との親和性,時間帯,直近楽曲との親和性で推薦 #dbreading
2012-07-21 13:36:52r9-3 ハッシュタグの使われ方。 (1)ブックマークとして (2)コミュニティ間のやり取り用、に分けられる。 インフルエンサーが使うのがきっかけとか、そういうルールを適用すると、利用されそうなハッシュタグが推測できる(?) #dbreading
2012-07-21 12:11:29r9-1 Youtubeの閲覧の地域的局所性を調査。英語圏じゃない国(ブラジル、日本、イタリア)が局所性が高い。 Googleしかデータ調べられないから公開しろとの要求が会場で挙がってたらしい。#dbreading
2012-07-21 12:06:56http://t.co/MNy0znqo クローラがサーバに負荷をかけまくるのでクロールされる側は困る。クローラには静的ページだけ見せることで負荷を下げることを提案。できるだけ動的ページに近いのを見せて、ランキングには影響しないようにする。#dbreading
2012-07-21 12:02:15r6-3 クローラがWebサーバを圧迫するので、動的ページをクロールされると重いので、キャッシュした静的ページだけを クロールしてもらう。L1(memcached)とL2(gz圧縮して保存)を用意する。 #dbreading
2012-07-21 12:02:13r6-1 分散されたデータセンタでアップロードされたデータをreadする人の近くのセンタに 通信量が小さいときに送信することでピークを避ける。アップロードパターン(Twitterから収集),アクセスパターンのデータ(パケットトレースを用いて収集)を用いる #dbreading
2012-07-21 11:56:15@sn_f @t_u 画面はあてにならないので、資料をダウンロードしてくださいです。こちらにあります~ http://t.co/DSLBzlGf #dbreading
2012-07-21 11:52:44http://t.co/G9BP3eZ2 オンラインゲームでCheaterがどう広まるか。Cheaterの友人が時間経過によりCheaterになるか調査。Non-Cheaterの9割はCheaterの友達なし、3割のCheaterにはCheaterの友達あり。#dbreading
2012-07-21 11:43:44Malicious Relevance Score Propagation Algorithm (Mr.SPA),Criminal account Inference Algorithm (CIA)などなど #dbreading
2012-07-21 11:40:12Analyzing Spammer’s Social Networks for Fun and Profit.この論文内容は全然面白くないんだが,本文中で出てくる用語がいちいち面白い.#dbreading
2012-07-21 11:38:38http://t.co/78mRA26C 既存の画像認識だと認識したオブジェクト間の関係が考慮されない。認識したオブジェクト間の関係をオントロジーを利用して推定して画像の自動タギング・説明文生成、 image search by imageに利用。 #dbreading
2012-07-21 11:29:34Semantic Webセッション.論文見る限りでは,まだこんなことやってるのか… #dbreading
2012-07-21 11:18:53http://t.co/wwau22dK Twitterから地域依存のホットトピックを発見。 ユーザの地域分布、地域の潜在トピック分布、ユーザのトピック分布、地域の単語分布などを入れてモデル構築。#dbreading
2012-07-21 11:14:26http://t.co/GbWuog7T Wikipediaの記事から記事へ少クリックで到達するゲーム(http://t.co/G208NLBB)のログ解析して人の情報探索方法を調査。人が見つけた経路は最適解と近い。ハブ記事を探してから細かい探索をする傾向。#dbreading
2012-07-21 11:04:37www2012勉強会をustで見てる皆様。http://t.co/DSLBzlGf にある資料を見ながら見てくださいです。 #dbreading
2012-07-21 10:57:10http://t.co/UUtVd1IB Flickrのジオタグ付き写真を使って地球規模モニタリング(水があるとか雪があるとか)ができるか?課題は「写真があまり撮られない場所がある」「観測者のバイアス」「タグ/ジオタグのエラー」 #dbreading
2012-07-21 10:56:52http://t.co/We3FoKNP QAサイトで自動回答するボットを作りたい。過去の類似質問に対するベストアンサーを探して、妥当性検証。ボットだとばれないか、本当にベストアンサーがもらえるかどうかで評価。#dbreading
2012-07-21 10:52:47r25-1 Entity集合が言及されている文章を特定する。各Entityには曖昧性がある。 (1)集合の類似性を利用。(2)複数のEntityが登場。 (3)特定された文章に似てる文章(類似度をグラフにしてPagerank風モデルで求める) #dbreading
2012-07-21 10:38:06r21-3 人の探索の過程をゲームを用いて人間の取る戦略を検証する。 ハブとなりそうな記事を探し、目的と内容が近いものを探す。 #dbreading
2012-07-21 10:33:22r21-2 Webユーザの行動は本当にマルコフ連鎖でモデル可能か大規模データを用いて検証。ページ遷移ログとページ内でのマウス操作ログや視線追跡ログを分析。過去のk次の状態を反映させたほうがマルコフ連鎖(1次)より良い(が大きな違いでないのではby発表者)。#dbreading
2012-07-21 10:30:58