しましまのRecSys2013まとめ

しましまのRecSys2013の参加・聴講記録 http://recsys.acm.org/recsys13/
3
前へ 1 ・・ 4 5
Torben Brodt @torbenbrodt

Moving from batch (hourly update) to real time tencent increased performance about 37% #recsys2013 - goodbye #hadoop http://t.co/aJ64XZujoA

2013-10-16 10:14:32
拡大
しましま @shima__shima

QQのTencentのNick Li.ダミー年齢や性別を入れていても友人の年齢からダミーであることが予測できたりする.推薦モデルの更新間隔1h→15mとCTRは22%,15m→RTで15%向上した.

2013-10-16 10:14:46
しましま @shima__shima

IBMのIdo Guy.ソーシャルメディアと推薦システムは相互に影響.ex. 友人推薦,タグ推薦,FBのwallみたいな活動ストリーム個人化

2013-10-16 10:26:55
しましま @shima__shima

通信関係のHuaweiのWen Yuan Dai.予測モデルごとに,学習,予測,特徴量の構成などのコストが異なり,状況にあわせて選択.App Store の予測時間に余裕があるので推薦にディープNN使っているとか

2013-10-16 10:31:44
しましま @shima__shima

小売りのアリババのTaobaoのQuan Yuan.アイテム型の近隣法で類似アイテムを推薦するとCTRはいいがコンバージョンは悪い.利用者の類似性に基づくターゲティングで,シードの20倍ぐらいの利用者はシードと同等のCTR,100倍でも70%.

2013-10-16 10:45:07
しましま @shima__shima

基調講演3:Recommendation for Happiness.中国のデートサイトBaiHe http://t.co/qf2iCYJlZD のChief Happiness Officerなるすごい肩書きのYan, Muさん

2013-10-16 11:50:48
Hideaki Takeda @takechan2000

CHO … “@shima__shima: 基調講演3:Recommendation for Happiness.中国のデートサイトBaiHe http://t.co/zlILBt5c7G のChief Happiness Officerなるすごい肩書きのYan, Muさん”

2013-10-16 11:56:59
しましま @shima__shima

中国の150M(180Mのうち)の独身者はいずれかのオンラインサイトに登録.200K利用者,5.7Mメッセージについて分析した.最初に自分で書いた好みのプロファイルを満たさない人に最初にメッセージを送るのが50%もいる.女性の方が柔軟に対応.

2013-10-16 12:33:18
しましま @shima__shima

写真の数は全般的に少ない.女性の方が写真は多い.写真はよく修正されている.女性は写真の数が多いとメッセージを多くうけとるが,男性はそうではない.男性は若い女性が好き.女性は社会経済的な面を重視.

2013-10-16 12:33:27
しましま @shima__shima

利用者モデリング:デモグラ情報,自己紹介テキスト,心理テストによる36特徴.マッチングは集中しすぎたり,ぼっちにならない制約下で,好む確率を効用とした制約付き線形計画問題として定式化.

2013-10-16 12:33:37
しましま @shima__shima

.@takechan2000 データがいろいろ出てきましたが良く分析されていいましたが,この肩書きから車内がどういうノリなのかよく分からないです.

2013-10-16 12:36:56
ACM RecSys @ACMRecSys

Winners of the RecSys 2013 challenge, congrats! http://t.co/T9WScWhlvi

2013-10-16 13:03:30
拡大
しましま @shima__shima

RecSys Challenge:Yelpの評価を予測.レビューテキストの利用がポイント.優勝モデル中国の大学で,行列分解がベースで,店舗と利用者を評価値数の多少によって四つのブロックに分けてモデリングした.チェーン店とか週末とか細かい特徴量の工夫も.

2013-10-16 13:11:04
しましま @shima__shima

このデータ数でモデルを分けるというのは非常によいアイデアで,全部同じ方法で解いてるけど,少ないところはベイズ系,多い所は低バイアスモデルとか.しきい値で切ってるけど,洗剤変数を入れて連続的に一つのモデルにまとめたりできるのかも.

2013-10-16 13:13:29
Alan Said @alansaid

Running a challenge? Check out our tutorial on best practices in challenges from last year's #recsys http://t.co/FCxyV8V2bQ #recsys2013

2013-10-16 13:14:15
しましま @shima__shima

ベストペーパー A Fast Parallel SGD for Matrix Factorization in Shared Memory SystemsSGDで行列分解をするが,HOGWILD とかだとスレッド待ちとか,キャッシュミスが起きる.

2013-10-16 17:40:30
Torben Brodt @torbenbrodt

LIBMF: A Matrix-factorization Library for Recommender Systems http://t.co/Zn3oVbVnGt #recsys2013

2013-10-16 17:42:27
Aapo Kyrola @kyrpov

My #recsys2013 talk: DrunkardMob: Billions of Random Walks on Just a PC on @slideshare http://t.co/dcXwrpHsB2

2013-10-16 18:13:33
しましま @shima__shima

そこで,より細かくブロックに分解して,列や行がぶつからないブロックで,まだ更新されていないものをランダムに選んでスレッド待ちを回避.ランダムだけど,同じメモリ上にのっているブロックからランダムに選ぶことでキャッシュを効率的に.

2013-10-16 17:42:37
しましま @shima__shima

DrunkardMob: Billions of Random Walks on Just a PC は GraphChi上でランダムウォーク.各ウォークを管理する変わりに,ある時刻の全ウォークの位置を管理することで大規模化が可能になるとか

2013-10-16 18:15:52
しましま @shima__shima

RecSys2013の写真 https://t.co/B4ABTddCb4 私はWorkshops/Banquet/Posterセッションで写ってる.Workshopの写真 口がとがってる… Posterの写真が目つき悪い… 日本からの参加者も何人か写ってた

2013-11-22 18:30:45
しましま @shima__shima

Good bye Hong Kong. I enjoyed #recsys2013 conference. I thank organizers.

2013-10-17 12:02:18
前へ 1 ・・ 4 5