2015/02/19 デブサミ2015 【19-B-2】DMMのビッグデータ分析のご紹介 ~Sparkによるリアルタイムレコメンド~ #devsumiB

Developers Summit 2015 Growth! http://event.shoeisha.jp/devsumi/20150219/session/642/ <講演概要> DMMでは、SocialStreamをリアルタイムに分析し、注目度の高いワード、流行なワードを元にしたリアルタイムレコメンドシステムの研究を行っています。大規模なリアルタイム分析を実現するために、SparkStreaming、MLlib(機械学習)、GraphX(グラフ処理)による並列分散処理基盤の構築を行ってきました。さらに、形態素解析器やSolrを用いた自然言語処理を組み合わせることによる精度向上にも取り組んでいます。本講演では、これらシステムの構築の手順やサンプル等を用いて、わかりやすく説明します。 続きを読む
3
guyon @gu4

続いて、DMMのビックデータ分析のご紹介に着席。 #devsumiB

2015-02-19 11:02:18
猫提督ff/kei @nekoteitoku

19-B-2 DMMのビッグデータ分析のご紹介。sparkって知らないんだけどなんだろこれ? #devsumiB

2015-02-19 11:03:28
猫提督ff/kei @nekoteitoku

Apache Sparkというのがあるのか #devsumiB

2015-02-19 11:04:52
たきぐち in the Cloud💙💛 @atakig

#devsumiB の会場、一番前の席だとモニタが大きすぎて見にくい :(

2015-02-19 11:07:25
Yuri Odagiri @ixixi

聞きたかったDMMさんのSparkでのリアルタイムレコメンドの話だ。 #devsumiB

2015-02-19 11:08:05
guyon @gu4

CTO室の話。新しい技術の検証や研究開発をしている。 #devsumiB

2015-02-19 11:08:17
猫提督ff/kei @nekoteitoku

艦娘ネタ。睦月さんのアイコンがチラッと出てて幸せ。 #devsumiB

2015-02-19 11:09:16
Yuri Odagiri @ixixi

艦娘の関係性をTwitterをデータソースにしてSpark streamingとgraphxで解析とな。 #devsumiB

2015-02-19 11:10:05
guyon @gu4

Sparkには機械学習を扱うMLibというものがある #devsumiB

2015-02-19 11:11:02
guyon @gu4

GraphXは並列グラフ処理の為のSparkAPI #devsumiB

2015-02-19 11:13:21
FUJII Yoshitaka @yoshiyoshifujii

ツイートごとの単語ベクトル。 #devsumib

2015-02-19 11:14:49
Jun Ohtani @johtani

形態素解析には何を使ってるんだろ?独自かな?#devsumiB

2015-02-19 11:14:56
馬美肉 @chiastolite

アイマス = アニメ && アイドル。なるほど #devsumiB

2015-02-19 11:16:20
Yuri Odagiri @ixixi

ソーシャルストリームを形態素解析して、商品検索(solr)して、トレンド抽出とクラスタリングして、レコメンドという流れ。ワードとジャンルをくっつけるのね。トレンドtoアイテムとのこと。 #devsumiB

2015-02-19 11:17:12
馬美肉 @chiastolite

数秒以内にレコメンドとかすごいな #devsumiB

2015-02-19 11:17:18
FUJII Yoshitaka @yoshiyoshifujii

トレンド to アイテム。 ツイートからレコメンドまでかー。それを数秒でやる。と。 #devsumib

2015-02-19 11:17:39
guyon @gu4

Scalaでコード書いている。 #devsumiB

2015-02-19 11:19:06
1 ・・ 4 次へ