夏真っ盛り!Spark + Python + Data Science祭り まとめ #summerDS

2016/07/25 DMM.comラボ様にて開催したイベントのまとめです。 イベントページ: http://connpass.com/event/34680/
1
前へ 1 ・・ 3 4 次へ
しばたこ @uryyyyyyy

Sparkのチューニング。ボトルネックの特定。データの偏り解消。リソースの調整。詳しくは別資料(これかなslideshare.net/knagato/hive-o…#summerds

2016-07-25 20:02:48
tomomoto @tomomoto_LV3

Sparkのデータの偏りを防ぐことで、リソースをきちんと使いきれるようになる。データの偏りを生み出すのはロングテールの構造。 #summerDS

2016-07-25 20:04:05
しばたこ @uryyyyyyy

データの偏りの解消について。データはヘビーユーザー、人気商品でものすごく偏りが出る。データサイエンティスト入門で読んだやつだ #summerds

2016-07-25 20:04:49
Aki Ariga @chezou

データの偏りを改善したら3時間のjobが3分に… #summerDS

2016-07-25 20:05:21
Sho Shimauchi @shiumachi

データの偏り改善すると3時間かかった処理が3分になったのか。ヤバい #summerDS

2016-07-25 20:05:23
うさたーん @usaturn

データの偏りを解消すると劇的にパフォーマンスがあがる事がある #summerDS

2016-07-25 20:05:30
ucchi @naotaka1128

データの偏り(skewed data)の解消によりジョブの実行時間が数十倍になることも。データの偏りがボトルネックの場合はリソース増強は効果薄い。詳細はスライドシェアみてね、と。 #summerDS

2016-07-25 20:06:13
ucchi @naotaka1128

DMMは行動ログを考慮に入れたレコメンドしてない。今後の展望には入ってる。 これは意外だ。PV多すぎると使えないのかなぁ。 #summerDS

2016-07-25 20:07:46
soonraah @soonraah

データの偏りは何度か問題になった。これやっつける方法があるなら詳しく知りたい。 #summerDS

2016-07-25 20:08:59
𠮷田勇太 / ysdyt @yutatatatata

開催直前に繰り上がり当選してるのに今気づいた...すごく聞きたかったのに無念...|夏真っ盛り!Spark + Python + Data Science祭り connpass.com/event/34680/ #summerDS

2016-07-25 20:09:55
しばたこ @uryyyyyyy

「DataProcの特性、Jarのコピーが溜まっていって容量を喰う。」うわ、これは辛い。。。#summerds

2016-07-25 20:10:06
Sho Shimauchi @shiumachi

google dataproc に Spark ジョブ投げまくるとtmpがjarで溢れて死んで、クラスタ再構築するしかなくなるのか #summerDS

2016-07-25 20:10:51
しばたこ @uryyyyyyy

ユーザーと商品の直積を取ろうとすると計算量膨大でGCで詰む(固まる) #summerds

2016-07-25 20:12:01
しばたこ @uryyyyyyy

BigQueryからのデータのロードっていい感じにblock分けてくれないんですかね?辛そう。 #summerds

2016-07-25 20:12:47
soonraah @soonraah

アイテム数が小さければ、アイテムマトリクスを Map とかにして broadcast すると推薦が速くなったることがありますね。 #summerDS

2016-07-25 20:15:34
Sho Shimauchi @shiumachi

Julia使ってる人ーって聞いても @chezou しか手を挙げない #summerDS

2016-07-25 20:16:38
Sho Shimauchi @shiumachi

唐突に現れるポケモンGoのスクリーンショット #summerDS

2016-07-25 20:20:12
Sho Shimauchi @shiumachi

5分のLTなのにまだポケモンGoの話しかしてねえw #summerDS

2016-07-25 20:21:15
soonraah @soonraah

Spark を使った recommendation の需要高まってそうだな… #summerDS

2016-07-25 20:21:55
Sho Shimauchi @shiumachi

あれ、本編1時間半なのか。これから懇親会 #summerDS

2016-07-25 20:24:27
前へ 1 ・・ 3 4 次へ