Yahoo! JAPANデータインフラ ワークショップ+懇親会 まとめ #yjdsw3

0
前へ 1 2 ・・ 5 次へ
ゆーぢゅ♨️ @dyuju_you

スケーラビリティ求めるためにhive導入は最初やらなかったのかな #yjdsw3

2015-11-24 19:22:08
Sotaro Kimura @kimutansk

#yjdsw3 Impalaはレイテンシは優れていたが、スケーラビリティに課題があり、Hive on Tezを導入

2015-11-24 19:22:26
Sho Shimauchi @shiumachi

Impala のスケーラビリティについては、こちらの記事を参照した上で是非他の方にもきっちり検証していただいて、白黒はっきりつけていただきたいものですね cloudera.co.jp/blog/how-impal… twitter.com/kimutansk/stat…

2015-11-24 20:12:44
Sho Shimauchi @shiumachi

@kimutansk うちの記事はスペックも書いてるしソースコードつきで再現可能にしてますよ

2015-11-24 20:17:04
Sotaro Kimura @kimutansk

#yjdsw3 Kafkaをパイプラインとして使うのはわかりましたが、「Kafkaに投入するデータフロー」はどうやって作っているんでしょうね。 Hortonworksと組んでるなら、DataFlowのプラットフォームも使っているんでしょうか。

2015-11-24 19:59:17
Sotaro Kimura @kimutansk

@shiumachi そうですね。多分使っているデータ構成やモデルやクエリ、アクセスするデータやハードなどで相当異なるはずなのですが、そのあたりを変動させて、その上で同条件で複数ケース試さないと結局のところはわからない・・・

2015-11-24 20:15:31
Sho Shimauchi @shiumachi

@oza_x86 @kimutansk 速い速くないの不毛な言い争いしたくないのでちゃんと同一環境で第三者に検証してほしいと切実に思いますね

2015-11-24 20:19:08
Sotaro Kimura @kimutansk

@oza_x86 @shiumachi そうですね。そのあたり、第3者がやってみないとどうしても正面からの戦いにならない。 ハード的な最適化は明らかにImpalaに軍配が上がるはずなので、どんな要素で今回の結果になったかは気になるところです。

2015-11-24 20:20:32
Sotaro Kimura @kimutansk

@shiumachi 再現はできますね。あとは使う側のニーズがそのモデルにあっているか、でしょうか。 Yahooさんでの環境ではそうなった、という一例でしかないですので、今日のは

2015-11-24 20:19:14
Hiroshi Toyama @toyama0919

Impalaは1時間2500クエリからノード数でスケールしなくなって、Hive on Tezを検証中 #yjdsw3

2015-11-24 19:22:28
Hiroshi Toyama @toyama0919

Hive on Tezはノード数で線形にスケール50ノードで1時間15000クエリが可能 #yjdsw3

2015-11-24 19:23:17
oza @oza_x86

クエリの同時実行数だと Hive on Tez は強い #yjdsw3

2015-11-24 19:23:40
Hiroshi Toyama @toyama0919

Impalaのレイテンシのイメージ1秒ってすごいな。どういうクエリなんだろうか #yjdsw3

2015-11-24 19:24:05
Ryosuke Iwanaga @riywo

またしても、Hive on Tez話を聞き逃すなど。。あと少しで着く。。

2015-11-24 19:24:53
ゆーぢゅ♨️ @dyuju_you

tez導入もhortonworksと組んだからかな #yjdsw3

2015-11-24 19:25:17
Hiroshi Toyama @toyama0919

現在、Hive on Tez + llapとPhoenixを検証中。 #yjdsw3

2015-11-24 19:25:38
SAM @smrmkt

Impala, Hive on Tez, llap, Phoenixのまとめ参考になる #yjdsw3

2015-11-24 19:26:20
ゆーぢゅ♨️ @dyuju_you

phoenixってhbase使ってたの知らなかった #yjdsw3

2015-11-24 19:26:48
oza @oza_x86

あとで Hive on Tez の感想を聞きに行きたい #yjdsw3

2015-11-24 19:29:26
ゆーぢゅ♨️ @dyuju_you

hortonworksが出してるスライドの内容を薄めてわかりやすく慕って感じだった #yjdsw3

2015-11-24 19:30:24
Tetsuya Morimoto @t2y

これまで yahoo japan はクローズドなソフトウェアを内製してきたが、google と対等するには厳しいという判断もあり oss を活用し始めたみたいなくだりらしい #yjdsw3

2015-11-24 19:31:55
ゆーぢゅ♨️ @dyuju_you

もう6000台にまで増えてたんだ・・ #yjdsw3

2015-11-24 19:32:05
前へ 1 2 ・・ 5 次へ