GedowFatherさんがImpalaを本番投入した件 (4ページ目)

外道父 | Noko @GedowFather

1ノードのCPU頼りの動作だとしたら、接続先の分散をきっちりしないとマズイね

2012-11-16 12:43:43

Sho Shimauchi @shiumachi

@GedowFather 投げた結果を集約するからですかね。こちらも手が空いたら調べてみます(今日は無理そうですが)

2012-11-16 12:44:27

外道父 | Noko @GedowFather

impaladのCPUしか見なかったから、hdfsもみないと・・・あぁ横で動いているyarnさんが邪魔くせぇ

2012-11-16 12:44:59

Sho Shimauchi @shiumachi

@GedowFather 中間データをメモリに持つのが特長の一つなので、Hive だと複数のジョブステージになり、かつ中間データが多くなりそうな処理だと顕著に差が出そうな気がしますね

2012-11-16 12:46:51

Sho Shimauchi @shiumachi

Trevni 対応するとさらに高速化するらしいからなー＞Impala

2012-11-16 12:48:42

Yukinori 'Bon' SUDA @sudabon

#impala の公開実験中継、もっと聞きたい（見たい）けど、セミナーに出ないといけない…orz

2012-11-16 12:49:08

外道父 | Noko @GedowFather

HiveのMapReduceの数よりは、ジョブの数が多いクエリをImpalaにした時に差が出るのかなーと予想

2012-11-16 12:49:37

Muddy Dixon @muddydixon

外道父さんのツイートから目が離せない・・・

2012-11-16 12:56:38

Tatsuo Kawasαki @kernel023

今回の環境でのフォーマット形式と圧縮にも興味ありますね RT @shiumachi: Trevni 対応するとさらに高速化するらしいからなー＞Impala

2012-11-16 12:58:08

外道父 | Noko @GedowFather

@shun0102 まずはTextFileでやってます。もちろんHiveもImpalaも同じデータを使ってます

2012-11-16 12:58:14

matsuou1 @matsuou1

refresh興味深い。

2012-11-16 13:02:06

外道父 | Noko @GedowFather

refreshコマンドを打たないと、Hiveメタデータを更新しても反映されないのは基本として

2012-11-16 13:02:37

外道父 | Noko @GedowFather

impaladごと（SLAVEノードごと）にrefresh打たないといけなくて

2012-11-16 13:03:13

三上俊輔 @shun0102

@GedowFather なるほど、SeqenceFileの方がCountはメタデータだけ見てseekしていくみたいな最適化ができそうなので、実装による性能差が出そうと思って気になりました。

2012-11-16 13:05:09

外道父 | Noko @GedowFather

Hiveで3GBのデータ作ってimpalaでCOUNTし、その後データ追加して6GBにしてからimpalaでCOUNTしても同じ結果。refreshしてからだと正しいCOUNT結果になった

2012-11-16 13:05:18

外道父 | Noko @GedowFather

Hiveメタデータにディレクトリ内のファイルパスとかないよね・・・impaladさんが読み込んだファイルパス覚えちゃうの？

2012-11-16 13:05:52

Geforce RTX 3060Ti @showyou

え、slaveノードごとに打つ必要あるの・・

2012-11-16 13:06:17

外道父 | Noko @GedowFather

要はクライアント側はクエリ打つ前に必ずrefresh仕込むことになるな

2012-11-16 13:06:34

外道父 | Noko @GedowFather

今だと connect host-of-impalad:21000 の分散選択、lvsとかhaproxyかませることになるのかな…それともhdfs-site.xmlから引っこ抜いて自前でランダム選択するか…うーむ

2012-11-16 13:10:51

外道父 | Noko @GedowFather

ご飯の時間になりました　とかいうツイート初めてするわ

2012-11-16 13:11:52

tomo🐧@learning @cocoatomo

.@mazgi さんのコメント「ちゃんと着色しといた」にいいね！しました。 http://t.co/mid5wcUF

2012-11-16 13:15:16

Akihiro Okuno @choplin

impalaのchef recipe書いてみた > "chef recipe for impala — Gist" http://t.co/b6RDoqoe

2012-11-16 13:17:04

SKS rep @repeatedly

俺のいないところでImpalaの話が！

2012-11-16 13:46:29

SKS rep @repeatedly

本番環境ではあるけども，色々リソース管理が出来ない現状，やっぱり色々小さい所からという感じか．実際ガシガシ使っているところで共存した場合どうなるか知りたいですね… #impala

2012-11-16 13:52:21

SKS rep @repeatedly

Impala，単なる集計関数以外のソートとかジョインとか，実際の所どうなのか，外道さんが確かめてくれるに違いない…

2012-11-16 14:02:08

いま話題のタグ