Kudu Meetup Tokyo

Tatsuo Kawasαki @kernel023

ClouderaブースでHadoop10シールとKuduシールをゲットしよう！（数量限定） #hcj2016 pic.twitter.com/A8hXUCI0ui

2016-02-08 09:23:35

拡大

Tatsuo Kawasαki @kernel023

Kudu凄いな

2016-02-08 14:07:56

Tatsuo Kawasαki @kernel023

KuduはZookeeperやYARN、HDFSに依存しない

2016-02-08 14:10:56

Tatsuo Kawasαki @kernel023

Kuduの次のリリース (0.7) ではSparkデータソースが使えるようになる。今週リリースされるとか？ #hcj2016

2016-02-08 14:17:59

komamitsu @komamitsu_tw

@shiumachi 予習出来てないんで少し諦めてたんですが興味はあるので可能であれば行きたいです！

2016-02-09 00:13:04

Tatsuo Kawasαki @kernel023

Kuduの深い話に興味がある人はいるかな？

2016-02-09 08:15:47

marble @marblejenka

Kudu Meetupにあそびにきた

2016-02-09 18:55:07

marble @marblejenka

昨日の酔っ払い具合が話題になって辛い

2016-02-09 18:55:27

Tatsuo Kawasαki @kernel023

I joined Kudu meetup #apachekudu

2016-02-09 18:57:42

marble @marblejenka

Todd氏のSQLタイピングスピードが異常に速い

2016-02-09 18:58:01

Tatsuo Kawasαki @kernel023

@FKuro_ お気をつけて！７階です！

2016-02-09 18:59:54

tamagawa ryuji @tamagawa_ryuji

ご招待いただいて、 #apachekudu meetupに参加させていただいております。ありがとうございます＞クラウデラのみなさま

2016-02-09 19:06:35

marble @marblejenka

テーブル的データモデルを採用した理由は、SQL的なものとの相性が良いのと、柔軟性には欠けるけど性能とか扱いやすさの観点ではいけてるから

2016-02-09 19:12:26

Akihiro Okuno @choplin

Exactly #apachekudu

2016-02-09 19:15:08

marble @marblejenka

HBaseはスキャンに適した設計ではないので、アナリティクス的なワークロードには弱い。SQL on HBaseとか遅い。

2016-02-09 19:15:19

marble @marblejenka

HDFSだと、データの削除とか更新をするときに実質フルコピーが必要になるのが死ぬ

2016-02-09 19:16:04

marble @marblejenka

メタデータを小さくしてメモリに乗るようにしているのがいけてるっぽい

2016-02-09 19:22:07

marble @marblejenka

更新はleaderレプリカにいくっぽい。kafkaが似たような感じだった気がする。

2016-02-09 19:24:19

oza @oza_x86

#ApacheKudu Partition は Range と Hash が選択可能．

2016-02-09 19:26:48

Tatsuo Kawasαki @kernel023

RaftでのFault toleranceの説明。Transient failures, Permanent failures

2016-02-09 19:29:09

marble @marblejenka

レプリカ間でelectionをする都合で3レプリカあっても2個しぬとだめ

2016-02-09 19:29:33

oza @oza_x86

#ApacheKudu Hail みたいなの replication はアリなのかな．ソートキーを計算機ごと(複製ごと)にに分けておいて，別の種類のクエリを高速化できる．その代わり1台が落ちた際に cold -> hot になる時間が大きくなりそうだけど．

2016-02-09 19:30:00

oza @oza_x86

#ApacheKudu そういえば column store の materialization のタイミングとアルゴリズムはどうなってるんだろ

2016-02-09 19:32:39

Tatsuo Kawasαki @kernel023

Columnar storageはアナリティクスに向いている。必要な列だけ読み込めば良いのと効率良い圧縮が効く

2016-02-09 19:32:52

marble @marblejenka

HBaseはカラムナ的な圧縮ができないのでいけてない

2016-02-09 19:34:27

いま話題のタグ