第2回HBase勉強会 #hbaseworkshop
自宅でUst視聴なう。 @ueshin さんの声が聞こえるw #hbaseworkshop http://t.co/f6txrWI
2011-06-16 19:20:42フラッシュ時の追記でこけた時にデータが消えるなどの可能性があるのでHadoopの0.20.1のappendブランチを使う #hbaseworkshop
2011-06-16 19:23:20現状ではCDH3を使うのがいい。 #hbaseworkshop
2011-06-16 19:24:32メジャーコンパクションが走ると待つ。デフォルトは24時間ごとに勝手に走るが、任意に走らせることも可能。 #hbaseworkshop
2011-06-16 19:24:57ZooKeeperは応答が遅かったり切断されるので複数台にすべし。1台だと直ぐに落ちる。少なくとも3台。#hbaseworkshop
2011-06-16 19:25:39メジャーコンパクションは24時間に一回がデフォルトだが、走ってしまうとコントロールできないのでオフにしてcronで動かす #hbaseworkshop
2011-06-16 19:26:38ZooKeeper2台構成はやらないでください、とのこと。2台で1台が死ぬと落ちるようになっている。#hbaseworkshop
2011-06-16 19:26:39ZooKeeperノードの負荷が高いと切断されやすい。クラスタは奇数で作るべし。#hbaseworkshop
2011-06-16 19:27:05HBaseは不安定。多分ある程度の規模があれば安定するんじゃないか?HDFSとHBaseを同居させるか否か #hbaseworkshop
2011-06-16 19:29:15HBaseはまだ不安定。ある程度の規模が前提。HBaseクラスタ上でMRを動かすべきか否か。#hbaseworkshop
2011-06-16 19:29:19Asakusaとしては、HadoopMRの足りない部分をHBaseで補いたい。#hbaseworkshop
2011-06-16 19:30:42浅草ではMRで足りない部分を補う。MRはフルスキャン前提。MRの次は、フルじゃないけど時々フルというデータ。マスターとTXデータとか。マスタがメモリに乗ればいいけど、サイズ的にきつい事がある。あと繰り返し利用するデータも問題。 #hbaseworkshop
2011-06-16 19:31:38HBaseを業務系のオンライン・マスター管理として考えてみる。更新は同期じゃないといけない。Atomicじゃないといけない。#hbaseworkshop
2011-06-16 19:33:26