第2回HBase勉強会 #hbaseworkshop
これは広い意味でのデータベースを通信場に使うやり方。以前はSOAでプロセスベースのブローカーがは流行っていたけれど、今はデータベースが中心になってきている。Big Dataの影響だろう。
2011-06-17 20:22:16MRで索引付きファイルを使うのは良いアイデアだと思います。Last.fmの事例があります。 http://t.co/98MYCwo RT @masayh: MapReduceのフルスキャンだけが気にいらないのなら、インデックスを考えたらいいのでは。 #hbaseworkshop
2011-06-18 07:56:22この方法は検討してます。RT @tatsuya6502: MRで索引付きファイルを使うのは良いアイデアだと思います。Last.fmの事例があります。 http://lanyrd.com/2010/huguk7/sxbw… (cont) http://deck.ly/~2Zir3
2011-06-18 09:13:58@tatsuya6502 Hbaseの特性はソート済ってことなのでHfileでとってくるというのは、Hbaseメリットの使い方ですね。他のKVSとは違うので。 #hbaseworkshop
2011-06-18 09:26:51なるほど。頭出しできるソート済みデータってことですね。QT @okachimachiorz1: @tatsuya6502 Hbaseの特性はソート済ってことなのでHfileでとってくるというのは、Hbaseメリットの使い方ですね。他のKVSとは違う #hbaseworkshop
2011-06-18 09:43:58HBase と Hibari DB は共通点が多い(キー順にソート、強い一貫性など) 一方Hibariが異なる点は、Read性能重視、複数KVトランザクション(制限付き)、2ノードから安定運用、全キーがメモリ常駐なので大規模では対策がいること。MR補完用途にはどちらが適してる?
2011-06-18 10:37:43@tatsuya6502 MRtechみたいにHDFS互換レイヤー作って、透過的に扱えるようにしてください!
2011-06-18 10:41:49ちなみに Hibari DB のデータ配置戦略はキーのprefix(先頭から区切り文字まで)によるDHT。キーレンジは quorum master のシステムテーブルで管理するので、データノード追加時のリバランスも容易。
2011-06-18 10:46:01.@satoruf ひょっとしてMapR? SequenceFileみたいにKVを保存するなら、シーケンシャル/ランダムアクセス共に、Hibariでけっこういけそうですね。検討します。QT: MRtechみたいにHDFS互換レイヤー作って、透過的に扱えるようにしてください!
2011-06-18 10:54:00@tatsuya6502 ああそうです、基幹業務向けなら千〜万台オーダーのスケーラビリティは多分必要無いので。
2011-06-18 10:57:32Hbase勉強会(第二回)に参加してきました - Taste of Tech Topic http://htn.to/mViqRb
2011-06-18 11:21:36ブログ書いた。 "MessagePack Hadoop Integration (HBase勉強会)" http://d.hatena.ne.jp/viver/20110618/p1 #hbaseworkshop
2011-06-18 18:43:56ブログ書きました。「HbaseとHadoopMR」 http://bit.ly/iHaPf6
2011-06-19 22:42:02