第2回HBase勉強会 #hbaseworkshop

http://www.zusaar.com/event/agZ6dXNhYXJyDQsSBUV2ZW50GOX6AQw 基本的には作りの話中心でいきましょうか。 各自ネタをもちよる感じでお願いします。 続きを読む
14
前へ 1 2 ・・ 10 次へ
豊月 @yutuki_r

自宅HBaseクラスタの紹介。次いでデータモデルの紹介。GoogleのBigTableを参考にしている。 #hbaseworkshop

2011-06-16 19:08:20
豊月 @yutuki_r

HBaseのデータモデルは多重Mapっぽい。物理ファイルはColumnFamily毎に分かれて保存されている。これが複数集まってリージョンを作る。リージョンはローキーでSortされている。ある一定サイズになると分割されて増える #hbaseworkshop

2011-06-16 19:10:14
Sadayuki Furuhashi @frsyuki

バージョンの数は固定だから、Mapというか配列という感じなのかな。 Map<ColumnFamilyName, Map<KeyName, Value[]>> #hbaseworkshop

2011-06-16 19:10:44
豊月 @yutuki_r

ACID特性。同一RowをモツデータであればATOMICに操作する事が出来る。複数キーにまたがった場合は保証出来ない #hbaseworkshop

2011-06-16 19:11:07
豊月 @yutuki_r

もしHBaseで本気でトランザクションやるなら分散ロックを組む。或いはZooKeeperでロックを取る事も出来るけど、基本的にやるな。ユースケースでやってもいいんじゃね #hbaseworkshop

2011-06-16 19:11:55
MATSUO a.k.a マッツォ @understeer

複数のRowに対するロックは取れない。ZooKeeper使って分散トランザクションてのもあるけど、、、というお話。#hbaseworkshop

2011-06-16 19:12:03
豊月 @yutuki_r

Columnfamilyをめちゃくちゃ作ったらどうなるかの議論。 #hbaseworkshop

2011-06-16 19:13:50
MATSUO a.k.a マッツォ @understeer

カラムファミリーの上限は?その時の挙動は?というお話。#hbaseworkshop

2011-06-16 19:13:57
MATSUO a.k.a マッツォ @understeer

カラムファミリーはあまり多くするな、という結論。#hbaseworkshop

2011-06-16 19:14:41
stky16 @stky16

カラムファミリがリージョンをまたぐことはあるか? ⇨やるな。MUGENコンパクション にな(?) #hbaseworkshop

2011-06-16 19:14:50
豊月 @yutuki_r

CFがでかすぎて、リージョンファイルの分割上限こえたらどうなるのか。無限compactionが働いてしまう(((( ;゚Д゚)))ガタガタガタブルブル・・・。という事は1データはリージョンファイルサイズの上限を超えたら駄目? #hbaseworkshop

2011-06-16 19:14:57
豊月 @yutuki_r

HBaseのマスタノードは複数立てることは出来る。ZKクラスタが落ちたらどうなるの? #hbaseworkshop

2011-06-16 19:16:17
MATSUO a.k.a マッツォ @understeer

Q. ZooKeeperクラスタが壊れたら、全部落ちるのか、どういう挙動をとるのか? #hbaseworkshop

2011-06-16 19:16:40
豊月 @yutuki_r

HBaseの操作。Clientは最初にZKに繋いでRootサーバの場所を知る #hbaseworkshop

2011-06-16 19:17:13
MATSUO a.k.a マッツォ @understeer

ZooKeeperが死んでいるとそもそも接続できない。無限にリトライするとのこと。#hbaseworkshop

2011-06-16 19:17:33
豊月 @yutuki_r

ちげぇマスターノードの場所をしる RT @yutuki_r: HBaseの操作。Clientは最初にZKに繋いでRootサーバの場所を知る #hbaseworkshop #hbaseworkshop

2011-06-16 19:18:00
MATSUO a.k.a マッツォ @understeer

クライアントはZooKeeperにRootリージョンを問い合せて、そこからリージョンサーバに接続する。メタデータはクライアントがキャッシュする。#hbaseworkshop

2011-06-16 19:18:25
豊月 @yutuki_r

一度問い合わせたマスタサーバの位置等の情報はクライアントがcacheする。クライアントがぷっとするとcommitLogつくってメモリにデータ保存。いっぱいになるとHDDに保存 #hbaseworkshop

2011-06-16 19:18:46
MATSUO a.k.a マッツォ @understeer

更新はWAL+メモリフラッシュな追記型。#hbaseworkshop

2011-06-16 19:19:10
豊月 @yutuki_r

Hadoopアペンド扱っていた問題は、このCommitLogをHDFSに保存する処理周りの問題。 #hbaseworkshop

2011-06-16 19:19:23
的場辰徳 @matobat

ハッシュタグ付ける設定されてないのか #hbaseworkshop (live at http://ustre.am/yVeJ)

2011-06-16 19:20:01
前へ 1 2 ・・ 10 次へ