データ構造(wide, tall, fat)によるデータストアの分類

データ構造(wide, tall, fat)によるデータストアの分類
4
【ヽ´ん`】 @dev_momen

NoSQLの争いは、実際のデータ構造についてwide, tall, fatどれに需要があるのかにかかってくる。(´・ω・`)

2010-04-25 21:58:12
Shinpei Ohtani @shot6

@nsharp_2ch kwsk. wide、tall、fatの意味が知りたいです。tallが一番わからんです

2010-04-25 21:59:58
【ヽ´ん`】 @dev_momen

wide : 1行ごとの列数が多い状態。脱正規化してることが前提。

2010-04-25 22:00:50
【ヽ´ん`】 @dev_momen

tall : 列数が少なく、行数が多い状態。KVSの典型。

2010-04-25 22:01:24
Shinpei Ohtani @shot6

なるほどねえ。wideは非正規化データ全般、tallはKVSに特化したシンプルなデータ、fatはHadoopに処理させたいような巨大データってことかな。現実解っぽいのはwide > tall > fatじゃないかなあ

2010-04-25 22:03:52
【ヽ´ん`】 @dev_momen

fat : key-value構造で、valueのサイズが大きい状態。MBクラスが前提。

2010-04-25 22:04:31
Shinpei Ohtani @shot6

wideはRDBMSをみて、tallは最初からKVSみて、fatはBLOBとかのバイナリデータなどの大きいデータ、ってことかな。

2010-04-25 22:07:10
【ヽ´ん`】 @dev_momen

@shot6 あらま。こちらの感覚はtall > fat > wideだったりします。時間が経てばはっきりすることですが・・・。(´・ω・`)

2010-04-25 22:08:08
Shinpei Ohtani @shot6

@nsharp_2ch あら。最初からKVSが使える状況かどうかってとこですねー。fatが実はあんま思いつかないのですが、どういう状況下で有効と考えますか?

2010-04-25 22:11:42
Sadayuki Furuhashi @frsyuki

オンラインな業務アプリケーションはwideか。hBaseは若干お呼びでないし、とりあえず代えがなくて困った現状。Oracleで回すか。ログ解析系はtall。Hadoopがぴったりで嬉しい。fatはRDBMSに入れるのはツライとはいえ、アイシロンは高いしなぁ。。。みたいな印象。

2010-04-25 22:13:53
【ヽ´ん`】 @dev_momen

@shot6 fatはやはりHDFS上のデータを想定してます。レイテンシ重視にはあまり向かないですね。(´・ω・`)

2010-04-25 22:16:14
Shinpei Ohtani @shot6

@frsyuki ほぼ同様の想定で、wide/tall/fatですね。wideまわりなら、書き込みはACIDにOracle側でそこからキューを介してwideなデータ構造に展開、かなあと。

2010-04-25 22:17:30
【ヽ´ん`】 @dev_momen

@frsyuki この分類法は実はHBaseコミュから知りますた。(´・ω・`)

2010-04-25 22:17:44
Shinpei Ohtani @shot6

@nsharp_2ch ですよね。HDFSというかDFS主体で考える点は同意です。結構使いどころむずかしー気がしますです。

2010-04-25 22:18:39
Sadayuki Furuhashi @frsyuki

この分類でいくと、ROMAやkumofsはwideに当たるのかな。若干ずれている気もする。shortが欲しくなるか。楽天ARIAはfat狙い。HBase/BigTableは完全にtall。Cassandraはwideかtallか微妙な線? 儲かるのはtallかfatか…

2010-04-25 22:19:08
Shinpei Ohtani @shot6

HBaseはtall(かな?)、Cassandraはwideですね。ちなみにVoldeomrtはtall。あれ、kumofsってtallじゃないんですか?

2010-04-25 22:22:51
【ヽ´ん`】 @dev_momen

@shot6 HBaseは原理主義的にはwideで使いたいのですが、パフォーマンス上tallに強いのが現実だったりします。(´・ω・`)

2010-04-25 22:27:16
Sadayuki Furuhashi @frsyuki

@shot6 BigTable が tall の分類だとすれば、kumofs は tall ではない…と思います。列指向DBではないので。少数の列を大量の行に渡って高速に取り出すのは得意ではないです。Voldemort も同じだと思いますが。

2010-04-25 22:27:52
Shinpei Ohtani @shot6

@nsharp_2ch 列指向はwideではないってことでしょうか?

2010-04-25 22:30:07
【ヽ´ん`】 @dev_momen

@shot6 本来はwideです。が、実装が原理に追いついてるかという問題ですね・・・。(´・ω・`)

2010-04-25 22:32:00
Shinpei Ohtani @shot6

@frsyuki そうですね。列指向がtallという事ならば、kumofsはwideですね。Voldemortも同じです。

2010-04-25 22:32:18
Shinpei Ohtani @shot6

.@nsharp_2ch 元ネタが知りたいです・・・ 

2010-04-25 22:35:07
Sadayuki Furuhashi @frsyuki

あーそうか。物理的なデータ構造が得意とする使い方と、実際の使い方が、完全にマッチするとは限らないか。

2010-04-25 22:35:08