Hadoopソースコードリーディング第3回 (2010/06/28 Mon) (15ページ目)

@nsiena

なんか、ひどく当たり障りのない結論になってきてしまった。だめなやつですね(←

2010-06-29 02:09:51

@ogochan

@nsiena 「超えられない壁」はないんだとゆーことですかね。であれば、どっちを選ぶかは、純粋に技術的な都合だけってことになるかなと思いますが。

2010-06-29 02:10:29

@hishidama

早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 04:00:51

@tomozou_13

RT @shot6: 故障への耐性は Cassandra > HBase #hadoopreading

2010-06-29 04:44:44

@tomozou_13

RT @Guutara: 遅刻したけど、いけてよかった。さぁ、戻って徹夜で仕事だ。 #hadoopreading

2010-06-29 04:45:10

@tatsuya6502

んー？一夜明けても、ハッシュタグによる検索がうまくいってないような。まとめが作れない。 #hadoopreading

2010-06-29 06:38:31

@tatsuya6502

昨日の #hadoopreading でもらった質問でいちばん気になるのは、 Map Reduce + HBase での、データのローカリティの扱いだよね。ここはちゃんと確認しておこう。

2010-06-29 08:05:07

@tatsuya6502

Hadoop のJobTrackerは、レプリカがどのDataNodeにあるかをどうやって知るんだっけ？ #hadoopreading にふさわしいネタだなあ。あと、Map Reduceからの HBase HFileの直接出力も、みな興味のありそうなところか。

2010-06-29 08:07:05

@okachimachiorz

@tatsuya6502 NameNodeに問い合わせてます。 #hadoopreading

2010-06-29 08:42:36

@tatsuya6502

@okachimachiorz なるほど。では、そこになにか汎用的なインターフェイスを導入して、JobTrackerが Cassandra や HBase とお話しできるようにすればいいのかな。RT: NameNodeに問い合わせてます。 #hadoopreading

2010-06-29 09:06:21

@okachimachiorz

@tatsuya6502 あぁ、それでいいはずです。うまく「会話」できれば、そのまま手を加えずにMRがHDFSと同じパフォーマンスで走るはずです。 #hadoopreading

2010-06-29 09:16:21

@enakai00

JobTrakcerにMapとRSのローカリティを制御させて、HBaseにRSとHDFS(HFile)のローカリティを制御させるのが正解かと。 @m_mouri @tatsuya6502 MR+HBaseのローカリティは、RSレベルとHFileレベル #hadoopreading

2010-06-29 09:30:37

@enakai00

KVSでMRする時のローカリティはずっと気になっていたのですっきりしました。やりすぎるとKVSでデータソースを抽象化する意味がなくなるのでバランスが大切なとこですね。RT @tatsuya6502 昨日の #hadoopreading でもらった質問でいちばん気になるのは...

2010-06-29 09:47:45

@matsukaz

RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 09:51:10

@shogookamoto

RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 09:53:27

@nasu_t

RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 10:01:43

@hasssie

RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 10:06:48

@tatsuya6502

Map Reduce + HBase のMapとRSのローカリティについて情報をくださったみなさん、ありがとうございました。HBaseのソースコードを読んだところ、この機能はすでに実装されていることがわかりました。 #hadoopreading

2010-06-29 10:08:45

@tatsuya6502

Map ReduceではInputSplitがローカリティ情報を保持していて、InputFormatが一連のsplitを作ります。 HBase ではTableInputFormatがこの役割を負ってます。 http://ow.ly/1qEE2s #hadoopreading

2010-06-29 10:11:08

@tatsuya6502

僕も知らなかったので、勉強になりました。 #hadoopreading

2010-06-29 10:14:56

@ueshin

RT @tatsuya6502: Map ReduceではInputSplitがローカリティ情報を保持していて、InputFormatが一連のsplitを作ります。 HBase ではTableInputFormatがこの役割を負ってます。 http://ow.ly/1qEE2s #hadoopreading

2010-06-29 10:18:30

@kkawamura

RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 10:19:44

@m_mouri

きれいな実装が入ってるんですね！ QT @tatsuya6502: MRではInputSplitがローカリティ情報を保持していて、InputFormatが一連のsplitを作ります。 HB http://ow.ly/1qEE2s #hadoopreading

2010-06-29 10:21:35

@shot6

RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 11:18:23

@asip2k25

RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading

2010-06-29 11:18:46

いま話題のタグ