Hadoopソースコードリーディング第3回
-
tatsuya6502
- 4408
- 0
- 1
- 0
![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
講演者の皆様、会場用意から何まで楽天のボランティアの方々、色々とありがとうございました。勉強すること一杯ですが、楽しんでまた参加できました。体調の都合でビザを完食てきず、無念w #hadoopreading
2010-06-28 22:24:36![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
みなさん、二次会に向かわれたけれど、今日は帰らせていただくことにした。次は #hadoopmodeling でお会いしましょう(?) ^^)/~ #hadoopreading
2010-06-28 22:31:39![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
RT @shot6: Cassandraでは方法は2つ。新規にノードをたして、tokenフリーで追加してそちらに引っ越す。または残ったノード間でリバランスする必要がある。 #hadoopreading
2010-06-28 23:57:12![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
@okachimachiorz 今日は、そのくらい押さえておこうよ、と言われそうな ^^; 質問を二つほどさせていただいてすっきりしました。ありがとーでした。 #hadoopreading
2010-06-29 01:01:18![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
#hadoopreading、楽しそうでいいな~。bloom filterってこういう風に使われていたのか! RT @yutuki_r .@tatsuya6502 さんのpresentation資料の在処 http://bit.ly/cXyroF
2010-06-29 03:39:00![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading
2010-06-29 04:00:51![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading
2010-06-29 04:00:51![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
んー? 一夜明けても、ハッシュタグによる検索がうまくいってないような。まとめが作れない。 #hadoopreading
2010-06-29 06:38:31![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
@tatsuya6502 「Hadoopソースコードリーディング第3回 ハッシュタグまとめ」をトゥギャりました。 http://togetter.com/li/32307
2010-06-29 06:40:06![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
@kimtea どうもです! ここから、リンクさせて頂きました。 http://ow.ly/24pEE でもね、いま自分で検索してみてもそうなんですけで、検索から抜けてるつぶやきが結構あるみたいな気がします。
2010-06-29 06:44:40![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
昨日の #hadoopreading でもらった質問でいちばん気になるのは、 Map Reduce + HBase での、データのローカリティの扱いだよね。ここはちゃんと確認しておこう。
2010-06-29 08:05:07![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
Hadoop のJobTrackerは、レプリカがどのDataNodeにあるかをどうやって知るんだっけ? #hadoopreading にふさわしいネタだなあ。あと、Map Reduceからの HBase HFileの直接出力も、みな興味のありそうなところか。
2010-06-29 08:07:05![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
@okachimachiorz なるほど。では、そこになにか汎用的なインターフェイスを導入して、JobTrackerが Cassandra や HBase とお話しできるようにすればいいのかな。RT: NameNodeに問い合わせてます。 #hadoopreading
2010-06-29 09:06:21![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
@tatsuya6502 あぁ、それでいいはずです。うまく「会話」できれば、そのまま手を加えずにMRがHDFSと同じパフォーマンスで走るはずです。 #hadoopreading
2010-06-29 09:16:21![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
JobTrakcerにMapとRSのローカリティを制御させて、HBaseにRSとHDFS(HFile)のローカリティを制御させるのが正解かと。 @m_mouri @tatsuya6502 MR+HBaseのローカリティは、RSレベルとHFileレベル #hadoopreading
2010-06-29 09:30:37![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
KVSでMRする時のローカリティはずっと気になっていたのですっきりしました。やりすぎるとKVSでデータソースを抽象化する意味がなくなるのでバランスが大切なとこですね。RT @tatsuya6502 昨日の #hadoopreading でもらった質問でいちばん気になるのは...
2010-06-29 09:47:45![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading
2010-06-29 09:51:10![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading
2010-06-29 09:53:27![](https://tgfile.tg-static.com/static/web/img/placeholder.gif)
RT @hishidama: 早速まとめられている。素晴らしい。 RT @yutuki_r: #HBase と #Cassandra 比較、 @tatsuya6502 氏の資料を基に表にしてみた。 http://goo.gl/OWOK #hadoopreading
2010-06-29 10:01:43