HadoopSummit2010の各自のレビューのまとめですか

まーあとで多分見ること多いと思う。 shot6さんお疲れ様です
4
御徒町@Serializable @okachimachiorz

ちょw。いきなり魂の叫びが。(そしてそれがわかる人は何人いるのでせうか・・・)RT @shot6 Thriftもいらない。全然いらない。

2010-07-17 21:17:08
Shinpei Ohtani @shot6

BirdBrain、Twitterのダッシュボードっぽい。

2010-07-17 21:19:37
Shinpei Ohtani @shot6

.@okachimachiorz 今年後半くらいにそうなるかと思ったのですが、どうも想像以上にDryadの進みが遅いのですよね。会社の仕事的には両側面抑えるが妥当と思ってます。

2010-07-17 21:26:21
Shinpei Ohtani @shot6

今年当初くらいに思ってたのは、夏くらいにDryad登場→Hadoopに足りないところあるね→んじゃあ機能を足すか→DryadでもHadoop+αでも同等機能の提供。こういうシナリオ。

2010-07-17 21:28:01
Shinpei Ohtani @shot6

Karmashereは使ってみようかな。JSR305もサポートしてんのか・・・

2010-07-17 21:29:29
Shinpei Ohtani @shot6

開発時にはEMR使って、ステージングで自社内プライベートクラウド、本番は顧客DCみたいなことが可能なのはよさげ。

2010-07-17 21:30:36
Shinpei Ohtani @shot6

@kudoh_shigenori http://www.slideshare.net/ydn/3-hadoop-pigattwitterhadoopsummit2010 のp12, 13です。入力データはtweetなどのMySQLに格納されたデータですね。

2010-07-17 21:34:14
Shinpei Ohtani @shot6

Oozie。構成要素は2つ。workflow engine/coordinator engine。

2010-07-17 21:35:35
Shinpei Ohtani @shot6

インデックス構築を4日間から6時間に短縮。現状Oozieユーザは50、ワークフローアプリは約5000、最大ワークフローは2000アクション、平均18アクションくらい。アクションをPigで書く人多し。

2010-07-17 21:39:56
Shinpei Ohtani @shot6

様々な苦労が。現状ってOzzie2なのか。

2010-07-17 21:42:22
Shinpei Ohtani @shot6

Oozie2からタイムラインで分析機能が強化されたぽい。おーって感じ。

2010-07-17 21:46:03
Agile Cat @Agile_Cat

そこでね、、、Bing の MR が Hadoop なのか Dryad なのか、、、なのですよ。 後者なら、そう言うと思うのですが。 RT @okachimachiorz: このままおくとHadoopは間違いなくDryadに進みますよ・・・・そひて、OSSvsMS、再びみたいな。

2010-07-17 21:50:12
Shinpei Ohtani @shot6

Oozie2 + Pigがいけそうな感じ。

2010-07-17 21:50:44
Shinpei Ohtani @shot6

Hadoopサミット2010さっくりまとめを何人かで分担して、Hadoopソースリーディングのコンテンツにしてしまう、というのはどうか。

2010-07-17 22:01:32
Shinpei Ohtani @shot6

あれ?Oozie、パッケージ名がorg.apacheになってる。ということはApacheに寄贈すんのかな。

2010-07-17 23:10:52
Shinpei Ohtani @shot6

CascalogはClojureで書いたHadoopでのデータ処理のためのDSL。

2010-07-17 23:22:32