@nagix さん分かりやすい説明をありがとうございました。次は @okachimachiorz1 さんです。 #hadoopfukuoka
2012-04-19 18:43:02分散技術はたくさんあるが、I/Oを分散させてスピードを上げることに特化したのが Hadoop。 #hadoopfukuoka
2012-04-19 18:45:25「HadoopやってるのはYahooで、Yahooということはfacebook、Hadoop追うならYahooが何やってるか見ておくのが必要」そうなのか
2012-04-19 18:46:44FileSystemと分散アーキテクチャはセット。Hadoop以外でもそれは同じ。 #hadoopfukuoka
2012-04-19 18:48:18オープン系のレガシー・マイグレーションでは基幹バッチは早くならない。Hadoopを使う。 #hadoopfukuoka
2012-04-19 18:51:38アンデルセンさんの原価計算はHadoopで動いている。毎日。好きなときに。20分で終わる。今までは4時間。週2回が限界。 #hadoopfukuoka
2012-04-19 18:53:20基幹系バッチはクラウドに向いている。データをおきっぱなしにする必要が無い。クラウドに何かあれば、使わなければ良い。 #hadoopfukuoka
2012-04-19 18:56:07深さ優先から幅優先への考え方のシフトが不可欠。詳しくは小像本に載ってます(^^) #hadoopfukuoka
2012-04-19 18:56:59Hadoop MapReduce デザインパターン #hadoopfukuoka http://t.co/PJeZW7fp
2012-04-19 18:58:37AWSを使う時は、S3以外はあてにならないことを前提に設計する。設定ファイルをS3においてEC2はどのリージョンでも起動できるようにする。結果的にDRの出来上がり。 #hadoopfukuoka
2012-04-19 18:58:41通常のBOMをフラットBOMに変換してキーを置き換えてパラレル処理できるようにした。 #hadoopfukuoka
2012-04-19 18:59:57バッチが早くなるだけではない。出来ることが増える。完成品だけでなく中間品も原価計算できる。他社に出来ていないことが出来る。ITが企業価値を高める。しかも低コストで。 #hadoopfukuoka
2012-04-19 19:01:48中間品の計算をすることで、利益率が格段にあがる。ITで差別化できる!しかもそれほどコストかかってない。 #hadoopfukuoka
2012-04-19 19:02:38ハードが壊れることがある。壊れたハードがNameNodeであることもある。Hadoopクラスタを2系統準備していたので問題にならなかった。 #hadoopfukuoka
2012-04-19 19:05:18