これが今どきのデータ解析基盤だ!初心者のためのデータ解析講座 #yapcasia #yapcasiaD
データ分析基盤を支える技術 - YAPC::Asia Tokyo 2015
http://yapcasia.org/2015/talk/show/dd8ce20e-fad2-11e4-b6e7-8ab37d574c3a
Yuuta Hamada
@yut_h1979
Apache Tez って初めて聞いた。今の Hadoop が MapReduce か Tez かは要確認 #yapcasia #yapcasiaD
2015-08-22 13:37:55
sironekotoro💙💛
@sironekotoro
「どうしてもHadoopを自社で持ちたい、というひとは、やめろ!って言いたいんですが」 #yapcasia #yapcasiaD
2015-08-22 13:38:32
Yak!
@yak_ex
#yapcasia #yapcasiaD 基本 Hadoop Distributor のものを使っておけばいい。どうしても最新版が使いたいならコミュニティバージョンもあるけど茨の道。
2015-08-22 13:39:27
Yuuta Hamada
@yut_h1979
Hadoop の迷信: 「Hadoop には単一障害点がある」← 昔の話 「Hadoop はソースからビルドできない」← なにそれ? #yapcasia #yapcasiaD
2015-08-22 13:40:50
Yak!
@yak_ex
#yapcasia #yapcasiaD 変換して解析用に登録する前に生データに対してクエリをかけたい > MPP query engine:
2015-08-22 13:44:15
Sadayuki Furuhashi
@frsyuki
Prestoの何がいいって、色々なストレージからデータを取ってきて、SQLでJOINできるところ。そして速い。 #yapcasia #yapcasiaD
2015-08-22 13:49:35
sironekotoro💙💛
@sironekotoro
「世の中の解析基盤はApacheが支配している。Apacheからは逃げられません 。」 #yapcasia #yapcasiaD
2015-08-22 13:49:47
湯村 翼 Tsubasa YUMURA
@yumu19
「Norikraは分散しないのでデータが増えてくるとつらい!」 #yapcasia #yapcasiaD
2015-08-22 13:51:09