「初めてのSpark」刊行記念 Spark Meetup 2015 #Sparkjp のまとめ
書籍『初めてのSpark』 oreilly.co.jp/books/97848731… には、原書の翻訳に NTTデータ 猿田さんや土橋さんによる「付録A 原書発行以降の変更点」「付録B Spark SQLについて本編の補足」なんかもあますよー #sparkjp
2015-09-09 19:07:24「Clouderaの皆様のおかげで」そのうちの半分以上は司会の @kernel023 の仕事です #sparkjp
2015-09-09 19:07:24玉川さん曰く「Advanced Analytics with Spark」の日本語版を年内に出すかも!とのこと #Sparkjp
2015-09-09 19:08:10猿田浩輔・土橋昌 他 NTTデータ執筆「Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク」翔泳社から発刊予定! shoeisha.co.jp/book/detail/97… amazon.co.jp/Apache-Spark%E… #Sparkjp
2015-09-09 19:09:19Amazonでもなかなか手に入らない「初めてのSpark」は後ろのオライリーブースで売ってるよ!しかも10%オフだよ! #sparkjp
2015-09-09 19:10:39Cloudera の Jairam のセッションです!彼の名前は「ジェイラム」と読みます。「ジャイ」じゃないよ! #sparkjp
2015-09-09 19:11:46Clouderaの考えるデータ処理は、Spark / Impala / Solr / MapReduce の4つの柱で成り立っている #sparkjp
2015-09-09 19:13:32ちゃんと MapReduce の shuffle が Spark の shuffle より最適化されているはなしに触れていて紳士だ…その辺りの弱点はこれから直していくとのこと #sparkjp
2015-09-09 19:14:31「唯一のマーケティングスライドを紹介させてね! Cloudera はこれだけ Spark 頑張ってるんだぜ!2014年にはCDH4.4でサポートを始め、Sparkトレーニングとか色々提供してるよ」 #sparkjp
2015-09-09 19:15:22Hive on Spark, Spark on HBase はまだベータ、 Pig on Spark はアルファ #sparkjp
2015-09-09 19:16:07Spakはもちろんだが、やはりSpark Streamingのユースケースもそれなりにありますね。日本でも興味を持っている人がじわじわ増えている印象。#spark #sparkjp
2015-09-09 19:18:28Sparkの活用事例。Clouderaでは250社の顧客がSpark使ってる。Core Spark はモンテカルロシミュレーションとかガンの検知とか、高度な機械学習の問題に使われてる。開発大変だけど、こういうユースケースではそれを乗り越えても使う価値がある #sparkjp
2015-09-09 19:18:34Apache Sparkのユースケース By Cloudera / 納得感はまぁまぁある #sparkjp pic.twitter.com/NRSUcZ5x6m
2015-09-09 19:19:03Spark Streaming によりナースのタブレットやスマートフォンにアラートを飛ばして問題を即座に現場の人に通知する #sparkjp
2015-09-09 19:19:34「Sparkがもっと成熟するにつれて、シンプルなETLとかのユースケースにも使われてくと思う」 #sparkjp
2015-09-09 19:20:54