Spark Summit 2014 まとめ

Kenichiro HAMANO @hamaken

Spark Summit、日本人がいっぱいいるなー #sparksummit

2014-07-01 01:04:51

Kenichiro HAMANO @hamaken

1回目もえらくたくさん人がいてビックリしたけど、今回も人が多い。というか、多すぎじゃないかい。受付が大混雑。 #sparksummit pic.twitter.com/gIYo6pUrDz

2014-07-01 01:08:24

拡大

Kenichiro HAMANO @hamaken

Spark Summit 2014、なにげに NTTデータもスポンサーをやっています。　 #sparksummit pic.twitter.com/zI1mbVPcWB

2014-07-01 01:11:22

拡大

yumano @yumano

今日はSparkSummit　140->1000+の参加者増。2013, 68 Contributor, 17 Company 63K codes 2014 June, 255 Cont, 50 com, 175k codes

2014-07-01 01:18:55

yumano @yumano

他のHadoop系OSSとの比較、KPI コードのコミット量、コントリビューターの増加。 pic.twitter.com/TdoHGL7d0B

2014-07-01 01:20:11

拡大

yumano @yumano

6ヶ月、LibsとEnterpriseにフォーカス。SparkSQL、MLlib、GraphX。セキュリティ、モニタ、HA。

2014-07-01 01:21:58

yumano @yumano

SparkSQL、HiveやJSONからの構造化データをロードして、SQLで検索可能

2014-07-01 01:23:20

yumano @yumano

インターフェースはScala、JAVA,Python。

2014-07-01 01:24:11

yumano @yumano

MLlib マシンラーニング、15+のアルゴリズムをサポート。

2014-07-01 01:25:43

yumano @yumano

40コントリビューター。

2014-07-01 01:25:54

yumano @yumano

最後、Java8API。個人的に興味なしｗ

2014-07-01 01:26:51

Kenichiro HAMANO @hamaken

.@matei_zaharia さんが、Sparkの最近の動向を紹介中 #sparksummit

2014-07-01 01:27:07

yumano @yumano

Sparkはビッグデータにおける標準ライブラリになろうとしている。ビッグデータアプリは作るのがややこしい。それをうまく解決したい。

2014-07-01 01:30:38

yumano @yumano

DataBricksは100％OSSでSparkにコミットするぜ！！でキーノートの第一セッション終了。

2014-07-01 01:31:52

yumano @yumano

データブリックスを何で作ったのか、コミュニティ、そして将来について。 SparkはすべてのメジャーなDistからサポートされている。

2014-07-01 01:33:35

yumano @yumano

パートナーCloudera、DataStax、MapR。追加でSAPのパートナー追加が発表。会場拍手。

2014-07-01 01:34:55

yumano @yumano

SAPのインメモリデータプラットフォームをよろしく！とCM。

2014-07-01 01:35:50

yumano @yumano

認定について。アプリ認定とディストリ認定 pic.twitter.com/kYlZ9zZsIg

2014-07-01 01:36:59

拡大

yumano @yumano

APIの標準化で認定アプリを認定ディストリで動くことが保証

2014-07-01 01:37:27

yumano @yumano

Sparkトレーニングも実施。2012年は400人くらい受講。でも、水曜日に300人も受講するんだぜ！

2014-07-01 01:38:34

yumano @yumano

ビッグデータチャレンジへの解決。データを分析、細かいところもすぐに見れる能力、こういう事ができるようになるとうれしい。

2014-07-01 01:42:14

yumano @yumano

BDで成功している会社は多い。Google,FB、AMZN、TWIT。でも彼らのところまで行くには金がかかる。どうすればよいのか？

2014-07-01 01:43:07

yumano @yumano

Hadoopクラスターを作る、データをいれる、そして、データの中身をみる。この3ステップがとても大変。

2014-07-01 01:44:29

yumano @yumano

データパイプラインについての解説。ETL、HDFS、ダッシュボード、分析。左から右に必要になっていくものが並んでいる。

2014-07-01 01:47:08

yumano @yumano

最後にリコメンドとか本当の製品がでてくる。 pic.twitter.com/iCeqt8BgIm

2014-07-01 01:47:51

拡大

いま話題のタグ