Togetter/min.tを安心してお使い頂くためのガイドラインを公開しました。
2014年7月2日

Spark Summit 2014 まとめ

ほぼ @yumano さんのツイートまとめ状態。ツイート追加する場合 @yamakatu まで。
6
Kenichiro HAMANO @hamaken

Spark Summit、日本人がいっぱいいるなー #sparksummit

2014-07-01 01:04:51
Kenichiro HAMANO @hamaken

1回目も えらくたくさん人がいてビックリしたけど、今回も人が多い。というか、多すぎじゃないかい。受付が大混雑。 #sparksummit pic.twitter.com/gIYo6pUrDz

2014-07-01 01:08:24
拡大
Kenichiro HAMANO @hamaken

Spark Summit 2014、なにげに NTTデータ もスポンサーをやっています。  #sparksummit pic.twitter.com/zI1mbVPcWB

2014-07-01 01:11:22
拡大
yumano @yumano

今日はSparkSummit 140->1000+の参加者増。2013, 68 Contributor, 17 Company 63K codes 2014 June, 255 Cont, 50 com, 175k codes

2014-07-01 01:18:55
yumano @yumano

他のHadoop系OSSとの比較、KPI コードのコミット量、コントリビューターの増加。 pic.twitter.com/TdoHGL7d0B

2014-07-01 01:20:11
拡大
yumano @yumano

6ヶ月、LibsとEnterpriseにフォーカス。SparkSQL、MLlib、GraphX。セキュリティ、モニタ、HA。

2014-07-01 01:21:58
yumano @yumano

SparkSQL、HiveやJSONからの構造化データをロードして、SQLで検索可能

2014-07-01 01:23:20
yumano @yumano

インターフェースはScala、JAVA,Python。

2014-07-01 01:24:11
yumano @yumano

MLlib マシンラーニング、15+のアルゴリズムをサポート。

2014-07-01 01:25:43
yumano @yumano

40コントリビューター。

2014-07-01 01:25:54
yumano @yumano

最後、Java8API。個人的に興味なしw

2014-07-01 01:26:51
Kenichiro HAMANO @hamaken

.@matei_zaharia さんが、Sparkの最近の動向を紹介中 #sparksummit

2014-07-01 01:27:07
yumano @yumano

Sparkはビッグデータにおける標準ライブラリになろうとしている。ビッグデータアプリは作るのがややこしい。それをうまく解決したい。

2014-07-01 01:30:38
yumano @yumano

DataBricksは100%OSSでSparkにコミットするぜ!!でキーノートの第一セッション終了。

2014-07-01 01:31:52
yumano @yumano

データブリックスを何で作ったのか、コミュニティ、そして将来について。 SparkはすべてのメジャーなDistからサポートされている。

2014-07-01 01:33:35
yumano @yumano

パートナーCloudera、DataStax、MapR。追加でSAPのパートナー追加が発表。会場拍手。

2014-07-01 01:34:55
yumano @yumano

SAPのインメモリデータプラットフォームをよろしく!とCM。

2014-07-01 01:35:50
yumano @yumano

認定について。アプリ認定とディストリ認定 pic.twitter.com/kYlZ9zZsIg

2014-07-01 01:36:59
拡大
yumano @yumano

APIの標準化で認定アプリを認定ディストリで動くことが保証

2014-07-01 01:37:27
yumano @yumano

Sparkトレーニングも実施。2012年は400人くらい受講。でも、水曜日に300人も受講するんだぜ!

2014-07-01 01:38:34
yumano @yumano

ビッグデータチャレンジへの解決。データを分析、細かいところもすぐに見れる能力、こういう事ができるようになるとうれしい。

2014-07-01 01:42:14
yumano @yumano

BDで成功している会社は多い。Google,FB、AMZN、TWIT。でも彼らのところまで行くには金がかかる。どうすればよいのか?

2014-07-01 01:43:07
yumano @yumano

Hadoopクラスターを作る、データをいれる、そして、データの中身をみる。この3ステップがとても大変。

2014-07-01 01:44:29
yumano @yumano

データパイプラインについての解説。ETL、HDFS、ダッシュボード、分析。左から右に必要になっていくものが並んでいる。

2014-07-01 01:47:08
yumano @yumano

最後にリコメンドとか本当の製品がでてくる。 pic.twitter.com/iCeqt8BgIm

2014-07-01 01:47:51
拡大
残りを読む(519)

コメント

やまかつ @yamakatu 2014年7月3日
チュートリアル分追加しました
0