Spark Summit 2014 まとめ

ほぼ @yumano さんのツイートまとめ状態。ツイート追加する場合 @yamakatu まで。
6
前へ 1 2 ・・ 22 次へ
yumano @yumano

Databriksのビジョン。BigDataを簡単に

2014-07-01 01:48:49
yumano @yumano

どうやって問題を解決するか? pic.twitter.com/dgCdXppGlR

2014-07-01 01:49:31
拡大
yumano @yumano

Databriks Cloudの発表!おおぅぅ?!

2014-07-01 01:49:45
yumano @yumano

中間層はSparkとして、上位のWorkspaceではNotebooks(データの分析、コラボ、リアルタイム)、Dashboard(WYSIWYG)、JobLauncherを持つ

2014-07-01 01:53:38
yumano @yumano

さっきのややこしい図がシンプルになります。 pic.twitter.com/7J0BcfhLrP

2014-07-01 01:54:42
拡大
yumano @yumano

ダッシュボード系は専門ツールオススメ pic.twitter.com/sIkx4dsdCy

2014-07-01 01:55:45
拡大
yumano @yumano

プロダクトのデモ開始。できるだけ、シンプルに。複雑なものは使いにくいっしょ。

2014-07-01 01:57:04
yumano @yumano

オフラインで作ったライブラリをアップロードできる。

2014-07-01 01:58:04
yumano @yumano

ボタンひとつでぽっちとクラスタを追加。メモリも200GBでも1TBでもぽちっと追加

2014-07-01 01:58:35
yumano @yumano

Notebooksについて。SQL、Python、Scalaが可能。ピボットテーブルをぐ利繰りとデモしてる。

2014-07-01 02:01:15
yumano @yumano

次はDashboardについて。出来上がったクエリ結果を公開できる。コラボ機能もデモ、片方のブラウザで編集したら、反対側で見ている人も変更がかかる。

2014-07-01 02:05:07
yumano @yumano

さっきまでのデモはワールドカップの結果でぐりぐりしてたけど、今度はでかいデータで実施。3.4TBのツィートをロード。

2014-07-01 02:06:12
yumano @yumano

お、10秒程度でクエリの結果が返ってきた

2014-07-01 02:07:30
yumano @yumano

時間と言語によるツイートのかたよりグラフ。ら pic.twitter.com/ozM7QarGP9

2014-07-01 02:08:39
拡大
Atigeo @atigeo

Proud to be on the list of #Sparksummit sponsors MT @hamaken 、なにげに NTTデータ もスポンサーをやっています。pic.twitter.com/KK3fVKtZUa

2014-07-01 02:09:29
拡大
yumano @yumano

生データが表示www 写真撮らないでねwww

2014-07-01 02:10:28
yumano @yumano

ダッシュボードはクエリ結果なので、データフィードを受け取るとリアルタイムで更新される。

2014-07-01 02:13:53
Kenichiro HAMANO @hamaken

Databricks Cloud だそうで。。。Notebook機能にぐっとくる人がいそう。 #sparksummit pic.twitter.com/xCYZdjXxgR

2014-07-01 02:18:07
拡大
yumano @yumano

次はConceptベースによるMLデモ。用意したWikipediaのダンプをインポートした。さて、MLを実施。TFIDFモデルを作成、wikiデータでTrainを実施。実行中。たぶん1分弱くらいかかっているかな?

2014-07-01 02:18:26
yumano @yumano

さて、サッカーとFIFAの類似性、レスリングとFiFAの類似性を表示。正しく動いたね。

2014-07-01 02:20:01
yumano @yumano

次は、tweetに対して類似性を用いたフィルタを実施。

2014-07-01 02:22:17
前へ 1 2 ・・ 22 次へ