Spark Summit 2014 まとめ

ほぼ @yumano さんのツイートまとめ状態。ツイート追加する場合 @yamakatu まで。
6
前へ 1 ・・ 19 20 22 次へ
yumano @yumano

既存の計算結果(バッチの結果)をストリームのデータと一緒に計算することが可能。

2014-07-03 03:30:57
yumano @yumano

耐障害性について、Workerが失敗したら、入力データを再現して、再計算する。一度しか実施されないように保証。

2014-07-03 03:33:45
yumano @yumano

ハイレベル概要、サンプル、ロードマップの順

2014-07-03 03:39:39
yumano @yumano

MLbaseはML パイプラインを最適化する目的。

2014-07-03 03:40:22
yumano @yumano

オプティマイザーについては昨日のセッションでもあったね。

2014-07-03 03:40:40
yumano @yumano

分散ディシジョンツリーについて pic.twitter.com/lLdFBIJn4P

2014-07-03 03:43:50
拡大
yumano @yumano

ユーザーガイド、コードサンプルを充実させた

2014-07-03 03:44:37
yumano @yumano

サンプルフォルダにデータもあるよ pic.twitter.com/3qIFsiUH5g

2014-07-03 03:45:27
拡大
yumano @yumano

sparseについての説明。ストレージをセーブ、速度向上。 pic.twitter.com/kGPK9eSrQ2

2014-07-03 03:47:11
拡大
yumano @yumano

まず、Kmeans、クラスターのセンターを見つけて、その後でクラスターのメンバーをアサインする

2014-07-03 03:48:14
yumano @yumano

色をつけて、今度はセンターをまた計算しなおす

2014-07-03 03:48:30
yumano @yumano

scalaのサンプルコード、pythonのサンプルコード pic.twitter.com/f4XpYYBPO5

2014-07-03 03:49:44
拡大
前へ 1 ・・ 19 20 22 次へ