第1回 Jubatus Workshop

第1回 Jubatus Workshop
1
前へ 1 ・・ 3 4 ・・ 25 次へ
mskt @mskt4440

Ust、音割れが激しいです… #Jubatus

2011-11-07 17:37:15
チーフ データサイエンティスト@トレジャ @doryokujin

既存のシステムでは三つの目標を同時に達成することが困難 1. リアルタイム性の確保 2. データの水平分散処理 3. 高度な解析 #Jubatus

2011-11-07 17:37:47
チーフ データサイエンティスト@トレジャ @doryokujin

Haddopは素晴らしい。だがそれと異なる方向で大規模データ解析ができないか #Jubatus

2011-11-07 17:38:29
tomo🐧@learning @cocoatomo

#jubatus 問題意識. リアルタイム性, 水平分散性

2011-11-07 17:38:33
NISHIO Hirokazu @nishio

#jubatus MapReduceは処理の自由度は高いが基本的にバッチであり解析結果はすぐには帰ってこない, CEPなどオンライン/ストリーム処理は単純な処理しかサポートしてないものが多い, Hadoopとは異なる方向性を模索しようとしたのがユバタス *YF*

2011-11-07 17:38:49
すがわら @buzztaiki

RT @doryokujin: 世の中ではまだデータの蓄積から把握、理解に向かった段階である #Jubatus

2011-11-07 17:38:53
Hideyuki Tanaka @tanakh

音量下げてみました。大丈夫でしょうか #jubatus

2011-11-07 17:38:55
Kato Kiwamu @kiwamuk

MapReduce、基本的にバッチ処理で解析結果はすぐかえってこない、オーバーヘッドもでかい。CEP、多くは単純な処理しかできない。そこで #jubatus ...、Hadoop とは異なる方向で大規模データ解析を目指す。

2011-11-07 17:39:11
Toshi Hikita @hikita

RT @nishio: #jubatus MapReduceは処理の自由度は高いが基本的にバッチであり解析結果はすぐには帰ってこない, CEPなどオンライン/ストリーム処理は単純な処理しかサポートしてないものが多い, Hadoopとは異なる方向性を模索しようとしたのがユバタス *YF*

2011-11-07 17:39:18
Kato Kiwamu @kiwamuk

#Jubatus の特徴: リアルタイムストリーム、分散並列、深い解析

2011-11-07 17:39:43
チーフ データサイエンティスト@トレジャ @doryokujin

Jubatusは NTT PF研とPFIによる共同解開発 10.27よりOSS公開 #Jubatus

2011-11-07 17:39:47
NISHIO Hirokazu @nishio

#jubatus Twitterの内容を多クラス分類するのが6000QPSで走るらしい! *YF*

2011-11-07 17:40:14
Kato Kiwamu @kiwamuk

twitter の内容を分析して分類するのは 6000 QPS #jubatus

2011-11-07 17:40:34
Toshi Hikita @hikita

リアルタイム/ストリーム処理 解析結果はデータ投入後すぐに返せる、多クラス分類もすぐに出す。twitterの内容分析で6000QPSは出せる #jubatus

2011-11-07 17:40:42
チーフ データサイエンティスト@トレジャ @doryokujin

特徴1. リアルタイム/ストリーミング処理 解析結果はデータ投入後すぐ帰ってくる 他クラス分類になどの学習・分類も一瞬で処理 将来的にはデータを投入し、非同期で結果が返ってくるようにしたい #Jubatus

2011-11-07 17:41:00
ところてん @tokoroten

#jubatus はジェットストリームアタック

2011-11-07 17:41:19
しょこす @shokos

jubatus配信している PFI Show - preferred http://t.co/YEDuyGUi

2011-11-07 17:41:51
tagomoris @tagomoris

入口迷ってちょっと遅れたけど着いてる #jubatus

2011-11-07 17:41:59
Kato Kiwamu @kiwamuk

各ノードはそれぞれが情報を蓄積し、それらを共有して処理するので大変。"モデルの緩やかな共有" で解決らしい。 #jubatus

2011-11-07 17:42:11
チーフ データサイエンティスト@トレジャ @doryokujin

特徴2. 分散並列処理 スケールアウト:ノード追加で性能向上。処理量に応じてシステムのサイズを柔軟に変更可能。耐障害性も。 各ノードが独立処理するのは容易だが、情報を共有しながら処理するのは難しい #Jubatus

2011-11-07 17:42:26
まーちゃん @madarax

ストリームで検索して上位にあったとw RT @tokoroten #jubatus はジェットストリームアタック

2011-11-07 17:42:54
前へ 1 ・・ 3 4 ・・ 25 次へ