第一回 Jubatus Workshop #jubatus

だらだらと追加してます。 編集自由
9
前へ 1 2 3 ・・ 19 次へ
nishio hirokazu @nishio

#jubatus Twitterの内容を多クラス分類するのが6000QPSで走るらしい! *YF*

2011-11-07 17:40:14
Kato Kiwamu @kiwamuk

twitter の内容を分析して分類するのは 6000 QPS #jubatus

2011-11-07 17:40:34
Toshi Hikita @hikita

リアルタイム/ストリーム処理 解析結果はデータ投入後すぐに返せる、多クラス分類もすぐに出す。twitterの内容分析で6000QPSは出せる #jubatus

2011-11-07 17:40:42
チーフ データサイエンティスト@トレジャ @doryokujin

特徴1. リアルタイム/ストリーミング処理 解析結果はデータ投入後すぐ帰ってくる 他クラス分類になどの学習・分類も一瞬で処理 将来的にはデータを投入し、非同期で結果が返ってくるようにしたい #Jubatus

2011-11-07 17:41:00
ところてん @tokoroten

#jubatus はジェットストリームアタック

2011-11-07 17:41:19
tagomoris @tagomoris

入口迷ってちょっと遅れたけど着いてる #jubatus

2011-11-07 17:41:59
Kato Kiwamu @kiwamuk

各ノードはそれぞれが情報を蓄積し、それらを共有して処理するので大変。"モデルの緩やかな共有" で解決らしい。 #jubatus

2011-11-07 17:42:11
チーフ データサイエンティスト@トレジャ @doryokujin

特徴2. 分散並列処理 スケールアウト:ノード追加で性能向上。処理量に応じてシステムのサイズを柔軟に変更可能。耐障害性も。 各ノードが独立処理するのは容易だが、情報を共有しながら処理するのは難しい #Jubatus

2011-11-07 17:42:26
まーちゃん @madarax

ストリームで検索して上位にあったとw RT @tokoroten #jubatus はジェットストリームアタック

2011-11-07 17:42:54
tomo🐧@learning @cocoatomo

#jubatus 機械学習の部分をラップして提供するのが付加価値.

2011-11-07 17:43:08
tagomoris @tagomoris

「難しいことはやっておきますから使ってください」は正直信用しきれなくて使われない的な話にならんのかな #jubatus

2011-11-07 17:43:35
nyaxt @nyaxt

学習手法はライブラリ化しておく #jubatus

2011-11-07 17:43:43
紀 信邦(Nob Kino) @Nikoriks

Ust聞こえやすくなりましたよ,と書いた瞬間に止まった. #jubatus

2011-11-07 17:43:47
チーフ データサイエンティスト@トレジャ @doryokujin

特徴3. 深い解析 単純な集計・統計処理だけでなく、自動分類を初めとした様々な機械学習手法をサポート 難しい事は全部やってくれる! 非定型データを扱える用にデータからの特徴抽出をサポート。多くのデータに対して特徴抽出のプラグイン化 #Jubatus

2011-11-07 17:43:50
Kato Kiwamu @kiwamuk

単純な集計、統計処理だけではなく、自動分類をはじめとした様々な機械学習をサポート。非定型データを扱えるように、データからの特徴抽出もサポート。特徴抽出の部分は今後プラグイン化してサポートを増やしていく予定。 #jubatus

2011-11-07 17:43:52
Toshi Hikita @hikita

深い解析 単純な集計、統計処理だけではなく、自動分類をはじめとした機械学習手法をサポート。難しいことはインプリしておく。 非定形データを扱えるようにデータからの特徴抽出もサポートする。多くの機械学習ライブラリには特徴抽出の機能がないのがハードル #jubatus

2011-11-07 17:44:00
nishio hirokazu @nishio

#jubatus 単なる集計や統計処理ではなく自動分類などの機械学習の手法をサポートしていくのが大きな差別化要素, 特徴抽出もユバタスが提供, プラグインで拡張できる. とのこと. お手軽。 *YF*

2011-11-07 17:44:08
@AntiBayes

「否定形データを扱えるように、データからの特徴抽出をサポート→とにかくデータ突っ込めばとりあえず分析出来るようにする」 mongoDBとは一体何だったのか #Jubatus

2011-11-07 17:44:18
ところてん @tokoroten

データ共有は犠牲になったのだ #jubatus

2011-11-07 17:45:01
@AntiBayes

同期、非同期を超えたゆるふわ同期システム #Jubatus

2011-11-07 17:45:19
チーフ データサイエンティスト@トレジャ @doryokujin

緩やかなモデル情報の共有 先の三つの特徴を見たすために各サーバーのモデル情報を「緩やかに」共有 データ自体は共有しない。既存システムと違う割り切り #Jubatus

2011-11-07 17:45:21
前へ 1 2 3 ・・ 19 次へ