リアルタイム/ストリーム処理 解析結果はデータ投入後すぐに返せる、多クラス分類もすぐに出す。twitterの内容分析で6000QPSは出せる #jubatus
2011-11-07 17:40:42特徴1. リアルタイム/ストリーミング処理 解析結果はデータ投入後すぐ帰ってくる 他クラス分類になどの学習・分類も一瞬で処理 将来的にはデータを投入し、非同期で結果が返ってくるようにしたい #Jubatus
2011-11-07 17:41:00各ノードはそれぞれが情報を蓄積し、それらを共有して処理するので大変。"モデルの緩やかな共有" で解決らしい。 #jubatus
2011-11-07 17:42:11特徴2. 分散並列処理 スケールアウト:ノード追加で性能向上。処理量に応じてシステムのサイズを柔軟に変更可能。耐障害性も。 各ノードが独立処理するのは容易だが、情報を共有しながら処理するのは難しい #Jubatus
2011-11-07 17:42:26「難しいことはやっておきますから使ってください」は正直信用しきれなくて使われない的な話にならんのかな #jubatus
2011-11-07 17:43:35特徴3. 深い解析 単純な集計・統計処理だけでなく、自動分類を初めとした様々な機械学習手法をサポート 難しい事は全部やってくれる! 非定型データを扱える用にデータからの特徴抽出をサポート。多くのデータに対して特徴抽出のプラグイン化 #Jubatus
2011-11-07 17:43:50単純な集計、統計処理だけではなく、自動分類をはじめとした様々な機械学習をサポート。非定型データを扱えるように、データからの特徴抽出もサポート。特徴抽出の部分は今後プラグイン化してサポートを増やしていく予定。 #jubatus
2011-11-07 17:43:52深い解析 単純な集計、統計処理だけではなく、自動分類をはじめとした機械学習手法をサポート。難しいことはインプリしておく。 非定形データを扱えるようにデータからの特徴抽出もサポートする。多くの機械学習ライブラリには特徴抽出の機能がないのがハードル #jubatus
2011-11-07 17:44:00#jubatus 単なる集計や統計処理ではなく自動分類などの機械学習の手法をサポートしていくのが大きな差別化要素, 特徴抽出もユバタスが提供, プラグインで拡張できる. とのこと. お手軽。 *YF*
2011-11-07 17:44:08「否定形データを扱えるように、データからの特徴抽出をサポート→とにかくデータ突っ込めばとりあえず分析出来るようにする」 mongoDBとは一体何だったのか #Jubatus
2011-11-07 17:44:18緩やかなモデル情報の共有 先の三つの特徴を見たすために各サーバーのモデル情報を「緩やかに」共有 データ自体は共有しない。既存システムと違う割り切り #Jubatus
2011-11-07 17:45:21