サーバーまいに解析が異なることを許容 時間が経つにつれ、モデル感の情報は共有されていく #Jubatus
2011-11-07 17:45:43うちのproxyかと思いました RT @nemoton 配信切れましたw #jubatus ( #pfiseminar live at http://t.co/8R3LE7AN)
2011-11-07 17:46:09緩やかなモデル情報の共有。対象が解析なので各サーバでデータの100%共有を保証しない。実用上問題ない程度に異なることを許容する。 数秒~数十秒でsyncすることを想定している #jubatus
2011-11-07 17:46:26緩やかなモデル情報の共有: わりきり。データ自体は共有しない。全サーバ間で同時刻に同じモデルが存在することは保証しない。サーバごとの解析が異なることを許容しているが、解析という性質上、実運用的には問題ないレベルで処理できる。 #jubatus
2011-11-07 17:46:51#jubatus 「各サーバの学習機などのモデル情報をリアルタイムに共有する」という制約を緩めることでリアルタイム・分散・機械学習の3つを兼ね備えることを実現している *YF*
2011-11-07 17:46:53機械学習について詳しくは知らないんだけど、学習データをどう継続的に入れていくか・修正すべきデータを発見するか、ってどうするか解法みたいなの見えてるのかな
2011-11-07 17:47:48どれくらいテキスト解析に特化しててどれくらい他の解析に使えるかに興味があるのよねん。「データ」って言われたときに何を想定するかって専門によって違うもんね。 #Jubatus
2011-11-07 17:48:01機械学習はデータがあればどこでも適用可能 ・データから有用な規則、ルール、知識表現、判断基準などを抽出 ・様々な問題に利用可能 タスク固有の問題と手法の分類 ・一度標準的フォーマットに変換すれば百を超える手法を利用可能 ・特徴抽出と手法の分類 #Jubatus
2011-11-07 17:48:28今までは手でせっせとデータ整形してたけど、一度標準的なフォーマットに変換すれば、百を超える分析手法を適用可能、そうJubatusならね #Jubatus
2011-11-07 17:48:29データから有用な規則、ルール、知識表現、判断基準を抽出して、さまざまな手法/理論を適用するのをスピーディーにまわせる。 #jubatus
2011-11-07 17:48:48とのことでーす。 RT @JubatusOfficial ちょっとUstream配信にトラブルが起きているようです。すみません #jubatus
2011-11-07 17:49:00お、行動履歴(イベント系列?)とかセンサーデータも出てきた。これらの特徴抽出もサポートしてるってことかな。@unnonouno先生の発表に期待。 #Jubatus
2011-11-07 17:49:17機械学習という点ではMahout使うのとどう違うんだろう? RT @AntiBayes 今までは手でせっせとデータ整形してたけど、一度標準的なフォーマットに変換すれば、百を超える分析手法を適用可能、そうJubatusならね #Jubatus
2011-11-07 17:51:15・レコメンド 近傍検索:クエリデータと似た登録データを返す 属性保管:データ中の無い属性を保管する リコメンドに必要な情報を抽出し、データ自体は共有せずに全データをリコメンドできるようにする。あくまでモデル情報の共有 #Jubatus
2011-11-07 17:51:20・マイニング、統計 統計分析、max, min, arg, stddev, モーメント, エントロピーなど… #Jubatus
2011-11-07 17:52:12教師有学習 (入力x から出力y へのマッピングを学習する) や、レコメンド (近傍探索、属性補完)、マイニング、統計などに適用できるよう検討中。 #jubatus
2011-11-07 17:52:21