R18-1 類似検索の候補レコード集合をクエリにあわせて分割する,らしい..レコード集合中のトークンからトークングラフを生成して利用. #dbreading
2012-06-02 15:55:46R18-4 時系列データの類似検索において,データ測定時のエラーを検出して訂正.エラーにはシステム上のエラーとランダムエラーがあり,後者の除去にfocus. #dbreading
2012-06-02 16:01:17R18-2 グラフの中から一つの両端にノードを持ったパスを抽出して,異なる性質を持ったデータの類似性が近くなる問題を解消 #dbreading
2012-06-02 16:04:57#dbreading 適用効果R、フィルタコストCを考慮したフィルタパイプラインの制御。R/Cのよいものをパイプラインに繋ぐもの(greedy)とか。
2012-06-02 16:10:30R19-*1 入力文字列が辞書に属する文字列かチェックするときにフィルタを通してから類似度計算をする。フィルタ適用コストと類似度計算コストを最小にするよう最適化。実験では全部フィルタかけるのが最善になっちゃったが順序が大事ぽい。 #dbreading
2012-06-02 16:12:09R19-*2 SLCAとELCA(LCA(子孫に全検索キーワードを含むノード)の最小のものと排他的なもの?)を高速に計算するための索引を定義。ELCAで引っ掛かってその先分からず。すみませんm(_ _)m #dbreading
2012-06-02 16:18:36R19-3 On Text Clustering with Side Information:ユーザのアクセスログ,リンク,引用,所有者,location等のサイド情報を用いたテキスト分類 #dbreading
2012-06-02 16:19:01発表直後の溜息で東京会場爆笑 RT @myui: #dbreading @keyakkie が一番笑いをとっている。
2012-06-02 16:21:58#dbreading 近似のassociation rule抽出。ハミング距離を考慮したprefixtree・・・そこらにありそうな。。。新規性?だった
2012-06-02 16:24:51#dbreading 石川先生が好きそうなwineデータセットを使った評価。すべての論文が実データと一般的なデータセットでしっかり評価するのが日本の研究論文との違いかな。よく最初っからどう評価する?でスタートするし。
2012-06-02 16:28:22R21-1 類似文字列を考慮した部分文字列の相関ルールマイニング。ハミング距離を考慮したPrefixTreeを作成。処理時間は指数オーダーなので改善可能。 #dbreading
2012-06-02 16:31:30