R21-3 Subsequence Matchingでオブジェクト名そのものだけでなく、その属性をキーにできる。属性値に割り振られた素数の積を利用する。なるほどね。 #dbreading
2012-06-02 16:31:50RT @chiemi: R21-3 Subsequence Matchingでオブジェクト名そのものだけでなく、その属性をキーにできる。属性値に割り振られた素数の積を利用する。なるほどね。 #dbreading
2012-06-02 16:33:36#dbreading 頻出パターンマイニングをclassificationに利用。カテゴリ、数値、系列ごとに重要パターンを抽出。expand-enlargeあたりが新規性らしい。
2012-06-02 16:37:49大規模データに対応するため,インスタンス毎に独立に次元圧縮を行う: "Horizontal Reduction: Instance-Level Dim Reduction for Similarity Search in Large Doc DB" #dbreading
2012-06-02 16:42:46R23-2 Adaptive Windows for Duplicate Detection:大量データの重複データ検出のため,データを可変のパーティションで分割して,重複検出の効率をあげる #dbreading
2012-06-02 16:46:43#dbreading sort neighbor method。window計算する前にソートキーとつけて重複除去。シンプル。他にも適用できるかも。
2012-06-02 16:47:31R23-1 テキストのベクトルデータに対してインスタンスベースの次元削減を提案。ベクトルの要素をある閾値を超えるかどうかでビットマップベクトルに変換。タイトな下限を提供。#dbreading
2012-06-02 16:52:24R15-1 SQLクエリ進捗インジケータで予測精度が悪くなる条件の分析。従来はVolcanoイテレータを使うがGetNextコールに偏りがあるときうまくいかない。原因は結合の外部と内部で処理速度が違う。CPUとI/Oはoverlapする。などを見つけて対応。 #dbreading
2012-06-02 17:17:14@chiemi @myui ユーザのアクセス履歴だと,ユーザが閲覧したページ集合には傾向があるだろうと考えていて (SNS サイトばっか見てる人や,まとめサイトばかり見てる人,といった感じです),あるユーザが見たページは同じクラスに入れようという考えです #dbreading
2012-06-02 17:24:51R20-3 構造化データ(RDB)に対するクエリ推薦。膨大なクエリログを使わ(え)ない。Termとタプルの関係を表すTATグラフを作りTerm Similarityを計算。 オンラインでは隠れマルコフモデルを使う #dbreading
2012-06-02 18:03:00R22-2 センサから異常信号を識別するためにAtypicalイベントの多次元特徴を記述するモデルを提案。microクラスタ(異常イベントパターン)をマージしてmacroクラスタを構成。 #dbreading
2012-06-02 18:16:26R22-1 SciDBにversioningを追加。追記のみのストレージ。クエリをカバーするチャンクをバージョンさかのぼって取ってくる。GITやSVNより性能が良い #dbreading
2012-06-02 18:17:29関西会場における僕へのプレッシャーがすごいんです.次は名古屋に出向こうかな... RT 発表直後の溜息で東京会場爆笑 RT @myui: #dbreading @keyakkie が一番笑いをとっている。
2012-06-02 18:21:56#dbreading k-core 2は単にエッジ数が2。triangle k-core 2は三角形が2つというだけでした。思いだした。p.19(b)論文の図がちょっと間違っている。
2012-06-02 18:45:13大岡山駅降りて,なんか見知った顔があるなぁとおもったら,#dbreading 打ち上げ終わって帰るメンバーだった ^^;;;;
2012-06-02 22:28:35