ICDE2012勉強会メモ (5ページ目)

chiemi @chiemi

R21-3 Subsequence Matchingでオブジェクト名そのものだけでなく、その属性をキーにできる。属性値に割り振られた素数の積を利用する。なるほどね。 #dbreading

2012-06-02 16:31:50

myui @myui

#dbreading chinese remainder theoremをsequential matchに利用。中々賢い

2012-06-02 16:32:19

chiemi @chiemi

中国の剰余定理がこんなところに！ #dbreading

2012-06-02 16:33:01

biwapa @biwapa

RT @chiemi: R21-3 Subsequence Matchingでオブジェクト名そのものだけでなく、その属性をキーにできる。属性値に割り振られた素数の積を利用する。なるほどね。 #dbreading

2012-06-02 16:33:36

myui @myui

#dbreading 頻出パターンマイニングをclassificationに利用。カテゴリ、数値、系列ごとに重要パターンを抽出。expand-enlargeあたりが新規性らしい。

2012-06-02 16:37:49

myui @myui

#dbreading テキストマイニングの次元索引にちょっと工夫したbloom filterみたいのでフィルタリング。

2012-06-02 16:42:39

Toshiyuki AMAGASA @amagasa

大規模データに対応するため，インスタンス毎に独立に次元圧縮を行う: "Horizontal Reduction: Instance-Level Dim Reduction for Similarity Search in Large Doc DB" #dbreading

2012-06-02 16:42:46

biwapa @biwapa

R23-2 Adaptive Windows for Duplicate Detection：大量データの重複データ検出のため，データを可変のパーティションで分割して，重複検出の効率をあげる #dbreading

2012-06-02 16:46:43

myui @myui

#dbreading sort neighbor method。window計算する前にソートキーとつけて重複除去。シンプル。他にも適用できるかも。

2012-06-02 16:47:31

chiemi @chiemi

R23-1 テキストのベクトルデータに対してインスタンスベースの次元削減を提案。ベクトルの要素をある閾値を超えるかどうかでビットマップベクトルに変換。タイトな下限を提供。#dbreading

2012-06-02 16:52:24

chiemi @chiemi

R23-2 重複データ検出をするのにパーティションごとに比較(SNM)。SNMの窓サイズを可変にする。#dbreading

2012-06-02 16:52:33

chiemi @chiemi

R15-1 SQLクエリ進捗インジケータで予測精度が悪くなる条件の分析。従来はVolcanoイテレータを使うがGetNextコールに偏りがあるときうまくいかない。原因は結合の外部と内部で処理速度が違う。CPUとI/Oはoverlapする。などを見つけて対応。 #dbreading

2012-06-02 17:17:14

chiemi @chiemi

R15-2 問合せ処理プログラムの中でスキーマレベルで固定できる所を固定して処理時間を高速化した #dbreading

2012-06-02 17:23:27

欅惇志 (Atsushi KEYAKI) @keyakkie

@chiemi @myui ユーザのアクセス履歴だと，ユーザが閲覧したページ集合には傾向があるだろうと考えていて (SNS サイトばっか見てる人や，まとめサイトばかり見てる人，といった感じです)，あるユーザが見たページは同じクラスに入れようという考えです #dbreading

2012-06-02 17:24:51

chiemi @chiemi

クラスタノードの親子関係は領域は包含関係じゃなくてオーバラップなの？ #dbreading

2012-06-02 17:42:53

chiemi @chiemi

空間をどう分割するんだろ… #dbreading

2012-06-02 17:53:24

chiemi @chiemi

R20-1 高密度なデータに対する空間索引(FLAT)を提案。重複がないため効率が上がる？#dbreading

2012-06-02 17:54:01

chiemi @chiemi

R20-3 構造化データ(RDB)に対するクエリ推薦。膨大なクエリログを使わ(え）ない。Termとタプルの関係を表すTATグラフを作りTerm Similarityを計算。オンラインでは隠れマルコフモデルを使う #dbreading

2012-06-02 18:03:00

chiemi @chiemi

R20-4 パターンマッチ処理で使うオートマトンをリソースの変動に対応するように動的に変更。 #dbreading

2012-06-02 18:05:41

chiemi @chiemi

R22-2 センサから異常信号を識別するためにAtypicalイベントの多次元特徴を記述するモデルを提案。microクラスタ（異常イベントパターン）をマージしてmacroクラスタを構成。 #dbreading

2012-06-02 18:16:26

chiemi @chiemi

R22-1 SciDBにversioningを追加。追記のみのストレージ。クエリをカバーするチャンクをバージョンさかのぼって取ってくる。GITやSVNより性能が良い #dbreading

2012-06-02 18:17:29

欅惇志 (Atsushi KEYAKI) @keyakkie

関西会場における僕へのプレッシャーがすごいんです．次は名古屋に出向こうかな．．． RT 発表直後の溜息で東京会場爆笑 RT @myui: #dbreading @keyakkie が一番笑いをとっている。

2012-06-02 18:21:56

myui @myui

#dbreading k-core 2は単にエッジ数が2。triangle k-core 2は三角形が2つというだけでした。思いだした。p.19(b)論文の図がちょっと間違っている。

2012-06-02 18:45:13

myui @myui

#dbreading お疲れ様でした。打ち上げを一足先においとましました。久々に刺激になりました。

2012-06-02 20:55:42

Jun Sese @sesejun

大岡山駅降りて，なんか見知った顔があるなぁとおもったら，#dbreading 打ち上げ終わって帰るメンバーだった ^^;;;;

2012-06-02 22:28:35

いま話題のタグ