「サッカーの試合を録画してて見たくないのに、電車のドアの上に結果を出されてしまう、見たくない情報が出ている空間に入れないようにしたい」 #sigdbs151
2010-11-12 16:24:45「K庁が出している気象統計データを正解として、Webセンサを使って得られた気候データとどれだけマッチしているのか検証する」 #sigdbs
2010-11-12 16:28:54パラレルセッションで、交錯するので、ハッシュタグだけでなくセッション番号とかを淹れていただけると嬉しいな。 #WebDBF2010 #DBS151
2010-11-12 16:38:54『(8) クラウド環境でのストリーミングアプリケーション向け動的資源配置手法』 : 「予稿ではシミュレーションのみ。発表では実環境データも含む。 1C-8 #dbs151
2010-11-12 16:53:57「バッファリングせずにストリームデータ解析を高速化するのが目標。ストリーム出力もしたい。入力に対する計算コストやデータサイズのばらつきにも対応したい。 1C-8 #dbs151
2010-11-12 16:54:04「想定パイプライン: 1.Read Data Stream→2.Read from Sketch→3.Stream Proc→4.Write to/update Sketch→5.Read from Sketch→6.Analyis→7.Output 1C-8 #dbs151
2010-11-12 16:54:38「単純にシーケンシャルに処理する場合と、並列化させた場合で、データ到着頻度とデータ処理頻度の時間比を変えて比較。提案手法では取りこぼしがないか大幅に改善。 1C-8 #dbs151
2010-11-12 16:54:48RT @nsiena: 『(8) クラウド環境でのストリーミングアプリケーション向け動的資源配置手法』 : 「予稿ではシミュレーションのみ。発表では実環境データも含む。 1C-8 #dbs151
2010-11-12 16:54:51『(9) CPUキャッシュを有効利用した並列時系列パターンマイニングアルゴリズムCache-conscious parallel PAIDの提案』 1C-9 #dbs151
2010-11-12 16:56:49「PAID アルゴリズムのキャッシュミスによる性能劣化。共通prefix に着目した提案手法1: common-prefix-at-a-time は複数の共通prefix をおまとめて処理し、時間局所性を改善。 1C-9 #dbs151
2010-11-12 17:08:44「Hadoop MapReduce と HDFS、Rock を用いて実験。マスタ x1, ワーカ x6。TestDFSIO で 10MB x 100ファイルをシーケンシャルに write し、それをシーケンシャルに read。 1C-10 #dbs151
2010-11-12 17:25:55「レプリカ数と RTT の増減に伴う R/W 性能の変化は理論的に予想される通り。/ Hadoop はラック内外を考慮して動作している。今回の実験では、レプリカ配置ポリシーと競合して遠隔ノードにデータが集中し、Rが改善、Wが劣化してしまった。 1C-10 #dbs151
2010-11-12 17:27:32「遠隔ノードとしてラック内のノードを指定してみた。W が平均的に改善、R は劣化。様々なノード数とレプリカ数について分散のさせ方を検討する必要がある。 1C-10 #dbs151
2010-11-12 17:30:14