- ishikawa84g
- 4128
- 0
- 1
- 1
Tesla vs FirePro vs Xeon E5、コア数は2688, 1792, 16。Peak性能は、約4T、3T、185G Flops。#pgstrom
2013-02-18 19:07:50わかってるんだろうけど,ピーク性能,GPUは単精度なのにSandy Bridgeは倍精度の数字になっている.ちゃんと統一しないとツッコミが入る要因になる.#pgstrom
2013-02-18 19:09:12GPUのコードをhostメモリからdeviceメモリに転送してから実行する?その間はCPUが並列に動作できるということか? #pgstrom
2013-02-18 19:12:46最新のGPUだと分岐命令(分割統治法的な分岐)、少し強化されましたよね // #pgstrom http://t.co/FCwU5TUq
2013-02-18 19:13:35GPUを呼び出す関数には同期モードと非同期モードがある。サンプルは簡単さのために同期モードで書いている。 #pgstrom
2013-02-18 19:17:13ホストからはソース形態でGPUコードをGPUに配布する。GPU内で実行時コンパイルする。これにより互換性を高くしている。 #pgstrom
2013-02-18 19:18:58CPUとGPGPUも使う場合の比較。長所は超並列で非同期なこと。短所はホスト・デバイス間のDMA転送コストとコードの複雑化。#pgstrom
2013-02-18 19:20:08PG-stromはシンプルなインデクススキャンプランには向かない。生PostgreSQLのほうが向いている。フルスキャン、複雑な条件などではPG-Stromの効果があるということか。 #pgstrom
2013-02-18 19:23:47役割分担。GPUは簡単な四則演算など。CPUはNWやディスクI/OなどCPUにしかできないことをやらせる、というのが基本のアイディア。 #pgstrom
2013-02-18 19:25:24SQL/MED(Management of External Data)を利用して、クエリ実行の負荷をOracleやMySQLに外出し出来る。PG-Strom FDWを介せば、GPUに外出し出来る。#pgstrom
2013-02-18 19:27:11FDWを使って、別サーバの他情報源にクエリを投げている間はCPUが空く。同じように、FDWを経由してGPUに仕事をさせたい。 #pgstrom
2013-02-18 19:27:49SQL/MED APIを使って、クエリプラン、実行の2回、FDWのPlanner、Executorを呼び出している。#pgstrom
2013-02-18 19:28:07PG-Stromの場合、FDW Plannerが条件句からGPU用Kernelコードを生成する。FDW ExecutorはKernelコードをJITコンパイル(したい)、Shadow Tableからデータをロード、GPUが非同期実行する。#pgstrom
2013-02-18 19:29:56PG-Stromが効果的と予測されるのは、Indexが効かずスキャンが必要な場合。NetezzaのFPGA併用とも構造的には似ている気がする...GPGPUの特性上データを篩い落とすタイミングがメインメモリへのロードの前と後で違いそうだけど #pgstrom
2013-02-18 19:30:29FDW plannerで条件句からGPU用Kernel codeを自動生成→FDW Executorでshadow tableからのロードとGPUの演算を並列に実施するイメージ。 #pgstrom
2013-02-18 19:30:53現状、background workerからPG-StromのGPU制御用バックエンドプロセスを起動する。 #pgstrom
2013-02-18 19:32:36