関東GPGPU勉強会 #2 ツイートまとめ
- tomoaki_teshima
- 8189
- 0
- 3
- 4
CPUとGPUで比較する場合は、両者とも同等の最適化をする必要がある、というのが、Intelの結論(2010年当時) #kantogpu
2013-06-01 13:43:48Attack on titan www 進撃の巨人www #kantogpu
2013-06-01 13:44:27Xeon Phi Coprocessor が Intel から出てきた。 #kantogpu
2013-06-01 13:45:13MIC (マイク) Architecture で、60コア、4スレッドずつ。 #kantogpu
2013-06-01 13:45:47Kepler と MIC という2つの素晴らしいアーキテクチャが出てきた。それを両方比較する(神話をブチ殺す2013年版) #kantogpu
2013-06-01 13:46:36性能を語る上で重要になるのは Host device 間のデータ転送時間がかなり大事。元の論文ではデータ転送時間をカウントしてないので、今回もデータ転送時間は含まずに計測してる。 #kantogpu
2013-06-01 13:47:27SAXPY y = AX + y 「かけてたす」。 演算量少なすぎてメモリ律速になる性能。要素数10000000で、実行。OpenMP と CUDA と MICネイティブで書いてる。 #kantogpu
2013-06-01 13:49:17しょうがないんだけれど、画面が上にローテートシフトしちゃってるのがちょっと残念。 #kantogpu
2013-06-01 13:49:41Titanの実行時間が 0.134 で最速。XeonPhiが1.98msecで次。Corei7が3番手。キャッシュがヒットしまくってるのが高速化のポイントっぽい。 #kantogpu
2013-06-01 13:50:35ヒストグラム作成って難しいんだよね。どうしてもラスタスキャンが必要になるから。Intel としては、そういう命令セットを用意したが、いまいち使いにくかった。 #kantogpu
2013-06-01 13:51:34kepler で、 atomicAdd という atomic 演算が追加された。 #kantogpu
2013-06-01 13:52:08Xeon Phi の転送量がMICのいうところの、最適化が行われてなかったっぽいので、あまりにも遅かった。それで telmin さんが最近「死ぬ死ぬ」つぶやいていた。 #kantogpu
2013-06-01 13:53:50MICあまり速くなかったのでやまださん悩む。メモリの配置を変えたら速くなったがCorei7より遅い #kantogpu
2013-06-01 13:54:08最適化はできたが、それでも corei7 に勝ててない。 #kantogpu
2013-06-01 13:54:36