@tomoaki_teshima ついでにメモリのprefetch もできるようになっている。 #kantogpu
2016-08-21 14:38:18もしかしてCUDA 8から追加された(っぽい)cudaMemPrefetchAsyncのことかな? #kantogpu
2016-08-21 14:38:49ケプラーとマクスウェルのユニファイメモリーはGPU側のメモリーを使う。一方のパスカルはCPU側のメモリーも使えて、プリフェッチでやり取りできるAPIもある。 #kantogpu
2016-08-21 14:39:04Tesla P100 は、Pascalになったことも大きいが、 GPU間の通信、GPUと外のメモリとの通信など、周りとの連携を主眼に置いてる、という感想。 #kantogpu
2016-08-21 14:39:40GTX TitanX(GeforceがついてないTitanX) は会場後方においてあります。森野様ありがとう! #kantogpu
2016-08-21 14:39:58「関東GPGPU勉強会#4 #kantogpu」にセキココしました! sekico.co/zaseki/720 #sekicoco
2016-08-21 14:40:31OpenGL などで、1視点を設定して描画することになっていたが、 Titan X だと複数視点での描画が可能(VR用途を想定) #kantogpu
2016-08-21 14:40:57Titan は Coreが128 コア/SM基、total 3840 コア。128コア/SM基はMaxwell と同じ構造。 #kantogpu
2016-08-21 14:43:03確か前々回だったかな?自作スーパーコンピュータを持ち込んだ人が居たり、この勉強会、実機を持ち込むのが主流のようである。 #kantogpu
2016-08-21 14:44:16「GP102はMaxwell系と非常によく似ているので、Maxwellと同じように書いてもらえれば性能でます」 #kantogpu
2016-08-21 14:44:24TITAN X(GP102)はSM構成がMaxwellと同じなので、理論上はMaxwellと同じ書き方で性能が出る。 #kantogpu
2016-08-21 14:45:15「Titan X、2台入れて持ってきました」スゴい話である。 #kantogpu
2016-08-21 14:45:58Pascal GP100 Unified Memory : is not Limited by the Physical Size of GPU Memory. なので、GP102では、使えない。 #kantogpu
2016-08-21 14:47:02確かに、GPU-CPU間の転送帯域が120GB/s、GPU内の転送間が346GB/s ぐらい出ている。 #kantogpu
2016-08-21 14:47:30bandwidthtest はsimオプションを見ると、転送サイズを変えながら速度を測定できる。 #kantogpu
2016-08-21 14:48:06最大クロックではなく、最大クロックより少し落ちたところで落ち着く。 #kantogpu
2016-08-21 14:48:23ほんにこれ。 twitter.com/telmin_orca/st… #kantogpu
2016-08-21 14:49:04CUDA 8 APIに関する、GTCでのプレゼン #kantogpu on-demand.gputechconf.com/gtc/2016/prese…
2016-08-21 14:50:26simpleP2P で、隣のGPUのメモリを読みながら、自分のメモリに書く、みたいなことも可能。 #kantogpu
2016-08-21 14:50:35