関東GPGPU勉強会 #4

3
前へ 1 ・・ 11 12 14 次へ
K. Ishizaki @kiszk

cupyも、numpyを書けばCUDAを生成する、という意味では高級言語でカーネルを書けるかな #kantogpu slideshare.net/ryokuta/cupy

2016-08-21 18:02:51
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

「何のせいかも得られませんでした」 に なりたくない時に使う。 #kantogpu

2016-08-21 18:05:44
山田てるみ @telmin_orca

日本でわりと珍しいOpenACCの話をしていただいています #kantogpu

2016-08-21 18:06:12
山田てるみ @telmin_orca

OpenACCの実装、もう少し増えてくれると嬉しいんだけどねえ #kantogpu

2016-08-21 18:06:32
dandelion @dandelion1124

OpenACCは個人利用なら無償で使えるんだ #kantogpu

2016-08-21 18:06:42
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

acc data ディレクティブを使うと、転送サイズ、配列の確保なんかもコンパイラがやってくれるし、場合によっては転送範囲を最適化してくれたりする。おー便利。 #kantogpu

2016-08-21 18:07:12
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

コンパイラがスレッドの割当、allocationなどをしてくれる。うん、それだけでも確かに使う価値がめっちゃありそうだ。 #kantogpu

2016-08-21 18:08:51
Vengineer@ @Vengineer

昔、CAPS使っていた。廃業したけど。 #kantogpu

2016-08-21 18:09:44
山田てるみ @telmin_orca

わりと適当にやって速くなるらしいOpenACC。ぼくもつかいたい #kantogpu

2016-08-21 18:09:46
Vengineer@ @Vengineer

綺麗に書いたプログラムなら、OpenACCって便利だよ。#kantogpu

2016-08-21 18:10:26
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

ACC 2.0 で関数呼び出しを含むループにも対応できるようになった。 #kantogpu

2016-08-21 18:11:22
青子守歌 @aokomoriuta

OpenACC 2.0はカーネルの中からcuBLASとかが呼べて、100万スレッドの各スレッドが100万要素の行列積とかが計算できる!?!? #kantogpu

2016-08-21 18:13:36
山田てるみ @telmin_orca

「ここ、NVIDIAのGPUの勉強会なんで」 #kantogpu

2016-08-21 18:15:50
山田てるみ @telmin_orca

OpenACCの情報が欲しければ、SofTekさんのサイト softek.co.jp/SPG/Pgi/OpenACC がおすすめ #kantogpu

2016-08-21 18:17:43
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

最新の実装について調べると、undocumented なことはあるあるな話で、OpenCV で悩まされた過去を思い出す。 #kantogpu

2016-08-21 18:18:07
山田てるみ @telmin_orca

t3840さんが考えたOpenACCのベストプラクティス #kantogpu

2016-08-21 18:18:27
Vengineer@ @Vengineer

あたしは、CPUでOpenMP化したものをOpenACCにするね。 #kantogpu

2016-08-21 18:18:44
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

ステップ1 acc data w突っ込んでデータ転送を減らす。 #kantogpu

2016-08-21 18:19:46
前へ 1 ・・ 11 12 14 次へ