x86/x64最適化勉強会2
単純にポインタで2分木を作らずに、幅優先でリスト化することで検索を SIMD 化できる。 #x86opti
2011-10-01 13:53:01nがとても小さければ2分木よりSIMDによる線形探索がよいときもあるという話は以前,私もRangeCoderのときに試したことがあります.ビット演算による最適化の妙味 http://t.co/k9CTW0ul #x86opti
2011-10-01 13:55:35僕には難しい。でも「アルゴリズムで扱うデータ量が増えた場合に,コア数に対して処理速度がスケールしない」というのはなるほどと思った QT @herumi 最適化勉強会始まりました.スライドは http://t.co/G6BZxUVC #x86opti
2011-10-01 14:00:22Bitonic sort の SIMD 最適化 (並列化はしやすいと記憶)。レジスタ内ソートを min/max/shuffle の組み合わせで実現する。 #x86opti
2011-10-01 14:03:26quick sort よりも SIMD 化した bi-tonic sort の方がオーダーが小さい??qsort って速いんじゃなくてオーダーが小さいだけだと思ってたけど違うのかな #x86opti
2011-10-01 14:05:21レナ(Lenna または Lena)は、PLAYBOY誌1972年11月号に掲載された女性の写真の一部。画像圧縮アルゴリズムの評価に、広く使用されている標準テスト・イメージのうちの1つ #x86opti http://t.co/CNePwpag
2011-10-01 14:09:31(1) ディスクを読むな (2) 大きなメモリを読むな (3) 分岐するな (4) 除算するな (5) 乗算するな [そんな無茶なっ] #x86opti
2011-10-01 14:12:48並列度8のSIMDでも、分岐排除することで8倍を超えることができるのね。当たり前か。 #x86opti
2011-10-01 14:16:59会場から SSE4.1 なら PBLENDVB 命令(ブレンド命令)が使えるのでは?というツッコミが #x86opti http://t.co/hAD2JLZi
2011-10-01 14:23:52