x86/x64最適化勉強会#7

タグを中心にまとめました: https://atnd.org/events/61785 主催者の光成氏によるレポートが公開されています: http://developer.cybozu.co.jp/tech/?p=8522 発表者の皆様,会場を提供して下さった皆様,そして参加者の皆様,勉強になりました,ありがとうございました.
2
前へ 1 2 ・・ 8 次へ
よっふぃ〜 @yottui

SSEおよびIA64には高速化のためにFTZ (Flush to Zero) という非正規化数を0として扱うモードがある…のか。 #x86opti

2015-03-15 13:41:58
Vengineer@ @Vengineer

#x86opti に来ています。Ustreamでも見られるようです

2015-03-15 13:42:21
茂木 和洋 @kzmogi

ソーシャルストリームのテスト (2) ( #x86opti live at ustre.am/BIEO)

2015-03-15 13:42:52
ひでん @klNth

IntrinsicでFTZの設定ができる #x86opti

2015-03-15 13:44:01
とみながたけひろ @takehiro_t

私は仮数/mantissa派なんだけど、この単語IEEE754とか以外の世界で見たことがない #x86opti

2015-03-15 13:44:30
kitok @kitokjp

適当な所でFlushしなくなるのか #x86opti

2015-03-15 13:44:45
とみながたけひろ @takehiro_t

きしもとさんはgcc4.9をお使い(どうでもいいことをチェックする例) #x86opti

2015-03-15 13:46:29
よっふぃ〜 @yottui

SSE2(3?) にはDAZ (denormals are zeros)というモードがあり、FTZが出力時点で0にするのに対してDAZは入力が0として扱われる #x86opti

2015-03-15 13:46:38
酒居敬一 @dob22in

@takehiro_t うん。私も浮動小数点数に関しては仮数/mantissaしか知らなかったです。小数部という単語はは整数部と対にして、固定小数点数に使っています。#x86opti

2015-03-15 13:48:16
yoh @yohhoy

printf近辺での怪しい挙動ってSSE2で演算しててもおきるんだっけ #x86opti

2015-03-15 13:49:01
ひでん @klNth

SSE2もしくは3で使えるのか #x86opti

2015-03-15 13:50:42
よっふぃ〜 @yottui

コンパイラがsetcsrをすっ飛ばす? #x86opti

2015-03-15 13:50:58
酒居敬一 @dob22in

浮動小数点数はこの会場ではそのまま0/1の並びで表示してもみなさん読めると思う。#x86opti

2015-03-15 13:53:05
酒居敬一 @dob22in

x87の場合はFPU内部での演算ビット数がロード/ストア時のビット数と違っていると、コンパイラの最適化の具合で結果が違う場合がある。たとえばFPU内ではつねに80bitで演算する場合とか。#x86opti

2015-03-15 13:55:42
ひでん @klNth

Parallellaってマイコンボードみたいな奴だっけとおもったらこれか ascii.jp/elem/000/000/9… #x86opti

2015-03-15 13:56:20
yoh @yohhoy

stackoverflow.com/questions/9314… そういえば非正規化数おそいってやつ stackoverflow でみたんだった #x86opti

2015-03-15 13:56:55
ひでん @klNth

と思ったらParallellaってZINQ使ったアレか #x86opti

2015-03-15 13:58:12
kitok @kitokjp

縦方向って4倍も遅くなるのか #x86opti

2015-03-15 14:01:54
ひでん @klNth

CUDAいじったときも縦方向のアクセスをなんとかすると速度速くなった覚えが #x86opti

2015-03-15 14:02:37
とみながたけひろ @takehiro_t

90倍速くなりました、と言ってもめでたくない世界 #x86opti

2015-03-15 14:03:12
前へ 1 2 ・・ 8 次へ