x86/x64最適化勉強会4

#x86opti のタグを適当に拾って作りました
5
前へ 1 ・・ 3 4 ・・ 7 次へ
にっくる @nicklegr

呼び出し先が決まってる仮想関数は確定させてしまう。さらにインライン展開する #x86opti

2012-06-16 15:26:39
にっくる @nicklegr

どの仮想関数が呼ばれたかを記憶して、1通り、2通り、3通り以上で別のコードを生成 #x86opti

2012-06-16 15:28:27
にっくる @nicklegr

呼び出し回数が特に多い関数はインライン展開もしたりする #x86opti

2012-06-16 15:29:44
とみながたけひろ @takehiro_t

printfごときにもprefetch命令がはさまれるOpenJDK…! #x86opti

2012-06-16 15:36:40
T.T. @t_teruya

AMDは初めて自費で買ったPCに積んでたんだけど,今はIntelばかりだ… #x86opti

2012-06-16 15:55:57
takesako @takesako

Ut Video Codec Suite の作者 @umezawa_takeshi さんによる『「AMDで使うと遅いんだけど」』という括弧付の発表 #x86opti 唯一の欠点はニコ厨であること http://t.co/LONcr5CS

2012-06-16 15:59:12
とみながたけひろ @takehiro_t

がー、そういえばAMDのL1$は2wayだった。ラインコンフリクトぇ… #x86opti

2012-06-16 16:03:25
にっくる @nicklegr

AMDのL1サイズは32k。その単位でメモリ確保するときはキャッシュラインの衝突に注意 #x86opti

2012-06-16 16:05:50
とみながたけひろ @takehiro_t

考えてみたらSMTな環境で2wayしかないとかになると暗号のサイドバンド攻撃しまくりなんじゃ! #x86opti

2012-06-16 16:05:57
とみながたけひろ @takehiro_t

まーでも2wayだとLRUの実装が簡単なんだよなー #x86opti (回路規模びんぼう)

2012-06-16 16:07:02
T.T. @t_teruya

「ページ境界で同じ話があったような」 #x86opti

2012-06-16 16:07:26
にっくる @nicklegr

Linuxのタスク構造体で同じ問題があったそうな #x86opti

2012-06-16 16:09:37
T.T. @t_teruya

ズラしてキャッシュミスを回避… #x86opti

2012-06-16 16:10:08
T.T. @t_teruya

キャッシュカラーリング #x86opti

2012-06-16 16:10:16
takesako @takesako

PentiumM のL1キャッシュは4KB x 8wayで昔似たような問題にはまったことがある、など、体験談を交えた質疑応答が盛り上がっている x86/x64最適化勉強会です #x86opti

2012-06-16 16:11:20
Yasuo Itabashi @yitabashi

メディア処理用命令セットを謳っておいて2wayは確かにヒドい #x86opti

2012-06-16 16:11:55
T.T. @t_teruya

この問題は一定周期で引っ掛かるらしい #x86opti

2012-06-16 16:11:56
T.T. @t_teruya

そういえば,Intelの中の人による最適化のレクチャーでも「ズラしてキャッシュミスを防ぐ」というテクニックが紹介されていたなぁ… #x86opti

2012-06-16 16:12:44
T.T. @t_teruya

Bulldozerだと思った? 残念! ショベルカーでした! #x86opti

2012-06-16 16:13:09
とみながたけひろ @takehiro_t

壁紙で一発パンチをきめてくれるw_oさん! #x86opti

2012-06-16 16:13:17
前へ 1 ・・ 3 4 ・・ 7 次へ