現在、後楽 森ビル一階スタバにて時間つぶし中。時間調整に休日出勤してバッチ結果確認してくるかとか思ったのだけど、空調なしに耐えかねて逃亡。http://t.co/jkAHxiF #x86opti
2011-08-06 12:12:46@t_teruya 並列性のある命令をCPUに見つけさせるためには、Reservation Station(RS)というバッファに並列実行される命令が同時に入ってる必要がある、と、そうすると、20の長さの依存する命令ブロックと、20の長さのRSがあったとき、
2011-08-06 12:19:57x86/x64最適化勉強会1 会場準備完了、もう入れます。後楽森ビル16Fまでどうぞ(1Fスターバックスが目印です) http://t.co/5qxT1Uz #x86opti
2011-08-06 13:07:07x86/x64最適化勉強会1 http://t.co/5qxT1Uz #x86opti ustream中継中 http://t.co/Nw3Ytdq
2011-08-06 13:35:18x86/x64最適化勉強会1 http://t.co/5qxT1Uz #x86opti 機材トラブルが復旧しましたので、ustream中継開始しています http://t.co/Nw3Ytdq
2011-08-06 13:54:52分岐は重い。除去せよ。getXXやadcを使えば比較→条件に合ってればカウントから分岐を消せる。 #x86opti
2011-08-06 13:59:22cmovを使うとMAX()を1命令で実装できる。ただし予測が当たる分岐は実は結構速い。その場合はcmovによる最適化はNG。 #x86opti
2011-08-06 14:02:40Sandyはdenormal numbers速くなってるらしい http://t.co/eELPOES #x86opti
2011-08-06 14:07:52SIMDの落とし穴。型に気をつけるこt。同じ内容の命令でも整数用と単精度浮動小数用が用意されていて、正しく使わないとペナルティが発生する。 #x86opti
2011-08-06 14:10:35