x86/x64最適化勉強会#5

6
前へ 1 2 ・・ 9 次へ
HOSHIZUKI, Yusuke @lunatic_star

戻り値に i32 と i1 のペアが使えるのかすごいな #x86opti

2013-03-30 14:00:30
とみながたけひろ @takehiro_t

逆アセンブルして最適化してアセンブルしたらいいコードになる、ってなんか人間JITコンパイラのような気分 #x86opti

2013-03-30 14:06:12
にっくる @nicklegr

LLVMは出力のarchを簡単に変えられるので、他のCPUの勉強になる #x86opti

2013-03-30 14:06:28
とみながたけひろ @takehiro_t

そんなところで抽象化するな、俺に生ハードを使わせろという熱い漢の怒りが! #x86opti

2013-03-30 14:07:45
酒居敬一 @dob22in

データフロー記述みたいな感じ?#x86opti

2013-03-30 14:08:32
Egtra (ysk-noh) @egtra

http://t.co/w0tPpRYjxP ドキュメント見る限り、浮動小数点数型も16/32/64/128ビットとx87の80ビットなどあるようですね。 #x86opti

2013-03-30 14:09:21
にっくる @nicklegr

DBをLLVMのJITで高速化している #x86opti

2013-03-30 14:13:26
後藤 浩昭 / GORRY @gorry5

昨日あんな最適化とかアセンブラとかの話が盛り上がった翌日に #x86opti なんてタグが流れてくるとニヤリとせざるを得ない… :D

2013-03-30 14:13:43
にっくる @nicklegr

きつねさんでもわかるLLVM - 達人出版会 http://t.co/mU36pUWist #x86opti

2013-03-30 14:14:32
とみながたけひろ @takehiro_t

llvmの本、あれは表紙だけだったのか・・・#x86opti

2013-03-30 14:16:06
とみながたけひろ @takehiro_t

ああ、むかし非可逆音声圧縮と原音の差分をとってそれを圧縮するというのをやってたときに勉強したアレや・・・#x86opti

2013-03-30 14:18:25
yoh @yohhoy

指示列と処理対象が分離の部分でハーバードアーキテクチャを連想した(関係ない) #x86opti

2013-03-30 14:20:07
とみながたけひろ @takehiro_t

さりげなく使ったgccが先週リリースされたばかりのgcc4.8である #x86opti

2013-03-30 14:20:49
にっくる @nicklegr

gccでは手作業でループアンロールしない方が、自動ベクトル化がうまく働く #x86opti

2013-03-30 14:21:32
にっくる @nicklegr

-O3で自動ベクトル化が有効になる #x86opti

2013-03-30 14:22:10
HOSHIZUKI, Yusuke @lunatic_star

ドキュメントは豊富だけど、豊富過ぎて読みにくい #x86opti

2013-03-30 14:24:18
とみながたけひろ @takehiro_t

llvmのドキュメントは確かに多すぎる感はある。まあgccもだけど・・・ドキュメントなにそれって感じに思えるほかのプロジェクトに比べればすばらしいのだけど #x86opti

2013-03-30 14:24:55
HOSHIZUKI, Yusuke @lunatic_star

さすが、やっぱり Intel Compiler 速い。 #x86opti

2013-03-30 14:26:24
にっくる @nicklegr

浮動小数点演算のIEEE準拠をOFFにすると、自動ベクトル化されやすい #x86opti

2013-03-30 14:29:10
にっくる @nicklegr

floatのinject :+は、順序を変えると結果が変わるので最適化されづらい。gccなら-ffast-mathが必要 #x86opti

2013-03-30 14:31:07
yoh @yohhoy

アライメント前提のロード命令を吐かせるには、元コード上に何らかの方法でアライメント制約を表現できないとだめな気がするけど、そんな属性的なのあったかしら #x86opti

2013-03-30 14:31:22
前へ 1 2 ・・ 9 次へ