waifu2xのベンチマーク結果まとめ

初Togetterということで拙い面が多々ありますがお許し下さい。 TSUBAME上でも動いたwaifu2xに幸あれ。 ※追加するべきツイート(時間や画質に関するベンチマーク結果が挙げられているもの。主観的なのは不可)がありましたら教えて下さい。
パソコン waifu2x アプコン ノイズ除去 ベンチマーク GPU 画像処理 CPU
7

自分で測定したベンチ結果とその考察です

YSR@秋冬イベ攻略中 @YSRKEN
waifu2x-caffeをベンチマークした結果、つぎのことなどが判明しました。 ・cuDNNの高速化は微々たるもの ・演算時間は入力ピクセル数に比例 ・2^A倍にする際、時間は2倍と比べて4^(A-1)倍 詳しい検証データはこちら↓ www1.axfc.net/u/3479859.txt
YSR@秋冬イベ攻略中 @YSRKEN
www1.axfc.net/u/3479859.txt の概要 ・PCは4790K+750Ti、ソフトは64bit版で検証 ・サンプル画像は i.imgur.com/NMFjfXX.png を使用 ・時間計測用ツールはロクなのがなかったのでC++11で自作。詳しくはテキスト参照
拡大
YSR@秋冬イベ攻略中 @YSRKEN
www1.axfc.net/u/3479859.txt の概要その2 ・結果、GPUはCPUの10倍は速いが、あんなに苦労して落としたcuDNNの 高速化効果がほぼ感じられない結果に。作者さん見てますかー? ・演算時間は画像サイズに比例・デノイズレベルは無関係
YSR@秋冬イベ攻略中 @YSRKEN
www1.axfc.net/u/3479859.txt の概要その3 ・演算時間がnoise_scale<noise+scaleとなったことから、noise_scaleでは 何か特別な最適化を……?(ソース読んでないけどね!) ・jpegのデノイズは「低画質画像ならば効果あり」
YSR@秋冬イベ攻略中 @YSRKEN
waifu2x-caffe検証結果のグラフ乗っけておきますね ※テキストデータ→www1.axfc.net/u/3479859.txt pic.twitter.com/eNLapJBwqI
拡大
YSR@秋冬イベ攻略中 @YSRKEN
おっと危ない、ゲーム画像だとjpegノイズ載ってて jpegデノイズ検証に使えないから、そっちだけ別の画像使ったんだっけ。 pngで上げてくださったシネカ氏(@shieka_)に感謝いたします。 pic.twitter.com/tR7uNG8qVk
拡大
YSR@秋冬イベ攻略中 @YSRKEN
ん、twitterのURL貼るだけだとこんなふうに写るのか…… あまりつぶやいたことがないから記憶が曖昧で困るわー
YSR@秋冬イベ攻略中 @YSRKEN
ああこれも書いておかなきゃ。jpegデノイズ検証 で4:2:0にしたのはそれが「一般的に使われるjpeg」だと思ったからです。 waifu2xがYしか処理してないのは勿論知っているのでY-SSIMとかも 検証したいのですが、計算できるロクなフリーソフトがなくてね……
YSR@秋冬イベ攻略中 @YSRKEN
前述のjpegデノイズ試験 (twitter.com/YSRKEN/status/…) をSSIMで測り直しました。途中からデノイズ結果のSSIMが 飽和するというのが印象的。なお mehdi.rabah.free.fr/SSIM/で測定しています pic.twitter.com/S98xFpUs7V
拡大
YSR@秋冬イベ攻略中 @YSRKEN
waifu2xのベンチマーク結果を再整理しました。 詳細が書かれたテキストは次のURLから。 drive.google.com/file/d/0B22mWP… 表・グラフも付いたExcel版もあります。 drive.google.com/file/d/0B22mWP… pic.twitter.com/XVijbRRSU6
拡大
拡大
拡大
拡大
YSR@秋冬イベ攻略中 @YSRKEN
waifu2xの計算時間を予測する式が完成したかもかも! でもGPU版のVerは古めだからあてにならないかも……です! 予測の詳細→ twitter.com/YSRKEN/status/… twitter.com/YSRKEN/status/… pic.twitter.com/uLQyMSmE2y
拡大
YSR@秋冬イベ攻略中 @YSRKEN
PassMarkのスコアをPとした時、noise_scaleの処理速度[pixel/s]は、 ・CPU版(waifu2x-converter-cpp)  3.622771865×P ・GPU版(waifu2x-cafee 1.0.2)  24.30282537×P
YSR@秋冬イベ攻略中 @YSRKEN
例えば800x480のスクショが100枚あった場合、 i7-5960X(P=15998)だと11分掛かるけど、 GTX 980 Ti(P=11133)だと2.4分で済むと予測可能。
YSR@秋冬イベ攻略中 @YSRKEN
はわわわわ…こんな時にソースつけ忘れるなんて!俺のばかぁ! drive.google.com/file/d/0B22mWP… ※waifu2xの計算時間予測式→ twitter.com/YSRKEN/status/…
YSR@秋冬イベ攻略中 @YSRKEN
2種類のGPUでwaifu2x-cafee Ver.1.0.3の性能向上を検証。 800x480をnoise_scaleで2xした。 @mhhpnvu さんも書いているように、縦横で割り切れる値でかつ大きめにするのがコツかな pic.twitter.com/Hav80lUkr1
拡大
YSR@秋冬イベ攻略中 @YSRKEN
【悲報】waifu2x弄るの楽しすぎて提督業が疎かになる ケッコンカッコカリしたばかりでこれとは……
YSR@秋冬イベ攻略中 @YSRKEN
だが何のこれしき、速くなったwaifu2x-cafeeで 赤城さんとケッコンカッコカリした際に撮った映像をアプコン中。 寝て起きてからが楽しみだな……(画像はアプコン例になります) pic.twitter.com/PkdcSBMoiK
拡大
拡大
YSR@秋冬イベ攻略中 @YSRKEN
今起きた。GTX 750 Ti でアプコン終了。 画像サイズは800x480で9912枚、waifu2x-caffe 1.0.3だったことに注意な。 つまり177.9[pixel/ms]で処理してたことになるね。 pic.twitter.com/R9fxJmGvej
拡大
YSR@秋冬イベ攻略中 @YSRKEN
i7-4790Kで800x480のデノイズレベル1した場合の結果 ・aviutl-waifu2x-cpu V1.3(AVX) 7861[ms] ・AviUtl-waifu2x-GL(20150603) 12250ms なおtanakamura氏の奴は平然と2秒切ってくる模様……

自分で作成したソフトウェアも貼っておきます

YSR@秋冬イベ攻略中 @YSRKEN
【お知らせ】waifu2x-hspを公開します。 32x32の画像をデノイズするのに7分23秒(i5-3210M)も掛かる性能ですが…… これでgithub童貞卒業&waifu2x系作者の末席に座れたよ!やったね! github.com/YSRKEN/waifu2x…
YSR@秋冬イベ攻略中 @YSRKEN
【お知らせ】aviutl-waifu2x-cpuを公開します。 100x100の画像をデノイズするのに10秒(i5-3210M)も掛かる性能ですが……。 これでも前回出したHSP実装のざっと400倍以上速かったりします。 github.com/YSRKEN/aviutl-…
YSR@秋冬イベ攻略中 @YSRKEN
【お知らせ】aviutl-waifu2x-cpuを更新したかも!じゃなかった、更新! github.com/YSRKEN/aviutl-… ※例えばC2D E8600上で100x100の画像をデノイズした際、演算速度が6.5倍になっています pic.twitter.com/GT4S0962Dp
拡大
残りを読む(115)

コメント

YSR @YSRKEN 2015年6月7日
(もう更新報告送るのはTwitter側だけにします。Togetterのコメが自分だらけなのは見づらいので)
YSR @YSRKEN 2015年7月14日
まとめを更新しました。
ログインして広告を非表示にする
ログインして広告を非表示にする