F0推定法「Harvest」
Harvest version 58.耐雑音性と高低の安全性はDio+StoneMask以上,ただ,NDFには届かないのとビブラート耐性が相変わらず弱い.
2016-03-16 00:15:56ただ,恐らくビブラートがそんなにきつくないUTAUの音源解析ならNDF以上の性能が出るっぽい.今のアプローチは限界が見えてきたので一旦棚上げして別のアプローチが必要だな.
2016-03-16 00:25:09Harvest version 64.耐雑音性でここまで頑張ったけど,ここらが限界っぽい.基本的に相関,パワー,瞬時周波数,Dioのアプローチを全部ごちゃまぜにしてそれっぽいのを選択,という荒っぽい方法だけど,NDFには勝てない. pic.twitter.com/pRhlB85fgF
2016-03-16 20:52:24基本的に真値に雑音に起因する誤差が振動成分として入るので,恐らく時間方向で平滑化すれば改善できる.ただ1フレームの処理で求めたいのでもう少し工夫が必要だね.ただ,今のところ全部の方法でベストなものを恣意的に選択してもNDFに届かないので,何か見落としがある気もしている.
2016-03-16 20:54:55Dio Requiemは,結局あれから紆余曲折を経て,結局Harvestと同じアプローチに行きついたので,Harvestに改名した.
2016-05-31 17:13:58Harvestの最後の難関がようやく突破できそう.これでSNRが5 dBくらいまでは安定してF0が求められるはず.
2016-06-02 21:44:45Harvestを完成させた後にTenebrariusWorldを作るけど,7月締切の学会に投稿するのはちょっとキツイか...ちなみにHarvestのC++版は作りますけど,公開は当分先です(実装が複雑すぎて,まとまった時間が無いととてもやる気にならない)
2016-06-02 21:47:13Harvestはプロトタイプが完成しました.SNR 5 dBは無理だったけど,7 dBならほぼ安定します.
2016-06-03 11:24:11F0推定が難しいのは,F0は拾うけど,偶発的に生じる別の周期を拾ってはいけないところ.簡単なようで実に難しい.
2016-06-04 15:46:23Harvestのプロトタイプはほぼ問題ないレベルまで来たけど,それでも電源ノイズやファンノイズのような周期性雑音に引っ張られるのが問題になる.これを回避するテストをしているけど,思ったように性能は上がらんね.
2016-06-04 15:48:23現状で,現STRAIGHTの最強アルゴリズムNDFと比較して勝てるレベルまではきました.残りは何となくパワーアップさせたいだけです.
2016-06-04 16:09:49@konuko73 Harvestは分析側です.UTAUだと周波数表を作る部分ですね.WORLDのDioは低域に雑音がある音声は苦手だったのですが,それを克服し,普通の部屋で収録した音声でもほぼ完璧に周波数表が作れます.
2016-06-04 16:21:57音声データベースを用いて評価すると,時折大きな破綻をしているのが分かるので,その1つ1つのエラーを特定して潰していく作業.1回の評価に3時間くらいかかるから,何日かかるか予想がつかんw
2016-06-04 16:42:57今回の修正は結構面倒になるな...99の音声の性能を0.1%改善する代わりに,1つの音声の誤差を10 %増やすような状況になっている.
2016-06-04 16:46:29うーん.1つの特徴量を最適化すると別のところでコケる,か.確かにF0推定法のチューニングをモグラたたきと呼んだ師匠の気持ちが分かるw
2016-06-05 15:14:33耐雑音性:YIN VUV判定の広さ(有声を無声と誤推定しない):SWIPE 推定された軌跡の正確さ:DIO だけど,全体のバランスを考えるとNDFが一番良い.
2016-06-05 15:16:10Harvestは耐雑音性と軌跡の正確さにパラメータ振った結果,VUV判定が甘くなってしまった.それでも1%以下での戦いだけど.
2016-06-05 15:17:20Harvestの修正がいよいよ限界にきたっぽいw誤差の大きい1つの音声の対策を入れると他の誤差が増えてトータルの結果が悪くなるw
2016-06-06 17:52:43