ちなみにDIOでは推定する範囲の数字を71~640にしていたと思います.例えば200の高さが来るとわかっている場合,範囲を150~300くらいにしてやればかなり結果が改善されるわけです.
2012-04-07 20:44:43で,音源側の歩み寄りというのは,各音源に対して音階もメモすることがどの程度の手間になるか,ということです.この情報があるかないかで,周波数表の作成精度がかなり上がります.下手すると半端な雑音対策やるよりも効果があります.
2012-04-07 20:46:53情報頂いた皆様に感謝を込めて.それにしても音高を固定して発声するのって,皆様割と簡単にやってる気がして驚きです.凄く難しそうなのになぁ.
2012-04-07 20:52:01@m_morise たしかに収録してて、音程が1度とか2度くらい高くなったりすることは有りますね……。わかる分は再録してなおしてますが、そのままのもあるかも……。そういうのを極力直したほうが親切なのでしょうけど・・・
2012-04-07 20:56:37@wakkaneko むしろそっちのほうが自然じゃないかな,と思ったりします.ただ,1オクターブ以内が目標なので,±2音階程度は全然許容範囲なのです.
2012-04-07 21:00:20ようはですね,合成エンジンと音源まで相補的に修正するようにお互いが努力すれば,恐らくVocaloidクラスのものができる可能性は十分にあるわけです.Sinsyも合成歌唱として素晴らしい域に達しているわけですし.
2012-04-07 21:02:41他に音源制作側に対して願うところは,複数の高さを録音する場合,自分の出せるもっとも低い声は録音してほしいことです.音高制御は,低→高より高→低のほうが明らかに難しいです.
2012-04-07 21:07:16最終的に目標とする姿は,(1) 音源収録者が高さを把握した状態で音源収録・音源設定 (2) 技術者が分析法をその話者にチューニング+技術者視点で音源設定を修正 (3) 分析結果を吟味し必要に応じて再収録,です.ここまでやれば,かなりクオリティの高い音源が収録できるはず.
2012-04-07 21:14:49そしてデモ曲は,音源収録者の最低と最高の間でのみ歌わせるようにする.そうすれば以下にも合成歌唱と思われるところは大幅に軽減されます.どうしても極端に高い・低いところで合成音らしさを露呈している気がするのです.
2012-04-07 21:16:12あとはSTRAIGHTのF0分析みたいにいくつかのF0候補を抽出して尤もらしいのを作業者が愛で確認とか・・・うん、これはめんどいね
2012-04-07 21:20:36@wakkaneko エンジン調整できるのは飴屋氏だけかも.UTAUに拘らないなら修羅場P氏(@shurabaP)のv.Connect-STANDなら何とか(と丸投げ
2012-04-07 21:23:04@dicekicker 全部やるのは面倒なんで,1つの有声音区間につき,2, 3回のクリックで解決する方法はできています.アイディアは差し上げますのでGUIデザイン頼みます.
2012-04-07 21:24:14@m_morise せんせー、GUIデザインは自分の中で一番足りないスキルです!(そして聞こえてくる「諦めたらそこで試合終了ですよ」の声
2012-04-07 21:27:24技術者は合成エンジンの開発者という意味です.現段階だと限りなく候補は限られますが,はまればVocaloidやSinsyに届く可能性を秘めています.
2012-04-07 21:30:18