限定公開でまとめを作れば、相互フォローやフォロワー限定でまとめを共有できます!

WORLDとSTRAIGHTの違い

森勢先生(@m_morise)が語る タグにVOCALOIDを入るのは私見でした。
テクノロジー 音声合成 STRAIGHT UTAU 歌唱合成 WORLD 歌声合成 VOCALOID
15046view 2コメント
10

発端。
元々は聞き専ラジオの「おっさんボカロ」の話題から「魅力ある男声は違う実装が必要」→「違う合成器の差」になって、UTAUとV.Connectを提起したところから入ります。

@_kakko_kari
STRAIGHTとWORLDって何が違うんだろう。ぐぐれかすですかそうですか。
Eji @ejiwarp
STRAIGHTは恐ろしく重いしか記憶がないw RT @_kakko_kari: STRAIGHTとWORLDって何が違うんだろう。ぐぐれかすですかそうですか。
Eji @ejiwarp
@_kakko_kari WORLDはリアルタイムでの合成用を念頭にして開発した分析ツールなので、この点から見るとSTRAIGHTとは発想から違ってるよね。
@_kakko_kari
なるほど。WORLDはSTRAIGHTの高速版(リアルタイム版?)という感じですかね。他にも違いはあるのでしょうが。 QT @ejiwarp: STRAIGHTは恐ろしく重いしか記憶がないw RT @_kakko_kari: STRAIGHTとWORLDって何が違うんだろう。
Eji @ejiwarp
@_kakko_kari 元々WORLDの初実装はUTAU用の合成器(EFB-GW)ですからね。V.Connect-STANDは再構成したものです。
@_kakko_kari
@ejiwarp あ、やはりWORLDはリアルタイムを意識してるのですね。
はるまげにゃん@しゅらばぴ @shurabaP
あと,STRAIGHTは非周期性指標,WORLDは励起信号波形って差があるます.励起信号に残差持ってる分,単純な再合成はWORLDの方が品質が高いはず.編集した際は検証されたデータあったか忘れたけど,音程変えるくらいならWORLDのが強い子なはず.
はるまげにゃん@しゅらばぴ @shurabaP
元々のWORLDはSTRAIGHTを発展させた超高速版だと理解しています.
はるまげにゃん@しゅらばぴ @shurabaP
@maruLoop スペクトル推定部のSTARはかなり洗練された理論な気がするので,その部分についてはSTARでもいいかもしれませぬ.PLATINUMがまだいい扱いが無いので,分析にはSTRAIGHTのが向いてると思います,論文でのデータも多いし.
maru @maruloop
@shurabaP ほー,なるほど!卒論,WORLD使っとくべきだったかなー
はるまげにゃん@しゅらばぴ @shurabaP
そうそう,STARは結構綺麗な理論なんだよね.あのすっぱりした感じはとても好み.PLATINUMとかのざっくり具合もすげーいい感じなのですよ.思い入れのせいで応用アプリ作ってるつもりで応用じゃなくなったけどなー
はるまげにゃん@しゅらばぴ @shurabaP
@maruLoop STARはピッチ同期推定法としてはSTRAIGHTよりよさそうな印象があるんですが,全体のシステムが若いので分析に使うとプリミティブな知識が必要なので悩みどころだと思います.matlabのソースもないし.
maru @maruloop
@shurabaP おおう.分析でコケる可能性があるのは,ちょっと怖いですね.
@_kakko_kari
@shurabaP ぬう?STRAIGHT版とWORLD版のv.Connectを比較するとSTRAIGHT版の方が音は良い印象ですが、これは好みの問題でしょうか。
はるまげにゃん@しゅらばぴ @shurabaP
@_kakko_kari おそらくですが,STRAIGHTはパワースペクトルのみでどうにかする形で調整に調整を重ねているので,音の差は技術の若さの差だと思います.シンプルなスペクトルの合成ではどうもSTRAIGHTのが音が良いですね.
はるまげにゃん@しゅらばぴ @shurabaP
@maruLoop F0推定と非周期性指標をSTRAIGTのもの使って,スペクトルをSTARに変えるのはありだと思いますよ.ただ,先行研究がないのです.そういった意味でチャレンジングかと.多分両方やって比較するところからやらなと思います.
はるまげにゃん@しゅらばぴ @shurabaP
です.STRAIGHTの河原先生もまだまだ頑張ってらっしゃるのでSTRAIGHTが進化する可能性も高いですが. RT @_kakko_kari: ふむ。WORLDは今後に期待ということですか。
maru @maruloop
@shurabaP 両方で分析→スペクトルはSTARのものに差し替え→STRAIGHTで再合成って流れですよね.ふむー,面白そう
はるまげにゃん@しゅらばぴ @shurabaP
@maruLoop STRAIGHTはなんか過剰平滑化対策に面倒くさいことしてて,ぇー,って感じなのです.その辺STARはさっくりやっています.作ったお二方の性格の違いっぽいですけどねw
maru @maruloop
STRAIGHTもTANDEMが気になる.まだ調整が終わってないから,今後も品質が向上する可能性が多いにあるらしいし
maru @maruloop
@shurabaP STRAIGHTで過剰平滑化が施されてるのって,TANDEMで解消された部分です??
maru @maruloop
正直,STRAIGHTやWORLDが中で何をやってるかまでは理解してない
はるまげにゃん@しゅらばぴ @shurabaP
@maruLoop そうです.とはいえTandemは読むと頭痛いので,何やってんのかはさっぱりですが…STARの理論は多分頑張ればいける程度に簡単なもののようです.
maru @maruloop
@shurabaP なるほど.WORLDも目を通してみます!
残りを読む(49)

コメント

Eji @ejiwarp 2012年3月25日
文脈を考えると、前夜の議論をも収録してみようと思う。ゴダゴダになってすみません。
Eji @ejiwarp 2012年3月25日
一時外出によって漏れだ部分を補足
ログインして広告を非表示にする
ログインして広告を非表示にする