森勢さんがUTAUの「人間らしさ」についてコメント!
- maiko3tattun
- 33359
- 4
- 1
- 1
3:00からの部分は周辺の楽音が小さくなるので「こえが」の部分のピッチシフト起因の劣化が顕著です.ある程度楽音があればミックスで何とかなりそうですけどここは難しいですね.
2014-12-31 15:29:47続いて,良く言われる「さ行」の難しさ.かなり綺麗なのですが,数か所合成音っぽさが出ています,例えば3:20からの「眠る小さな」の「さ」は若干アタックが強く(恐らくピッチがあると判断された?)合成音特有のノイズを感じます.
2014-12-31 15:32:16現象だけ言いますと例えば「おはようございます」と行った際最後の「す」が/su/ではなく/s/になり,/u/が欠けることがあります.今回の歌でも様々なところでさ行の無声化を行っていて凄く綺麗なのですけど,/u/が中途半端に混ざったところがあったとメモしているのですが気のせいかも.
2014-12-31 15:35:31今回具体例として挙げたのはメモした時間だけで,程度はありますが,随所に類似の違和感があります.大変いじわるの聴き方ですが...「た」と「む」に注意しつつ,音高遷移の高→低に注目すると分かりやすいかも.
2014-12-31 15:37:20@konuko73 いえいえ,他検証してほしいところや反論等あったらご遠慮なくどうぞ.曲自体の評価は別の恣意が入るので避けましたが,素晴らしいですね.相対的には十分神調教と言えるクオリティだと思いますです.
2014-12-31 15:45:38@m_morise 技術的な面でまだ手を出していない部分はあるのですが、最近どれも同じような品質になってしまっていたので森勢さんの意見が欲しかったのです。とても参考になりました!
2014-12-31 15:49:56@konuko73 音源設定側に問題がある場合もあるので,先ほどの件はどちらが悪いとは言いにくいと思いますよー
2014-12-31 19:48:22あくまで連続音を使いたい場合でも、気に入らない音素があった時などは、cvvcと同じ仕組みで部分的に繋ぐのは効果的だと、個人的には思います
2014-12-31 15:46:42森勢さんのツイートが面白いので便乗させてもらいたいんだけど、小さい「っ」が入るところはUTAUだと「a t」とかのVCを入れるべきところだと思うんだよなーというか私はそうしてる。CVVCがない場合は「a た」のtとaの部分を削っても同じことができる
2014-12-31 15:57:38本筋からそれますが,この人間らしさを損なった原因がどこにあるのか,というのは難しい問題です.音源設定が甘いと当然調音にも限界が出ますし,原音設定が完璧でも調音が甘いと死にます.また合成エンジンとの相性も出てくるので一概に「これが原因です(ドヤァ」とはなりません.
2014-12-31 16:01:26ただし「ピッチを操作すると操作量に比例して劣化する,特に高→低で顕著」は間違いありません.これはピッチシフトアルゴリズムそのものが抱える問題です.
2014-12-31 16:04:46そこを何とかするのが研究者の仕事になるわけです.限界があるので「劣化を最小限にする」課題として扱うことになります.技術が無いと「全音階を録音」がベストになりますが,研究者が頑張れば「1オクターブにつき2音階取ればベストと並ぶ」になるかもしれません.魔法の技術にはなりません.
2014-12-31 16:08:09ちなみに,これは我輩独自の凄い考察というわけではなく,音声合成の知識を持って合成歌唱に興味がある人なら大体気が付く程度の内容ですので,我輩が凄い人と誤解なさらぬよう...
2014-12-31 16:39:23