森勢さんがUTAUの「人間らしさ」についてコメント!

色々省略したタイトルですみません・・・ 音声分析評論家の森勢さんが、有名UTAUPこぬこさんのUTAUカバー曲について「人間らしさ」という観点からコメントされています。 (森勢さん以外の関連ツイートも掲載しています) 追記:その後この曲も聴いて!という話になりその分も増やしました。楽曲はツイート中のURLを参照してください
18
前へ 1 2 ・・ 5 次へ
こぬこ⛩️ @konuko73

絶対に湧いて来ると思っていたぞがしら

2014-12-31 15:32:29
M. Morise (忍者系研究者) @m_morise

3:00からの部分は周辺の楽音が小さくなるので「こえが」の部分のピッチシフト起因の劣化が顕著です.ある程度楽音があればミックスで何とかなりそうですけどここは難しいですね.

2014-12-31 15:29:47
M. Morise (忍者系研究者) @m_morise

続いて,良く言われる「さ行」の難しさ.かなり綺麗なのですが,数か所合成音っぽさが出ています,例えば3:20からの「眠る小さな」の「さ」は若干アタックが強く(恐らくピッチがあると判断された?)合成音特有のノイズを感じます.

2014-12-31 15:32:16
M. Morise (忍者系研究者) @m_morise

もう1つ「母音の無声化のミス」ってメモしているけど,該当部分が分からなくなったw

2014-12-31 15:34:03
M. Morise (忍者系研究者) @m_morise

現象だけ言いますと例えば「おはようございます」と行った際最後の「す」が/su/ではなく/s/になり,/u/が欠けることがあります.今回の歌でも様々なところでさ行の無声化を行っていて凄く綺麗なのですけど,/u/が中途半端に混ざったところがあったとメモしているのですが気のせいかも.

2014-12-31 15:35:31
M. Morise (忍者系研究者) @m_morise

今回具体例として挙げたのはメモした時間だけで,程度はありますが,随所に類似の違和感があります.大変いじわるの聴き方ですが...「た」と「む」に注意しつつ,音高遷移の高→低に注目すると分かりやすいかも.

2014-12-31 15:37:20
M. Morise (忍者系研究者) @m_morise

というわけで,結構な連投になりましたが,以上です.反論,質問はいつでもどうぞ.

2014-12-31 15:38:17
こぬこ⛩️ @konuko73

@m_morise ありがとうございました!!

2014-12-31 15:38:39
M. Morise (忍者系研究者) @m_morise

@konuko73 いえいえ,他検証してほしいところや反論等あったらご遠慮なくどうぞ.曲自体の評価は別の恣意が入るので避けましたが,素晴らしいですね.相対的には十分神調教と言えるクオリティだと思いますです.

2014-12-31 15:45:38
こぬこ⛩️ @konuko73

@m_morise 技術的な面でまだ手を出していない部分はあるのですが、最近どれも同じような品質になってしまっていたので森勢さんの意見が欲しかったのです。とても参考になりました!

2014-12-31 15:49:56
M. Morise (忍者系研究者) @m_morise

@konuko73 音源設定側に問題がある場合もあるので,先ほどの件はどちらが悪いとは言いにくいと思いますよー

2014-12-31 19:48:22
こぬこ⛩️ @konuko73

@m_morise もう少し調音の際に手を加えることができる部分があるので色々試してみます!

2014-12-31 19:50:14
みのがしさらん @minogasi

あと他音階連続音の音程の高低が激しくて起こる低音の音質劣化はcvvcの仕組みで繋ぐといいよって前に教えた気がする(半ギレ

2014-12-31 15:37:12
こぬこ⛩️ @konuko73

@minogasi 原音設定できねえんだよ!(半ギレ

2014-12-31 15:38:04
みのがしさらん @minogasi

@konuko73 原音設定の数値の意味も教えただろ(半ギレ

2014-12-31 15:38:31
こぬこ⛩️ @konuko73

@minogasi 無声化の原音設定以外尽く失敗した(半ギレ #俺が悪い

2014-12-31 15:39:39
みのがしさらん @minogasi

あくまで連続音を使いたい場合でも、気に入らない音素があった時などは、cvvcと同じ仕組みで部分的に繋ぐのは効果的だと、個人的には思います

2014-12-31 15:46:42
まいこ(・Д・) @maiko3tattun

森勢さんのツイートが面白いので便乗させてもらいたいんだけど、小さい「っ」が入るところはUTAUだと「a t」とかのVCを入れるべきところだと思うんだよなーというか私はそうしてる。CVVCがない場合は「a た」のtとaの部分を削っても同じことができる

2014-12-31 15:57:38
まいこ(・Д・) @maiko3tattun

小さい「っ」は個人的にはすごくこだわりポイントなのだ

2014-12-31 15:59:25
M. Morise (忍者系研究者) @m_morise

本筋からそれますが,この人間らしさを損なった原因がどこにあるのか,というのは難しい問題です.音源設定が甘いと当然調音にも限界が出ますし,原音設定が完璧でも調音が甘いと死にます.また合成エンジンとの相性も出てくるので一概に「これが原因です(ドヤァ」とはなりません.

2014-12-31 16:01:26
M. Morise (忍者系研究者) @m_morise

ただし「ピッチを操作すると操作量に比例して劣化する,特に高→低で顕著」は間違いありません.これはピッチシフトアルゴリズムそのものが抱える問題です.

2014-12-31 16:04:46
M. Morise (忍者系研究者) @m_morise

そこを何とかするのが研究者の仕事になるわけです.限界があるので「劣化を最小限にする」課題として扱うことになります.技術が無いと「全音階を録音」がベストになりますが,研究者が頑張れば「1オクターブにつき2音階取ればベストと並ぶ」になるかもしれません.魔法の技術にはなりません.

2014-12-31 16:08:09
M. Morise (忍者系研究者) @m_morise

ちなみに,これは我輩独自の凄い考察というわけではなく,音声合成の知識を持って合成歌唱に興味がある人なら大体気が付く程度の内容ですので,我輩が凄い人と誤解なさらぬよう...

2014-12-31 16:39:23
前へ 1 2 ・・ 5 次へ