森勢さんがUTAUの「人間らしさ」についてコメント!

色々省略したタイトルですみません・・・ 音声分析評論家の森勢さんが、有名UTAUPこぬこさんのUTAUカバー曲について「人間らしさ」という観点からコメントされています。 (森勢さん以外の関連ツイートも掲載しています) 追記:その後この曲も聴いて!という話になりその分も増やしました。楽曲はツイート中のURLを参照してください
18
前へ 1 ・・ 4 5
M. Morise (忍者系研究者) @m_morise

まずは,最初の「あー」がフラットすぎてこの時点で合成っぽいな,と思われてしまう.次の「君にとってー」の「てー」でこれは合成音だなと思う.個人的に,最初の「あー」は後半でやや音高を下げているけど,もう少し下げつつ震わせる感じのほうが人間的に聴こえる気がします.

2015-01-01 01:30:42
M. Morise (忍者系研究者) @m_morise

「てー」の部分も最初からフラットのまま遷移するので,ここも弱いビブラートか微細変動があったほうが人間らしくなるかも.

2015-01-01 01:31:07
M. Morise (忍者系研究者) @m_morise

その他,基本的にフレーズ最後の伸ばす音がほぼフラットなのは「安定感がありすぎ」で逆に不自然に聴こえてしまうのが勿体ないかな.収録音階数は分からないけど,低域の自然性は他よりかなり優れていると思います.

2015-01-01 01:32:30
M. Morise (忍者系研究者) @m_morise

後は,同じ言い回しを(恐らく)同じように調音しているのは不自然さの原因になります.これは経験上ですが,人間は幾何学的な周期性に物凄く非人間性を感じる修正があって,今回は「トントンとー」の「トン」と「トン」がほとんど同じ表情なので,やっぱり機械っぽいなぁという気がします.

2015-01-01 01:36:03
M. Morise (忍者系研究者) @m_morise

これらは目立った劣化ではないですが,人間らしさを損なう,という点で減点しています.点数が他より低いのは,該当する箇所が多いことに起因しています.と,ここまでが減点要因ですが,評価が難しかった別要因にポジティブなものがあります.

2015-01-01 01:37:36
M. Morise (忍者系研究者) @m_morise

まず,加点対象の1つはブレスの多様さと自然さ.合成しているのか分からないですけど,やはり次の音素に適したブレスが選ばれているのか,恐ろしく自然に聴こえます.

2015-01-01 01:39:32
M. Morise (忍者系研究者) @m_morise

もう1つは,音源の安定感.全体を何度聞いても目立った劣化はありませんでした.他のが「荒削りだけど凄い」という印象だったのに対して「凄く安定感がある」というのが率直な感想です.それだけにフラットな調音が目立って聴こえてしまっています.

2015-01-01 01:41:03
M. Morise (忍者系研究者) @m_morise

それと,調音に関して,リズミカルに歌うところはかなり綺麗です.例えば,0:38くらいからの「なんだって問いたい」の「い」の力の抜き方の自然性は見事です.

2015-01-01 01:43:54
M. Morise (忍者系研究者) @m_morise

次の「どうせなら」の「な」のスタッカート表現も凄く綺麗.それだけに伸ばす音のフラット差が凄く勿体ない.

2015-01-01 01:44:56
M. Morise (忍者系研究者) @m_morise

というわけで,総括すると音源は(今のところ)パーフェクトで,調音側の工夫次第,というところかな.調音者様には申し訳ないですけど,音源側の弱点はこれと言って感じませんでした.

2015-01-01 01:46:54
M. Morise (忍者系研究者) @m_morise

@maiko3tattun オープンな呟きでまとめておきましたー.一応ポリシーとして率直に評価させて頂きましたが,注目して聴いてほしい場所などの再考願いはいつでも受け付けておりますー.

2015-01-01 01:49:14
M. Morise (忍者系研究者) @m_morise

一応評価するものとして言葉はそれなりに気を付けますけど,言いたいポイントはぼかさないように心がけています.

2015-01-01 01:50:47
まいこ(・Д・) @maiko3tattun

@m_morise ありがとうございました。私がこだわって調声した部分も苦手な部分も見抜かれていてエスパーか!?ってなりましたw 音源については録音リスト作成から原音設定まで私がやったので、そこをコメント頂けたのは本当に励みになります!今年の目標はビブラートの研究でw

2015-01-01 01:52:19
まいこ(・Д・) @maiko3tattun

@m_morise 息音源についてですが、中の人が実際に歌った曲中のブレスを切り出し、UTAU上の原音を鳴らすフラグで合成しています。4音階+裏声の音源ですが、中の人が初挑戦なのもあり現状高音にいくほど弱い発声になっているので、強系の表情音源は特に欲しいと思っていたところです

2015-01-01 01:54:46
M. Morise (忍者系研究者) @m_morise

@maiko3tattun やっぱりブレスは実際のものからですかー.後はキレ音源的なシャウトがあるとサビの高域が映えそうに感じました.それが無くてもクオリティは凄く高いですので,今後を楽しみにしております.

2015-01-01 02:00:24
M. Morise (忍者系研究者) @m_morise

しかし,構想だけで試したことが無かった百八式ブレス(2013年くらいの呟き)の実例を見た気分がするw

2015-01-01 02:01:44
まいこ(・Д・) @maiko3tattun

@m_morise 軽く70個ぐらいあるので、長め・短め・中ぐらいに分類し、ポップス用・バラード用(前半と盛り上がるところ)とおおまかに3つに分けて、あとは片っ端からナンバリングしました。音素選択のプラグインに頼ればそう苦労せず目当ての音素を選べますよー

2015-01-01 02:06:29
M. Morise (忍者系研究者) @m_morise

ちなみに「音声分析評論家」は2013年のテレビ出演用の肩書きで,そういう資格があるわけではなく単に分かりやすいラベルなだけですw一応そういう評価をずっとやってきているので,合成音声に関する感度は人より高いとは思います.

2015-01-01 02:03:44
前へ 1 ・・ 4 5