森勢さんがUTAUの「人間らしさ」についてコメント!

色々省略したタイトルですみません・・・ 音声分析評論家の森勢さんが、有名UTAUPこぬこさんのUTAUカバー曲について「人間らしさ」という観点からコメントされています。 (森勢さん以外の関連ツイートも掲載しています) 追記:その後この曲も聴いて!という話になりその分も増やしました。楽曲はツイート中のURLを参照してください
18
赤乃みずき🌿 @miko_ookami

今日ちえさんと「機械が人のように感情を込めて歌うことが出来たらすごくロマンがあると思うし、そうするための技術が完成したら最高だと思う」って話をした。出来るようになるかなあ。

2014-12-30 23:18:45
M. Morise (忍者系研究者) @m_morise

@miko_ookami そういう世界を実現すべく頑張ってます.

2014-12-30 23:20:07
赤乃みずき🌿 @miko_ookami

@m_morise おお…!年々ほんと進歩が凄まじいなあと感じております。そのうち実現してくれたらいいなあ…(`・ω・´)

2014-12-30 23:23:57
M. Morise (忍者系研究者) @m_morise

人間らしく表情豊かに歌わせる技術ってのは歌声合成の1つの目標ではあるけど,実現には信号処理だけではなくて歌手の協力者など色々な分野のエキスパートが必要なんだよね.なので,本格的に取り組むにはかなり大きなプロジェクトになるし予算も必要になる.

2014-12-30 23:27:53
M. Morise (忍者系研究者) @m_morise

なので,今の研究テーマに縛りがあるポストだとやりたくてもやれんのです.ただ,信号処理的側面にもまだまだ課題はあるので,先にそっちを詰める形でこっそり継続しています.

2014-12-30 23:30:49
こぬこ⛩️ @konuko73

@m_morise わーい!これは何%くらい人間っぽいですか?→nicovideo.jp/watch/sm252416… 足りない部分ってなんでしょう?

2014-12-31 14:54:32
M. Morise (忍者系研究者) @m_morise

【UTAわせてみた】crossing field/歌幡メイジ【UTAU】 (4:11) nico.ms/sm25241667 #sm25241667 せっかくなので,反論受け付ける意味でオープンにして,「人間らしさ」という観点から語らせて頂きます.いくつかに分けます.

2014-12-31 15:00:42
M. Morise (忍者系研究者) @m_morise

と言いつつ,大体3周くらい聞いて,その後気になったところを部分的に聞いてからなので,もう少し後でw

2014-12-31 15:01:13
M. Morise (忍者系研究者) @m_morise

よっしゃ,大体ポイントは分かったのでIKUZO

2014-12-31 15:13:26
M. Morise (忍者系研究者) @m_morise

【UTAわせてみた】crossing field/歌幡メイジ【UTAU】 (4:11) nico.ms/sm25241667 #sm25241667 まず,音源情報の再掲.楽曲,動画は度外視で,「人間らしさ」にのみ焦点を当ててコメントします.突っ込み歓迎です.

2014-12-31 15:14:49
M. Morise (忍者系研究者) @m_morise

全体の評価はあんまり参考にならないですけど,個人的に聴いてきた中では85点くらいです.全体的に人間と言われて遜色のないレベルなのですが,特定の部分で苦手なところがあって不気味の谷にはまっている,という印象を受けました.具体的なところは以下で順番に.

2014-12-31 15:16:50
M. Morise (忍者系研究者) @m_morise

一番引っかかったのが,「た」と「む」の一部で極端に「人間らしさ」が落ちているところ.た行が特に弱い印象ですけど,全てが悪いわけではないです.予想ですけど,収録時のテンポから大きく時間伸縮をかける際,子音に近いところまで変換されているような音色を感じました.

2014-12-31 15:18:59
M. Morise (忍者系研究者) @m_morise

なので,曲中のテンポと収録時のテンポが一致する場合の品質はほぼ完璧な一方,妙な音色になるところもありました.具体的には,0:20くらいからの「ままに」の2文字目の「ま」が該当します.

2014-12-31 15:20:32
こぬこ⛩️ @konuko73

確かにそこで音素変わってるんだよな 森勢さんはやはり神

2014-12-31 15:22:35
M. Morise (忍者系研究者) @m_morise

近いところで0:50くらいの「高く跳んだ」の「だ」も子音から母音に移り変わるところで音色が変な印象を受けています.

2014-12-31 15:22:49
M. Morise (忍者系研究者) @m_morise

次が,ピッチ変換による音色の不整合です.これはまぁピッチ制御そのものの問題なのですが,特に低い方向にシフトさせると音色が変になります.

2014-12-31 15:24:07
M. Morise (忍者系研究者) @m_morise

ある程度は頑張って調音でカバーできるのですが,高い音高→低い音高にポルタメント気味にシフトさせる場合,人間味の無い音色変化になります.こちらの具体例は,1:10の「強くいれた」の「た」です.

2014-12-31 15:25:38
M. Morise (忍者系研究者) @m_morise

1フレーズ全体が低い場合はそこまででもないのですが,該当部は1つ前の「れ」と次の「た」の音高差がかなり大きいので,「た」のピッチシフトによる音色の違和感がモロに出ているように聴こえます.

2014-12-31 15:26:40
M. Morise (忍者系研究者) @m_morise

2番の歌詞は「約束だった」と1つ前が「っ」なので,1番よりも違和感が小さいと思います.

2014-12-31 15:28:18
みのがしさらん @minogasi

メイジは原音がハキハキしててタ行とかの子音の前の無音部分が長いから、早口な曲だとほぼ前の母音がなくなって単独音みたいになってしまうので、子音速度上げまくってる

2014-12-31 15:31:28
1 ・・ 5 次へ