更新 2014年5月21日作成 2012年7月27日

VOCALOIDは人間らしくなれる？

前回（http://togetter.com/li/343618）の「ボカロがどこまで人間らしく歌えるか」のところで呟いていたことの続きです。人間っぽくないから嫌なら、ボカロが近づけばいいんじゃないかと思っています。それを追い求めるロマンのために、人工知能のような技術が使われるのならいいなぁ……。（※ちょっとうろ覚えなところもありますがご容赦ください）

音楽音声合成 VOCALOID

Urahito
3039
3
4
0
0

1

文章と声（声質）の関係

うらひと@ほぼアイマスアカ @Urahito

いつだったか、「耳の聞こえない友人がTwitterのTLを見て、『うるさい』という感覚が分かった」というツイートを見たことがあるけど、視覚的な『うるさい』感覚は、聴覚的な『うるさい』感覚を連想させるものなのかな

2012-07-27 15:06:35

うらひと@ほぼアイマスアカ @Urahito

どちらも、刺激として認識されたときに感じるものなのかな

2012-07-27 15:07:43

うらひと@ほぼアイマスアカ @Urahito

その人の声を知っていて、書いてある内容を読んでみると、その人の声で脳内再生されることはよくあるけど。

2012-07-27 15:14:22

うらひと@ほぼアイマスアカ @Urahito

もしその人の声質・声色が記憶されているとき、それらの合成されたものが想像されるのか

2012-07-27 15:16:36

うらひと@ほぼアイマスアカ @Urahito

そう考えると、人間には脳内にボーカロイドのようなシステムを持っているのかもしれない。

2012-07-27 15:17:23

人工知能＋VOCALOID

人間らしい「声質」

うらひと@ほぼアイマスアカ @Urahito

じゃあ、この間書いたボーカロイドの話を交えて言ってみよう。これを踏まえると、ボーカロイドに人工知能による、より自然な「調教パラメータ」の学習が出来るかもしれない。すると、よく使うパラメータを学習していき、ボカロPそれぞれが持つ調教を呼び出せるような気がする。

2012-07-27 15:21:17

学習：ここでは、「エフェクトやVOCALOIDでいうボイスのパラメータを、作り手の設定の傾向に合わせて記憶していくこと」としています。要するに、「記憶」や「記録」と解釈してください。

うらひと@ほぼアイマスアカ @Urahito

オケの傾向が変わらなければ、それに応じた学習済み調教パラメータを呼び出せばよくなるかも。

2012-07-27 15:22:35

うらひと@ほぼアイマスアカ @Urahito

これは人間らしい、という観点とはややずれる。必ずしも全員がそのような調教をする訳ではないから。電子音らしさを全面に出した調教をする人もいるし。でも、ボカロP自身が「より人間らしくする」調教をしているのなら、ボカロが人間のような声になるのは無理な話ではないかもしれない。

2012-07-27 15:25:19

うらひと@ほぼアイマスアカ @Urahito

ボカロのAppendは、その調整がし易いようにしたものなのかな。よく知らないので、後で調べておこう。

2012-07-27 15:30:03

うらひと@ほぼアイマスアカ @Urahito

やっぱり、データを蓄積するというのは大事なのかな

2012-07-27 15:41:18

うらひと@ほぼアイマスアカ @Urahito

調教学習データの確定はどうするべきか

2012-07-27 15:43:00

うらひと@ほぼアイマスアカ @Urahito

つまり、ボカロPが楽曲に合わせるボカロの声質を記憶するタイミング。

2012-07-27 15:44:50

うらひと@ほぼアイマスアカ @Urahito

任意であるべきなんだろうけど、基本は音声データの書き出しまでした時かな。その時、パラメータを記憶しておくか訪ねるとか。ほとんどボカロに触れてないので、実際にはパラメータを保存出来るのかもしれないけど。

2012-07-27 15:46:33

声質だけでなく、歌い方も人間らしく

うらひと@ほぼアイマスアカ @Urahito

もう一つ課題があって、声質のパラメータもそうだけど、ブレスだったり、ポルタメントなどを含めたメロディに関するパラメータの学習をどうするべきか

2012-07-27 15:49:35

うらひと@ほぼアイマスアカ @Urahito

メロディ関係のパラメータの件。歌ものなら、メロディを文章のように捉えて分析し、歌うときの癖みたいなのをパラメータで割り当てるのかな。うまく言えてないけど。

2012-07-27 16:39:54

人によって、歌うときの息づかいや音程のずれ方が違うように、VOCALOIDにもそれができないかな、と思ってます。
ボカロPや楽曲の作風ごとにそういったこだわりも異なってくると思うので、それをコンピュータに覚えさせるのも一つの手なのかなと思っています。

いま話題のタグ

ザ!鉄腕!DASH!!526 新人160 岸田文雄198 イラストレーター762 クリエイター480 絵師502 対魔忍38 出禁46 ゲゲゲの謎16 タヌキ108 ファンタジー1657 遭難82 鬼滅の刃1233 初見感想からしか取れない栄養素がある25 らーめん再遊記6