#vocacon 「歌声合成技術を語る〜VOCALOID vs UTAU vs Sinsy三つ巴プレゼンマッチ」まとめ
UTAU音源に完成品という概念があまりない,は確かにそうだなあ。むしろダウンロードした音源の原音設定とかもいじってナンボになってる。 #vocacon
2015-02-22 00:41:44オープンソースであることがオープンであることの根拠になってないよな。日本のCGMソフトウェア界隈は #vocacon
2015-02-22 00:43:01フォルマント分析とかの苦労してる感はわかるのだが,人の声は加工しなければしないほど生っぽくなるのもわりと当たり前の話なんだよな。今日の三つ巴で尾形さんが,VOCALOIDではライブラリにできない種類の発声もUTAUならできることを評価してたのもそう。 #vocacon
2015-02-22 00:45:30歌声合成技術サロン。コアな技術論になってきた。フォルマントとか倍音とか正弦波とか、専門用語が飛び交ってる。 #vocacon
2015-02-22 01:11:44人の声は、ピアノの音色のように、綺麗な倍音が重なっている人と、ずれている人がいる。前者はVOCALOIDの音源に向いてるとか。 #vocacon
2015-02-22 01:13:00VOCALOIDはaのあとの無音も音素としてあるが、UTAUはaのあとの無音を用意しない。デクレッシェンドさせてるのが通常だとか。(知識のない自分の理解なので間違ってるかも #vocacon
2015-02-22 01:27:37なぜ合唱音源が難しいか。今のVOCALOIDのエンジンだと困難。VOCALOID音源を作るときに、収録した音から子音を切り出せない。合唱では子音が時間継続して重なる。 #vocacon
2015-02-22 01:31:00Sinsyは、学習パラメータがたくさんある。何小節目の音とかもパラメーターになる。歌の二番になると疲れるという歌手がいれば、それも学習する。 #vocacon
2015-02-22 01:34:49UTAUのキレ音源の収録は大変。C5でテンションあげて歌うのを1時間くらい続ける。後に収録した音になるほど疲れてテンションが下がる事が多くなる。 #vocacon
2015-02-22 02:27:20キレ音源は録音負荷が高い。cv-vc (で er る ut た =デルタ)は単独音とそう変わらない録音量で連続音の8割ぐらい出せそう(負担が少なくなめらか)、ただUTAUのシステム上曲をつくるのがとても難しかった。それが補助ツールの出現で変わってきた #vocacon
2015-02-22 02:31:30UTAU国際事情。UTAUは子音と母音が必ず組み合わせる日本語以外の言語を想定してない。海外の人が日本語音源を作ってる。アニソンなど日本語の歌を歌わせるのに使う。母国語の音源も頑張って作ったりしてる。 #vocacon
2015-02-22 02:34:25機械学習の具体的な計算量が気になる。長大な行列計算だから今はすっごい重いよってことだけ。計算リソース使い放題の大学すげーな! #歌声合成技術サロン #vocacon
2015-02-22 03:04:22