きらきらぼし音源から始まる歌声合成ライブラリ談義

音程を付けてUTAU音源を収録したらどうなるかという話
5
nwp8861 @nwp8861

@shurabaP @momijipan 現状ではMFCCのせいでうまくいかないというより、実装に至らない面が色々あるように思います>setParamの自動推定。あとは「や」行のように子音と母音が比較的のんびりと変化する類の音にてこずっていたかもしれません。

2012-04-24 03:13:06
しゅらぴばー @shurabaP

.@nwp8861 @momijipan 少し話はずれますが歌唱転写時に波形の振幅包絡だけ見ればある程度上手くいくので,まずは振幅が強いのは感覚的にうなずける気がします.補佐的にどの程度使えるのかとか詰めていくときに使えたら嬉しいような気も?結局人手は入るかもしれませんが.

2012-04-24 03:15:02
nwp8861 @nwp8861

あ、思い出したかも。現状のアルゴリズムは「かわ」みたいに先行母音=当該母音になってるときに、wを超えてkとaの間に飛んで行く可能性のある仕組みだったような。

2012-04-24 03:18:41