UTAU界隈の学術的な方向からの位置づけ

今度のSIGMUS(7/28-30)が面白そうなのですが見に行けそうにありません。そこで、UTAU界隈の現状(特に個人が歌声音声DBを作成すること)はSIGMUS等の学術方面からはどのように見えるのか、どのような位置づけになりえるのか等について、つい東北大の伊藤先生にご意見をうかがってしまいました。詳細なご回答ありがとうございます。後でまた参照したくなると思い、やりとりをまとめました。SIGMUSに宿泊参加すると、こういった話をするチャンスがあるのかもしれません。
15
nwp8861 @nwp8861

RTした「歌声情報処理最前線!」 http://bit.ly/beb80c 、末尾にある参考資料2つも夢があって面白いです。

2010-07-08 20:14:02
nwp8861 @nwp8861

SIGMUS 7/29は宿泊者のみでデモセッション。。 http://ow.ly/28Ba5 飛び入り参加OK。。むーん。関東。。

2010-07-08 20:27:19
Akinori Ito @akinori_ito

可能ならぜひ来てほしいなあ RT @nwp8861 SIGMUS 7/29は宿泊者のみでデモセッション。。 http://ow.ly/28Ba5 飛び入り参加OK。。むーん。関東。。

2010-07-08 20:43:02
nwp8861 @nwp8861

@akinori_ito 多分今回は日程的に厳しいです。。ところで先生の目から見た現状では、仮にUTAUやOREMO等がこういった場に顔を出したら受け入れられる状況なのでしょうか?社会的な貢献?は多少なりあると思いますが、研究面からは新規性の有無があるのか分かりかねております。

2010-07-08 20:54:42
nwp8861 @nwp8861

@akinori_ito 先ほどの質問は、先生の立場で答えられる場合のみで結構ですので。。前から何となく思っていたこと(現状でのOREMOの位置づけなど)でして、この際にと思わず質問してしまいました。

2010-07-08 21:05:27
nwp8861 @nwp8861

あ、そうか。そういう話をするための合宿形式ということなのかも。。うーん。

2010-07-08 21:13:14
Akinori Ito @akinori_ito

それは残念です.また何かの機会に RT @nwp8861 @akinori_ito 多分今回は日程的に厳しいです。

2010-07-09 08:18:46
Akinori Ito @akinori_ito

もちろんです.いくつかの意味で. RT @nwp8861 仮にUTAUやOREMO等がこういった場に顔を出したら受け入れられる状況なのでしょうか?

2010-07-09 08:20:26
Akinori Ito @akinori_ito

@nwp8861 まず,デモセッションに出すことを考えた場合,デモセッションは必ずしも新規性を必要としません(新規な方が喜ばれるとは思いますが).完成度,面白さ,社会貢献,場合によっては実現したことそのものも評価されます. #sigmus

2010-07-09 08:26:08
Akinori Ito @akinori_ito

@nwp8861 例えば2008年の夏シンポにはVOCALOIDが出展されました.VOCALOIDは技術的には完成されたもので(商品ですから),その意味で新規ではありませんでしたが,人気でした. #sigmus

2010-07-09 08:26:27
Akinori Ito @akinori_ito

@nwp8861 次にUTAUやOREMO自体の学問的価値について.私の知る限り,一般人が気軽に声を録音し,それを元に任意の歌声を合成するシステムは他にありません.

2010-07-09 08:29:04
Akinori Ito @akinori_ito

@nwp8861 なので,歌声合成のための元音声の録音をどうすべきかとか,あるいは必ずしもクオリティの高くない録音音声から合成した声の品質をどう向上するかということは,現状では研究課題として認識されていません.

2010-07-09 08:31:05
Akinori Ito @akinori_ito

@nwp8861 ですから,そのようなことが研究課題なのだということを多くの人達と共有すること自体に意味があり,その意味でUTAUやOREMOは一般講演としても意味があると思います.

2010-07-09 08:32:51
Akinori Ito @akinori_ito

@nwp8861 ただ,周りに興味を持ってもらうためには,単なる「枯れた技術を使って yet another song synthesizer を作った」レポートではなく,そこで出てきた問題点や課題をうまく説明する必要があるとは思います.

2010-07-09 08:38:04
nwp8861 @nwp8861

@akinori_ito 丁寧なご回答ありがとうございます。SIGMUSのような場に耐える糸口はありそうだという感触を持ちました。

2010-07-09 18:44:52
nwp8861 @nwp8861

@akinori_ito 私も「OREMOを作りました」という話にはあまり価値が無いかなと思います(開発の視点から見ても、同じコンセプトでもっと良いソフトは作れるはずですし)。学術的な方面からは、個人が歌声合成用DBを作って公開する現象自体が重要だろうと思います。

2010-07-09 18:47:15
nwp8861 @nwp8861

@akinori_ito 個人が音声DBを公開する現象は、歌声合成のみでなく、CGMや音声処理全般からも可能性や価値を見出せることかもしれないと期待しています。でも客観的な裏付けとして音声DB数やダウンロード数位しか思いつけなかったりで、どうしたものかなと考えていました。

2010-07-09 18:52:39
nwp8861 @nwp8861

@akinori_ito ひとまず今度のSIGMUSのように、合宿やデモセッションを通して勉強や議論のできる場もあることが分かりました。ありがとうございます。

2010-07-09 19:01:05
Akinori Ito @akinori_ito

@nwp8861 SIGMUSの発表はジャーナル論文ではないので,どういう課題があるかを示すだけでもいいのです.例えば,去年の夏シンポでベストプレゼン賞をとった泉川先生の「地無し尺八特性付加ツールの開発」は実際には開発していませんでした.でも話は面白かった. #sigmus

2010-07-09 19:14:17
Akinori Ito @akinori_ito

@nwp8861 UTAU(など)の音声DB数や投稿動画数の推移は,「パーソナル歌声合成」という分野が確実に存在するという証拠としては十分だと思います

2010-07-09 19:15:56
Akinori Ito @akinori_ito

@nwp8861 そこでの課題が何なのか,をうまく示すことがポイントかな.

2010-07-09 19:17:46
Akinori Ito @akinori_ito

@nwp8861 例えば,重音テトの声みたいに「中の人の声に対するプライバシーに配慮しつつ,でも品質の高い音声DBが欲しい」みたいな矛盾する要求がありうるというのは,この分野を知らない人には想像もできないことだと思う.

2010-07-09 19:20:36
nwp8861 @nwp8861

@akinori_ito なるほど。。課題の提示が重要なのですね。私の認識では、それ以前の、ニーズの存在を提示することから始めるべきかなと思っていました。無償でDBを公開する一般人がある程度いるという事実自体、普通は想像できないのではないかと。

2010-07-09 19:42:21
Akinori Ito @akinori_ito

@nwp8861 ニーズの提示はもちろん重要です.ただ,それが簡単に満たせてしまうニーズではない,という場合に学問的面白さがあるので.

2010-07-09 19:55:05
nwp8861 @nwp8861

@akinori_ito 簡単ではない課題を解く所に研究の意義や面白さが生まれるわけですね。

2010-07-09 20:11:04