Togetter/min.tを安心してお使い頂くためのガイドラインを公開しました。
編集可能 編集部イチオシ
2020年7月8日

音声合成用の収録台本を作る話

音声合成用の台本を公開したい!という話です
26
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

今日はストレッチゴールについてもう少し掘り下げていこうと思います(*´∀`*) 特にITAコーパスについて見て行きます(」*´∇`)」 greenfunding.jp/pub/projects/3… pic.twitter.com/YIXkG7X1Nj

2020-07-08 15:40:43
拡大
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

しゃべる音声合成では2つの音源の作り方があります(。・∀・。) ①自然言語を大量にしゃべってそのデータから合成用の音源を作る ②いろんな音素を網羅した文章を読んで音源を作る

2020-07-08 15:43:11
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

①のほうだと本当にたくさん、だいたい50時間分くらいの文章を読む必要があります。 ②の方だと1時間弱の文章量でなんとかなるので、3から5時間くらいで収録ができます(*^─^*)

2020-07-08 15:44:26
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

ところで②の方の音素を網羅した文章ですが、一般的に使われているのがATR503文(ATR-Bセット)といわれているもので、503文章を読み上げる物になります(*゚∀゚*)

2020-07-08 15:45:27
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

ATR503文ですが非常に良く出来てまして、結構読みやすいのにいろんな音素をカバーしているというものになります(*´∀`*) ATR社が管理している著作物ですので勝手に使うことはできません(♡ >ω< ♡)

2020-07-08 15:46:37
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

そこで、ATR503文に代わる「誰でも使える音素を網羅した文章」を作ろう、というのがイタコ姉さまクラウドファンディングの第2ゴールでやることの1つとなっています(`・∀・´)ノ

2020-07-08 15:47:24
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

誰でも使える、というのは「権利関係のこととか気にせず」「公開範囲とかも自由に」ということを指します。 なので、パブリックドメインもしくはCC0(クリエイティブコモンズでの権利放棄)にしようと思っています(´◡`♥)

2020-07-08 15:49:28
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

パブリックドメインもしくはCC0にすると、文章の変更、改編も自由、読んだ物を公開してもいいし、派生した物を販売してもいいし、無料で公開してもいいというフリーダムな状況になります||*´∀`)。o○(ワクワク) つまり、ホントに自由に使えるようになります(♡ >ω< ♡)

2020-07-08 15:51:06
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

そして、みんながITAコーパス(無料でみんなで使える音素を網羅した文章)を使い始めると、そのデータ自体が蓄積してさらに分析精度なども増していきます(*´∀`*)

2020-07-08 15:51:56
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

また、同じ文章であれば誰かが「フリーの音声合成ソフト」を作ってその文章を読み上げた物を入れたら、音声合成ができあがる、みたいなUTAUのしゃべる音声合成版ができるような世界が作れるかもしれません(๑´ڡ`๑)

2020-07-08 15:53:25
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

また、研究する人にしても「せっかくITAコーパスで収録した音源なので公開しちゃおうかな」とかがでてくると良質な音声のデータが増えていきます(〃'▽'〃)

2020-07-08 15:55:06
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

声の綺麗な声優さんとか声のカッコいい声優さんがITAコーパスを読み上げた文章を販売する、ということも可能になります(╹▽╹)و✧

2020-07-08 15:55:46
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

という感じで「みんなが自由に使える音素を網羅した文章」ってこれくらいに大事な物でして、それをイタコ姉さまのクラウドファンディグで作ろう、というのが次の目標になっていますヾ(❀╹◡╹)ノ゙

2020-07-08 15:56:30
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

第2ゴールを突破すると、ITAコーパスを作ることになりますので(。・∀・。)声の世界の研究に一般の人も入って来やすい環境ができます(*•̀ᴗ•́*)و ̑̑ そして、一般の人が入ることでデータが蓄積でき、研究も進むのではないか、と思っています╭(๑•̀ㅂ•́)و

2020-07-08 15:58:13
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

音素を網羅した文章を「自由に使える形」で公開する、というのはこういう革命を起こす可能性がありますので、イタコ姉さまの第2ゴールに向けて、ぜひぜひ支援、そして応援をお願いします(๑•̀ㅁ•́๑)✧ greenfunding.jp/pub/projects/3…

2020-07-08 15:59:11
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko

だいたいそういう感じで名前をITAコーパスにしました(〃'▽'〃) パブリックドメインになってもイタコ姉さまに支援してくださったみなさんの偉業が残るように、との思いがこもってます(」*´∇`)」 twitter.com/piko_fox/statu…

2020-07-08 16:34:42

コメント

kokuju @kokuju 2020年7月9日
あらゆる現実をすべて自分の方へねじ曲げなくてもよくなるのか
0
東北ずん子(公式)💚AIで歌う準備中!! @t_zunko 2020年7月9日
kokuju 一週間ばかりニューヨークを取材しなくてもよくなります(*'∀'*)
2