今日はストレッチゴールについてもう少し掘り下げていこうと思います(*´∀`*) 特にITAコーパスについて見て行きます(」*´∇`)」 greenfunding.jp/pub/projects/3… pic.twitter.com/YIXkG7X1Nj
2020-07-08 15:40:43しゃべる音声合成では2つの音源の作り方があります(。・∀・。) ①自然言語を大量にしゃべってそのデータから合成用の音源を作る ②いろんな音素を網羅した文章を読んで音源を作る
2020-07-08 15:43:11①のほうだと本当にたくさん、だいたい50時間分くらいの文章を読む必要があります。 ②の方だと1時間弱の文章量でなんとかなるので、3から5時間くらいで収録ができます(*^─^*)
2020-07-08 15:44:26ところで②の方の音素を網羅した文章ですが、一般的に使われているのがATR503文(ATR-Bセット)といわれているもので、503文章を読み上げる物になります(*゚∀゚*)
2020-07-08 15:45:27ATR503文ですが非常に良く出来てまして、結構読みやすいのにいろんな音素をカバーしているというものになります(*´∀`*) ATR社が管理している著作物ですので勝手に使うことはできません(♡ >ω< ♡)
2020-07-08 15:46:37そこで、ATR503文に代わる「誰でも使える音素を網羅した文章」を作ろう、というのがイタコ姉さまクラウドファンディングの第2ゴールでやることの1つとなっています(`・∀・´)ノ
2020-07-08 15:47:24誰でも使える、というのは「権利関係のこととか気にせず」「公開範囲とかも自由に」ということを指します。 なので、パブリックドメインもしくはCC0(クリエイティブコモンズでの権利放棄)にしようと思っています(´◡`♥)
2020-07-08 15:49:28パブリックドメインもしくはCC0にすると、文章の変更、改編も自由、読んだ物を公開してもいいし、派生した物を販売してもいいし、無料で公開してもいいというフリーダムな状況になります||*´∀`)。o○(ワクワク) つまり、ホントに自由に使えるようになります(♡ >ω< ♡)
2020-07-08 15:51:06そして、みんながITAコーパス(無料でみんなで使える音素を網羅した文章)を使い始めると、そのデータ自体が蓄積してさらに分析精度なども増していきます(*´∀`*)
2020-07-08 15:51:56また、同じ文章であれば誰かが「フリーの音声合成ソフト」を作ってその文章を読み上げた物を入れたら、音声合成ができあがる、みたいなUTAUのしゃべる音声合成版ができるような世界が作れるかもしれません(๑´ڡ`๑)
2020-07-08 15:53:25また、研究する人にしても「せっかくITAコーパスで収録した音源なので公開しちゃおうかな」とかがでてくると良質な音声のデータが増えていきます(〃'▽'〃)
2020-07-08 15:55:06声の綺麗な声優さんとか声のカッコいい声優さんがITAコーパスを読み上げた文章を販売する、ということも可能になります(╹▽╹)و✧
2020-07-08 15:55:46という感じで「みんなが自由に使える音素を網羅した文章」ってこれくらいに大事な物でして、それをイタコ姉さまのクラウドファンディグで作ろう、というのが次の目標になっていますヾ(❀╹◡╹)ノ゙
2020-07-08 15:56:30第2ゴールを突破すると、ITAコーパスを作ることになりますので(。・∀・。)声の世界の研究に一般の人も入って来やすい環境ができます(*•̀ᴗ•́*)و ̑̑ そして、一般の人が入ることでデータが蓄積でき、研究も進むのではないか、と思っています╭(๑•̀ㅂ•́)و
2020-07-08 15:58:13音素を網羅した文章を「自由に使える形」で公開する、というのはこういう革命を起こす可能性がありますので、イタコ姉さまの第2ゴールに向けて、ぜひぜひ支援、そして応援をお願いします(๑•̀ㅁ•́๑)✧ greenfunding.jp/pub/projects/3…
2020-07-08 15:59:11だいたいそういう感じで名前をITAコーパスにしました(〃'▽'〃) パブリックドメインになってもイタコ姉さまに支援してくださったみなさんの偉業が残るように、との思いがこもってます(」*´∇`)」 twitter.com/piko_fox/statu…
2020-07-08 16:34:42