シンセサイザー?

兎灯さん(@usgb1221)とこぬこさん(@konuko22)の会話が発展 まるさん(@maruLoop)も会話に加わる。 音声合成は難しい・・・
0
兎灯 @usgb1221

ところでアクエストークの声がどうなってるのか私は知らないんですが、あれには元になった声があるの?それとも何もないところから「声に聞こえる音」を作りだしたの?中の人がいないって事は後者なのかしらすげえと思ってたけど←

2010-10-16 16:15:31
兎灯 @usgb1221

@konuko22 なんかすげえの出てきた!!ホホウ・・・ じゃあやっぱ「中の人はいない」って認識はそういう意味なのか \自分の日本語能力が足りない/

2010-10-16 16:22:40
兎灯 @usgb1221

\全ての動物音源及びデ4の他の3人に謝罪します/ RT @seto03: 中の人がいない音源… んにゃん? 中の「人」はいないよね

2010-10-16 16:23:54
兎灯 @usgb1221

\全ての物差し及び瓶笛音源及び(ry

2010-10-16 16:24:16
こぬこ⛩️ @konuko73

@usgb1221 あくえすさんのページに書いてあった!→http://www.a-quest.com/technology/technology1.html サイトの冒頭に「声優やスタジオを用意する必要がない」って書いてあるから、やっぱ中の人はいないんだろうね

2010-10-16 16:24:23
兎灯 @usgb1221

「音源」っていうくくりだと人の声じゃないの多すぎたわ_ノ乙(、ン、)_

2010-10-16 16:24:52
兎灯 @usgb1221

@konuko22 んにゃ、それは「人を呼んできて録音させなくても音声を出力できる」って意味で、ボカロみたいに「藤田さんを呼んでこなくてもミクの歌声を出力できる」と同義かな?とオモタ 「音声を短い単位にした音声素片を用意しておき」、って書いてあるから元の音声はあるって事かな…??

2010-10-16 16:28:58
こぬこ⛩️ @konuko73

@usgb1221 おうふw俺にも日本語力がこい!wん…?じゃあ中の人いるのかしら…?

2010-10-16 16:30:29
兎灯 @usgb1221

@konuko22 なんだろう…中の人、というか少なくともサンプルデータというか、何かしら「元になった物」はあるんだろうねえ… それがある1人の声なのか、それとももしかしたら大勢の人が同時に話した声なのか、または…って辺りは判断できないけど

2010-10-16 16:32:39
こぬこ⛩️ @konuko73

@usgb1221 ふむん…。音声合成にもいろんな種類があって難しいのう…

2010-10-16 16:34:37
兎灯 @usgb1221

@konuko22 うむー UTAUみたいな単純な切り貼りを脱してしまうと私にはもうわからん/(^o^)\

2010-10-16 16:35:49
こぬこ⛩️ @konuko73

@usgb1221 うぬ…俺はその切り貼りすらよくわかってないけどな!ボカロとかv.Connectはシンセサイザーなんだよね??

2010-10-16 16:40:29
兎灯 @usgb1221

@konuko22 もうボカロとかv.Connectからわかってないwwww/(^o^)\切り貼りはもともとあるものを繋ぐ、UTAUはそれに「伸ばす」(その他フラグと音量調整、ピッチ調整)機能が付いたもの、だけどボカロは…ってなると…音素の分解と再構築でもしてんのかアレ ワカンネ

2010-10-16 16:47:09
こぬこ⛩️ @konuko73

@usgb1221 まずシンセがなんなのかを理解する必要がありそうだ…orzとりあえずボカロは声質とかの話とはまた別で音質が良いよね!v.Connectも!!

2010-10-16 16:51:18
maru621 @maruloop

こぬこたんとうさぎびぶべぼさんが面白そうな話をしている。

2010-10-16 16:53:09
こぬこ⛩️ @konuko73

@maruLoop 先生!シンセがよくわかりません!!主にボカロとUTAUの違いの話だったんだけど…www

2010-10-16 16:56:15
maru621 @maruloop

音声波形を波形のまま《時間領域》加工、音声波形をスペクトルに変換して《周波数領域》加工。この二つに分けたりも出来るよね。

2010-10-16 16:57:37
maru621 @maruloop

@konuko22 シンセサイザー、日本語では合成器。音声に関していえば、音声を合成するもの。今メジャーなシンセの原理としては、元の音を用意して、その音を削ることで好きな音を掘り出す手法。木材から像を掘り出すイメージ。

2010-10-16 17:00:48
maru621 @maruloop

マイナーな手法としては、細かな音をどんどんくっつけるもの。先に部品だけ作って、接着剤で合体させるイメージ。

2010-10-16 17:02:07
maru621 @maruloop

どういう形に削るか、もしくは盛るか、というのが、いわゆるフィルタのお仕事。Flagsとか。

2010-10-16 17:03:43
maru621 @maruloop

んで、ボカロやUTAUやWORLDの合成手法の違いについては、論文を各自参照くださいw

2010-10-16 17:05:54
maru621 @maruloop

んま、理論を説明する時は、こういうものだよ、というんじゃなくて、こういう理由でこうしてるんだよ、ってしないといけないのだけれど。理解が足りない。

2010-10-16 17:15:41
こぬこ⛩️ @konuko73

@maruLoop 音質の劣化でレンジが狭まるってことはあるの??

2010-10-16 17:24:58