F0推定法「Harvest」

ノート用。 音声分析合成システム「WORLD」最後のピースとして、Harvestは元々統計音声合成向けとして「処理時間が長いで構わないから、対雑音性を高めて欲しい」という要請で着手し始めたモノ。 UTAU的いうと「(文字通り)究極の周波数表生成ツール」の作成の手助けになる可能性が秘めてる。 続きを読む
3
前へ 1 2 3 ・・ 15 次へ
M. Morise (忍者系研究者) @m_morise

ここまで来ると,これまでの平均から許容値を決めて,余計な手間を省くってのが現実的かな.

2016-06-06 17:53:42
M. Morise (忍者系研究者) @m_morise

よし,最後の案で試したのがいい感じにはまった.Harvestは一旦完成としよう.

2016-06-06 20:15:44
M. Morise (忍者系研究者) @m_morise

明らかに無茶な目標を見つけてしまうと楽しくなってしまうのが悪い性質w

2016-06-06 20:36:48

M. Morise (忍者系研究者) @m_morise

WORLDは,内部で計算コストが下がったり性能が上がったりとマイナーチェンジを繰り返しているので停滞しているわけじゃないんだけど,できることはそんなに変わっていない.

2016-07-09 23:28:18
M. Morise (忍者系研究者) @m_morise

すでにGitHubで先行公開しているけど,実時間合成を可能にしたWORLDについて7, 8月のSIGMUS夏シンポで具体的な内容について発表します. sigmus.jp/?page_id=3352

2016-07-09 23:29:36
M. Morise (忍者系研究者) @m_morise

とりあえず,WORLDプロジェクトは,現在作っているF0推定法Harvestと実時間分析機能を備えたTenebrariusWORLD(闇の世界)をリリースした段階で一旦完了とします.以後は,WORLDを使った応用研究の比重を増やす予定.

2016-07-09 23:43:44
M. Morise (忍者系研究者) @m_morise

ふーむ.Harvestの修正案を考えているが,難しいな.すでに世界トップ水準には達したけど,まだ改善できる余地がある.

2016-07-16 17:58:43
M. Morise (忍者系研究者) @m_morise

Deep Learning関連の研究員の公募要項を見ると,単年度更新のポスドクランクでハードル高すぎだよなぁ.条件満たす人なら常勤ポスト見つかりそうなものだけど,現状はポスドクでひしめき合ってるってことか.

2016-07-17 09:34:37
M. Morise (忍者系研究者) @m_morise

ちなみに,研究員クラスが学生指導,講義補助やっても教育歴とみなしてもらえないケースが多く,負担の割に旨味が少ないです.助教クラスが指導資格の無いランクの学生指導しても手当てももらえず業績としても書きにくいのと同じ.

2016-07-17 09:38:58
M. Morise (忍者系研究者) @m_morise

ふむ.Harvestで別の特徴量使ってみたら,行けそうな気配が漂ってきた.ただし圧倒的計算コストに涙を禁じ得ない.

2016-07-17 18:11:33
M. Morise (忍者系研究者) @m_morise

1 chの信号を700 chくらいに増やして各チャンネルについてアホほど時間のかかる処理を複数逐次処理するというアホ仕様.ただし,性能はかなり良い.

2016-07-17 18:12:45
M. Morise (忍者系研究者) @m_morise

Harvestは,統計的手法やオフラインで音声分析する側をサポートするための技術なんで,まぁ良いっちゃ良いんだけどエレガントさが足りない

2016-07-17 18:22:58
M. Morise (忍者系研究者) @m_morise

F0からFundamental Frequency (FF)の変更だと差が激しすぎるので,Fundamental oscillationからOを持ってくるんだったかな.確かに下付き文字にすれば差は少なくて発音の問題だけに落ちるので合理的.

2016-07-18 14:28:57
M. Morise (忍者系研究者) @m_morise

Harvest,ガチガチにチューニングした結果,無事音声DB使った評価で死亡.うーん.

2016-07-18 16:50:48
M. Morise (忍者系研究者) @m_morise

現状のバージョンで一旦完成にしたほうが良さそう.

2016-07-18 16:51:14
M. Morise (忍者系研究者) @m_morise

Harvestを諦めて別のプログラムを組む.こっちは非線形時変モデルだから,色々頭がよじれてくる.

2016-07-18 17:31:13

Keiichi Tokuda/徳田恵一 @KeiichiTokuda

STRAIGHTの生みの親である河原英紀先生をお迎えし,Googleでの1年間の滞在を通し開発された新音声分析法についてお話いただきます。どなたでも参加可能。8月10日(水)11:00~12:00 名古屋工業大学4号館1階ホール pic.twitter.com/H39be9mroC

2016-07-27 14:11:31
拡大
Hideki Kawahara: WAH (Work@Home)6x💉ppmppm @hidekikawahara

名古屋工業大学での講演資料「高品質音声処理を目的とした駆動音源の表現と分析について」(10/Aug./2016)のPDF版を以下にリンクしました。 wakayama-u.ac.jp/~kawahara//new… pic.twitter.com/R8Tv0jCJJp

2016-08-11 14:01:51
拡大
M. Morise (忍者系研究者) @m_morise

D4C論文のレビューが完了したとの通知が来た.Acceptしてくれよな~頼むよ~

2016-09-06 17:38:27
M. Morise (忍者系研究者) @m_morise

査読で「英文校正を受けろ」っていう条件は,Accept前提にしてくださいホント.ここ数回英文校正通してから出した論文に英文校正つけろってコメントが付いて,仕方がないので同じ業者にお願いして役職上の人にもう1回見てもらったのに,別の理由でRejectされたのである.

2016-09-06 18:12:02
M. Morise (忍者系研究者) @m_morise

しかも,そういうコメントを付ける人に限って「俺はネイティブではないがお前の英語は多分おかしい」みたいな書き方なのですよ...日本人著者だからってバイアスが入ってるんじゃないかと疑いたくなるw

2016-09-06 18:14:06
M. Morise (忍者系研究者) @m_morise

論文査読プロセスにおける英語の質については,エディター案件で良いと思うんだけどなぁ.あまりに酷いなら査読者に回さずRejectで,査読では英語の校正が必要か否かの二値を,Accept時かReject時のどちらかで付けるような感じ.

2016-09-06 18:28:48
前へ 1 2 3 ・・ 15 次へ