世界最高の坂本真綾音声認識エンジン

「第18回Webインテリジェンスとインタラクション研究会」 http://www.ieice.org/~wi2/ 13:00 - 14:00 セッションIII:「特別講演:コラボレーションメディアとしての Web サービス」 ・PodCastle: ユーザが音声認識誤りを訂正して「育てる」ことで 続きを読む
21
m.mat @m2nr

音声認識が有用な技術であることを知らしめたい by 後藤真孝 #sigwi2

2010-09-16 13:14:38
Yoshinori Hijikata @hijip

音楽が背景になっていても,音声認識ができているデモ #sigwi2

2010-09-16 13:15:53
Yoshinori Hijikata @hijip

音声認識分野のよくあるアプローチは,特定分野を対象にして大量にコーパスを集める.さらに書き起こしテキストを用意. #sigwi2

2010-09-16 13:17:39
Yoshinori Hijikata @hijip

Podcatleは,全分野を対象にしてコーパスは少なくてもユーザの力で突破する #sigwi2

2010-09-16 13:18:21
Yoshinori Hijikata @hijip

認識結果が簡単に直せるインタフェースを用意 #sigwi2

2010-09-16 13:20:01
中村聡史(BADUIの人) @nakamura

音声認識技術のため,Web2.0辞書から新しい言葉を自動学習.はてなキーワードから言葉を拾い,ニュースで使われ方を検証.また,簡単なインタフェースを用意することで,ユーザの認識誤り修正を可能に.さらにその修正をフィードバックとして利用.音声認識技術が向上 #sigwi2

2010-09-16 13:22:36
Yoshinori Hijikata @hijip

不特定多数のユーザに音声認識を助けてもらうというアプローチ #sigwi2

2010-09-16 13:23:03
m.mat @m2nr

ユーザに音声認識を育ててもらおう → 音声認識研究2.0 by 後藤真孝 #sigwi2

2010-09-16 13:23:53
Yoshinori Hijikata @hijip

音声認識の性能を理解→性能向上にユーザが貢献→ユーザの成功体験 というサイクルを回したい #sigwi2

2010-09-16 13:24:02
中村聡史(BADUIの人) @nakamura

ポジティブスパイラルが重要.ユーザが音声認識を体験することで性能改善,音声認識の性能向上にユーザが貢献,性能が向上したらそれがより良いユーザ体験に結びつく #sigwi2

2010-09-16 13:24:36
Yoshinori Hijikata @hijip

合っていると示したことは,どうやって機械学習に反映させているの? #sigwi2

2010-09-16 13:30:57
Yoshinori Hijikata @hijip

訂正達成率も表示して,ユーザの達成感を上げて,さらに訂正に参加してもらう. #sigwi2

2010-09-16 13:31:31
中村聡史(BADUIの人) @nakamura

PodCastleは2242件のMP3のうち,481948件が訂正されている.訂正数の伸びが鈍化しているので何とかしたい.で,ビデオポッドキャッスルや話者挿入,早送り,正例設定機能,達成率表示などに対応.URIも #sigwi2

2010-09-16 13:32:28
中村聡史(BADUIの人) @nakamura

他のユーザが同じエピソードを訂正していたときにその訂正が自動反映.協調訂正に有効.会議の議事録を複数人で作成するという使い方にもできそう #sigwi2

2010-09-16 13:33:23
Yoshinori Hijikata @hijip

情報保障という意味でも,使えるのね.ある人の講演がその日のうちにPodCastleが書き起こしし,誰かが修正もしてくれている #sigwi2

2010-09-16 13:33:41
中村聡史(BADUIの人) @nakamura

坂本真綾さんのPodCastコンテンツ「地図と手紙と恋のうた」は毎週ひたすら誰かによって音声訂正されている.そのコンテンツが蓄積されていったことによって,精度が飛躍的に向上している.坂本真綾に関する最高の音声認識を持っている #sigwi2

2010-09-16 13:40:02
中村聡史(BADUIの人) @nakamura

坂本真綾さんの週一コンテンツが毎週修正されたり,松浦亜弥さんのコンテンツが3日のうちにすべて修正されたり,読売の毎日のコンテンツが毎晩修正されたりなど凄いことが色々起こっていた #sigwi2

2010-09-16 13:41:47
Yoshinori Hijikata @hijip

坂本真綾ファン.すごいわ.ここまで機械学習を向上させるとは... #sigwi2

2010-09-16 13:37:46
Makoto IGUCHI (いぐっち) @igucci

WI2で坂本真綾の名前を聞こうとは… #sigwi2 *Tw*

2010-09-16 13:38:15
m.mat @m2nr

坂本真綾ファンの執念が機械学習の性能をあほほど向上させてしまったのだな。 #sigwi2

2010-09-16 13:39:35
Yoshinori Hijikata @hijip

産総研,やるじゃないか! #sigwi2

2010-09-16 13:42:01
ささぴー(Munehiko Sasajima) @munesasa

そもそも,話す速度がころころ変わる口語文をここまで認識できているのがすごいですね・・・ #sigwi2

2010-09-16 13:42:16
中村聡史(BADUIの人) @nakamura

産総研やるじゃないかと言われた! #sigwi2

2010-09-16 13:43:07
中村聡史(BADUIの人) @nakamura

なぜ訂正したくなるか.面白いから,貢献したいから,検索されてほしいから,誤認識を許せないから.好きな声をずっと聞いていたいというのも.個人的には誤認識を許せないってところになんとなく同意 #sigwi2

2010-09-16 13:44:16