世界最高の坂本真綾音声認識エンジン
音声認識分野のよくあるアプローチは,特定分野を対象にして大量にコーパスを集める.さらに書き起こしテキストを用意. #sigwi2
2010-09-16 13:17:39音声認識技術のため,Web2.0辞書から新しい言葉を自動学習.はてなキーワードから言葉を拾い,ニュースで使われ方を検証.また,簡単なインタフェースを用意することで,ユーザの認識誤り修正を可能に.さらにその修正をフィードバックとして利用.音声認識技術が向上 #sigwi2
2010-09-16 13:22:36ポジティブスパイラルが重要.ユーザが音声認識を体験することで性能改善,音声認識の性能向上にユーザが貢献,性能が向上したらそれがより良いユーザ体験に結びつく #sigwi2
2010-09-16 13:24:36PodCastleは2242件のMP3のうち,481948件が訂正されている.訂正数の伸びが鈍化しているので何とかしたい.で,ビデオポッドキャッスルや話者挿入,早送り,正例設定機能,達成率表示などに対応.URIも #sigwi2
2010-09-16 13:32:28他のユーザが同じエピソードを訂正していたときにその訂正が自動反映.協調訂正に有効.会議の議事録を複数人で作成するという使い方にもできそう #sigwi2
2010-09-16 13:33:23情報保障という意味でも,使えるのね.ある人の講演がその日のうちにPodCastleが書き起こしし,誰かが修正もしてくれている #sigwi2
2010-09-16 13:33:41坂本真綾さんのPodCastコンテンツ「地図と手紙と恋のうた」は毎週ひたすら誰かによって音声訂正されている.そのコンテンツが蓄積されていったことによって,精度が飛躍的に向上している.坂本真綾に関する最高の音声認識を持っている! #sigwi2
2010-09-16 13:40:02坂本真綾さんの週一コンテンツが毎週修正されたり,松浦亜弥さんのコンテンツが3日のうちにすべて修正されたり,読売の毎日のコンテンツが毎晩修正されたりなど凄いことが色々起こっていた #sigwi2
2010-09-16 13:41:47そもそも,話す速度がころころ変わる口語文をここまで認識できているのがすごいですね・・・ #sigwi2
2010-09-16 13:42:16なぜ訂正したくなるか.面白いから,貢献したいから,検索されてほしいから,誤認識を許せないから.好きな声をずっと聞いていたいというのも.個人的には誤認識を許せないってところになんとなく同意 #sigwi2
2010-09-16 13:44:16