Siriとこれからの音声研究

音声対話研究終了のお知らせ
4
にしにし(手筒花火師(1回)) @nisinisijp

【音声対話研究終了のお知らせ】 Siri日本語版、本日リリース…なんてね

2012-03-08 03:17:10
@heigazen

音声認識・合成・対話がプラットフォームに載ってユーザに提供される時代になりました。音声研究者と研究テーマははどー変わっていくのかなぁ RT @nisinisijp: 【音声対話研究終了のお知らせ】 Siri日本語版、本日リリース…なんてね

2012-03-08 04:52:44
にしにし(手筒花火師(1回)) @nisinisijp

音声認識・合成・対話技術は、「実用化」から「大衆化」に! RT @heigazen: 音声認識・合成・対話がプラットフォームに載ってユーザに提供される時代になりました。音声研究者と研究テーマははどー変わっていくのかなぁ

2012-03-08 11:09:55
@heigazen

大衆化すると差別化が難しそうですね RT @nisinisijp 音声認識・合成・対話技術は、「実用化」から「大衆化」に! RT 音声認識・合成・対話がプラットフォームに載ってユーザに提供される時代になりました。音声研究者と研究テーマははどー変わっていくのかなぁ

2012-03-08 11:17:16
Akinori Ito @akinori_ito

何か全く違う発想が必要だと思うのだけど,それが何かは思いつかない RT @heigazen: 大衆化すると差別化が難しそうですね RT @nisinisijp 音声認識・合成・対話技術は、「実用化」から「大衆化」に

2012-03-08 11:25:50
にしにし(手筒花火師(1回)) @nisinisijp

なるほど。私の中では、ネットワーク屋さんが大衆化の成功イメージですが、ビジネスも研究も活発だよね。基盤技術だし、マネできないかな。 RT @heigazen: 大衆化すると差別化が難しそうですね RT @nisinisijp 音声認識・合成・対話技術は、「実用化」から「大衆化」に

2012-03-08 11:27:18
@heigazen

. @akinori_ito @nisinisijp 計算能力・データ量がケタ違いのクラウド型音声認識・合成・対話システムに,性能で対抗するのは厳しいでしょうね.むしろ,これらをインフラとして活用したHMIとか,より上位層の研究に少しずつシフトしていくんでしょうか.

2012-03-08 11:38:29
@heigazen

. @nisinisijp 無線ネットワーク業界の友人と話したことありますが,大きな違いは標準化の有無でしょうか.ネットワーク業界は標準化がありますが,音声業界では厳しいかと.

2012-03-08 11:46:22
にしにし(手筒花火師(1回)) @nisinisijp

仲良くお行儀良く作った標準化は結局うまくいかないから、だれかがデファクト作っちゃって乗っかるのがいいと思う。そういう役割でGoogleに期待している。 RT @heigazen: 大きな違いは標準化の有無でしょうか.ネットワーク業界は標準化がありますが,音声業界では厳しいかと.

2012-03-08 11:53:56
にしにし(手筒花火師(1回)) @nisinisijp

. @heigazen さんに前から聞きたかったんだけど、ASJとかで、みんなが議論していることで、Google社内では、実はとっくの昔に解決しちゃってるんだけど、公表はしていないことって多い?やっぱり、Google社内は、ほかの社会より10年ぐらい先を行ってる感じ?

2012-03-08 11:49:49
@heigazen

@nisinisijp どーなんでしょう?笑 私もよく分かりませんが,たぶんどこもおんなじようなことで悩んでると思いますよ.

2012-03-08 11:55:08
Shingo.Y @shingoz

@nisinisijp @heigazen 結局世の中そうやってイノベーティブな事が生まれて行くんだろうなと思う今日この頃です(^^;

2012-03-08 12:47:55
H. Nishizaki/西崎博光 @hiro32_n

Siriの日本語対応で、音声認識便利〜というツイートが多くて、音声認識の便利さが世の中に知れ渡って嬉しい反面、次の研究テーマに頭を抱えざるをえない現実。

2012-03-08 17:18:00
@heigazen

@hiro32_n これからプロポーザルを書く際は、あれが前提になるわけですもんね。厳しいですよね。

2012-03-08 17:57:56
Masayuki Suzuki @szuk_m

Siri の噂話を見た:【音声合成の質がよくない】→音声合成は多言語対応の難易度高。いろんなノウハウが必要。まだアジア言語はアジア圏の会社の合成器の質の方が上。【認識や対話の研究オワタ】→NLPのトップカンファとISやICASSPを見比べると、やることありすぎて泣けると思う

2012-03-08 17:48:07
@heigazen

@dyxyju でも、お役人さんはそーゆーの分かってくれないわけで…。

2012-03-08 18:02:03
Masayuki Suzuki @szuk_m

@heigazen お役人さんが分かってくれないというのは、今後音声工学に対する予算がつきづらくなるということですか?

2012-03-08 18:09:00
H. Nishizaki/西崎博光 @hiro32_n

@heigazen そうなんですよね。GoogleさんやApple、Nuanceで良いのでは、という意見がでてくるのでしょうね…

2012-03-08 18:12:55
@heigazen

@dyxyju これまでと同じようなプロポーザルだと「もうできてるよね」と言われかねないと思います。音声分野自体は、実用化されて活発になってるので、予算を取りづらくなることはないかな、と思っています。

2012-03-08 18:15:21
@heigazen

@hiro32_n 音声インタフェースを実現するための基盤技術の研究より、それを使って何をする、の研究の方に予算が付きやすくなる気はしますね。

2012-03-08 18:21:47
Masayuki Suzuki @szuk_m

@heigazen なるほど。Siri は消費者の注目は集めてますが、直接的には儲かっていないと思います。音声がペイする分野は BtoB 分野にあると考えていて、個人的には研究分野として(Siri以下の)コンシューマ向け分野がやや衰退し、他に予算が流れるのは、個人的には歓迎です。

2012-03-08 18:24:02
Masayuki Suzuki @szuk_m

@heigazen 基礎研究に関しては、@heigazen さんもおっしゃるとおり、分野そのものが活発化するので、予算がつきづらくなることはないでしょうし。

2012-03-08 18:25:00
H. Nishizaki/西崎博光 @hiro32_n

@heigazen そうだと思います。私はすでに音声インタフェース利用にシフトしていますが、音声の応用を考えた時には、いろんな問題が明らかになってきますので、そこで基礎的なことをやったり、特許とったりできそうです。

2012-03-08 18:40:13