nezuq
@nezuq
音声も画像も波形データ。音声データは空気の振動を計測した2D波形。画像データは色ごとの濃淡を計測した3D波形。それらのデータから統計で使う箇所を抽出するのが特徴量抽出。その特徴量を使ってパターンマッチを仕掛けるのが、画像認識や音声認識。
2014-07-21 21:43:31
nezuq
@nezuq
音声認識で代表的なアルゴリズムは、隠れマルコフモデル(HMM、確率的非決定性オートマトン)。オートマトンのデータ構造だが、結果からはどのような状態遷移があったか分からない。だから、"隠れ"。
2014-07-21 21:54:13
nezuq
@nezuq
Juliusには元となったOSSが有ったらしい。 / 記述文法音声認識実行キット(旧Julian) shower.human.waseda.ac.jp/~m-kouki/pukiw…
2014-07-21 22:16:11
ひろあき@東武練馬は板橋固有の領土です
@h_sinohara
こんばんは。今日は勉強会運営おつかれさまでした。お聞きするの忘れちゃって今さらなんですが、かんたんな感想をブログに書いてもいいでしょうか。といってもどなたも本名出ませんが… @nezuq
2014-07-21 21:43:03