音声認識のためのN-gram言語モデル by @y_shindohさんの発表開始 #TokyoNLP http://atnd.org/events/11990
2011-01-22 13:18:05#TokyoNLP Winアプリ=>機械メーカでロボット作成(音声認識エンジン開発)=>KDDIで音声認識の応用研究されている という方
2011-01-22 13:20:55#TokyoNLP 音声認識の概要) 音声データ(LPCM=>スペクトル)=>音声認識エンジン(TLP、MFC)<=音響モデル(HMM)、言語モデル(文書のゆう度)
2011-01-22 13:24:20#TokyoNLP ■音素=>モーラ=>単語 の流れ ・単語/モーラ/音素 例)赤い/あ、か、い/a,k,a,i
2011-01-22 13:27:40参考文献:音声認識を紹介するページ MFCC #TokyoNLP http://recognition.web.fc2.com/
2011-01-22 13:28:33いいね☆RT @takesako: 参考文献:音声認識を紹介するページ MFCC #TokyoNLP http://recognition.web.fc2.com/
2011-01-22 13:30:21#tokyonlp ・フレミング、ハミング窓、高域強調フィルタ、FFT ・絶対値化、聴覚フィルタ(Mel Freq、Filter)、対数化、DCT ○電話回線を通すと音変わるので、電話音声用の専用フィルタを作成する =>研究としては自然音声を基本に考える
2011-01-22 13:33:32恐らく先ほどの言語モデルはこちらのエンジンのもの 音声認識エンジン julius : http://sourceforge.jp/projects/julius/ #TokyoNLP
2011-01-22 13:34:55#TokyoNLP 開始=>きつね・うどん カレー・うどん XXX ・そば という形で認識言語の繋がりを推測する。 言語モデルはNgramを使う
2011-01-22 13:36:16#TokyoNLP ・コーパス(単語例)=>count N-Gram(頻度1以上の物を対象)=>Ngram データベースにない語彙は認識がしづらくなる
2011-01-22 13:40:13#TokyoNLP 単語N-gram高精度化と0頻度問題) かたいことば(王道) と 柔らかい話し言葉(小手先パターン)<友人同士 で扱いが違う 王道:コーパスを集める 小手先:パラレルコーパスでコーパスから生成 国会の議事録:余計な言葉は落とすイメージ
2011-01-22 13:42:48