第4回 #TokyoNLP

自然言語処理勉強会 http://atnd.org/events/11990
3
close_yutori @kimukou2628

#TokyoNLP 会場に着いた。まだ集合待ち状態かな?

2011-01-22 13:08:15
close_yutori @kimukou2628

音声認識のためのN-gram言語モデル by @y_shindohさん 開始 #tokyonlp

2011-01-22 13:17:51
takesako @takesako

音声認識のためのN-gram言語モデル by @y_shindohさんの発表開始 #TokyoNLP http://atnd.org/events/11990

2011-01-22 13:18:05
Yoh Okuno @yoh_okuno

@y_shindoh さんはかなり前から準備していただいていました。 #tokyonlp

2011-01-22 13:18:34
close_yutori @kimukou2628

#TokyoNLP Winアプリ=>機械メーカでロボット作成(音声認識エンジン開発)=>KDDIで音声認識の応用研究されている という方

2011-01-22 13:20:55
暮夜満足 @mansuku

#TokyoNLP あーなんだかどっかでみた図 音声認識

2011-01-22 13:23:50
close_yutori @kimukou2628

#TokyoNLP 音声認識の概要) 音声データ(LPCM=>スペクトル)=>音声認識エンジン(TLP、MFC)<=音響モデル(HMM)、言語モデル(文書のゆう度)

2011-01-22 13:24:20
KUBOTA Yuji @sugarlife

音声データはMFCCではなくMFCなんだ。意味合いは一緒かな?#tokyonlp

2011-01-22 13:24:48
close_yutori @kimukou2628

#TokyoNLP ■音素=>モーラ=>単語 の流れ ・単語/モーラ/音素 例)赤い/あ、か、い/a,k,a,i

2011-01-22 13:27:40
takesako @takesako

参考文献:音声認識を紹介するページ MFCC #TokyoNLP http://recognition.web.fc2.com/

2011-01-22 13:28:33
KUBOTA Yuji @sugarlife

juliusの言語モデルだった。#TokyoNLP

2011-01-22 13:29:27
小濱久裕 @kohama

いいね☆RT @takesako: 参考文献:音声認識を紹介するページ MFCC #TokyoNLP http://recognition.web.fc2.com/

2011-01-22 13:30:21
Koichi Hamada @hamadakoichi

「音声認識のためのN-gram言語モデル」 ( @y_shindoh さん) #TokyoNLP

2011-01-22 13:30:22
Koichi Hamada @hamadakoichi

#TokyoNLP @y_shindoh さん、純粋数学の博士。非可換環。近い。

2011-01-22 13:30:42
close_yutori @kimukou2628

#tokyonlp ・フレミング、ハミング窓、高域強調フィルタ、FFT ・絶対値化、聴覚フィルタ(Mel Freq、Filter)、対数化、DCT ○電話回線を通すと音変わるので、電話音声用の専用フィルタを作成する =>研究としては自然音声を基本に考える

2011-01-22 13:33:32
KUBOTA Yuji @sugarlife

恐らく先ほどの言語モデルはこちらのエンジンのもの 音声認識エンジン julius : http://sourceforge.jp/projects/julius/ #TokyoNLP

2011-01-22 13:34:55
close_yutori @kimukou2628

#TokyoNLP 開始=>きつね・うどん カレー・うどん XXX ・そば という形で認識言語の繋がりを推測する。 言語モデルはNgramを使う

2011-01-22 13:36:16
takesako @takesako

音声認識では一般的に単語 3-Gram を使っていることが多い #TokyoNLP

2011-01-22 13:36:27
暮夜満足 @mansuku

#TokyoNLP 音声認識も2-gramがお得らしい

2011-01-22 13:37:01
close_yutori @kimukou2628

#TokyoNLP ・コーパス(単語例)=>count N-Gram(頻度1以上の物を対象)=>Ngram データベースにない語彙は認識がしづらくなる

2011-01-22 13:40:13
close_yutori @kimukou2628

#TokyoNLP 単語N-gram高精度化と0頻度問題) かたいことば(王道) と 柔らかい話し言葉(小手先パターン)<友人同士 で扱いが違う 王道:コーパスを集める 小手先:パラレルコーパスでコーパスから生成 国会の議事録:余計な言葉は落とすイメージ

2011-01-22 13:42:48
takesako @takesako

不自然言語処理っぽい話題が出たので、質問してみた。 #TokyoNLP

2011-01-22 13:44:58
1 ・・ 6 次へ