2011/01/22 第4回 自然言語処理勉強会@東京

ATND http://atnd.org/events/11990 ハッシュタグ #tokyonlp 主宰者 @nokuno さんまとめ: 「第4回 #TokyoNLPhttp://togetter.com/li/92006 続きを読む
2
前へ 1 2 ・・ 9 次へ
暮夜満足 @mansuku

#TokyoNLP あーなんだかどっかでみた図 音声認識

2011-01-22 13:23:50
close_yutori @kimukou2628

#TokyoNLP 音声認識の概要) 音声データ(LPCM=>スペクトル)=>音声認識エンジン(TLP、MFC)<=音響モデル(HMM)、言語モデル(文書のゆう度)

2011-01-22 13:24:20
KUBOTA Yuji @sugarlife

音声データはMFCCではなくMFCなんだ。意味合いは一緒かな?#tokyonlp

2011-01-22 13:24:48
close_yutori @kimukou2628

#TokyoNLP ■音素=>モーラ=>単語 の流れ ・単語/モーラ/音素 例)赤い/あ、か、い/a,k,a,i

2011-01-22 13:27:40
takesako @takesako

参考文献:音声認識を紹介するページ MFCC #TokyoNLP http://recognition.web.fc2.com/

2011-01-22 13:28:33
KUBOTA Yuji @sugarlife

juliusの言語モデルだった。#TokyoNLP

2011-01-22 13:29:27
小濱久裕 @kohama

いいね☆RT @takesako: 参考文献:音声認識を紹介するページ MFCC #TokyoNLP http://recognition.web.fc2.com/

2011-01-22 13:30:21
Koichi Hamada @hamadakoichi

「音声認識のためのN-gram言語モデル」 ( @y_shindoh さん) #TokyoNLP

2011-01-22 13:30:22
Koichi Hamada @hamadakoichi

#TokyoNLP @y_shindoh さん、純粋数学の博士。非可換環。近い。

2011-01-22 13:30:42
close_yutori @kimukou2628

#tokyonlp ・フレミング、ハミング窓、高域強調フィルタ、FFT ・絶対値化、聴覚フィルタ(Mel Freq、Filter)、対数化、DCT ○電話回線を通すと音変わるので、電話音声用の専用フィルタを作成する =>研究としては自然音声を基本に考える

2011-01-22 13:33:32
KUBOTA Yuji @sugarlife

恐らく先ほどの言語モデルはこちらのエンジンのもの 音声認識エンジン julius : http://sourceforge.jp/projects/julius/ #TokyoNLP

2011-01-22 13:34:55
close_yutori @kimukou2628

#TokyoNLP 開始=>きつね・うどん カレー・うどん XXX ・そば という形で認識言語の繋がりを推測する。 言語モデルはNgramを使う

2011-01-22 13:36:16
takesako @takesako

音声認識では一般的に単語 3-Gram を使っていることが多い #TokyoNLP

2011-01-22 13:36:27
暮夜満足 @mansuku

#TokyoNLP 音声認識も2-gramがお得らしい

2011-01-22 13:37:01
close_yutori @kimukou2628

#TokyoNLP ・コーパス(単語例)=>count N-Gram(頻度1以上の物を対象)=>Ngram データベースにない語彙は認識がしづらくなる

2011-01-22 13:40:13
close_yutori @kimukou2628

#TokyoNLP 単語N-gram高精度化と0頻度問題) かたいことば(王道) と 柔らかい話し言葉(小手先パターン)<友人同士 で扱いが違う 王道:コーパスを集める 小手先:パラレルコーパスでコーパスから生成 国会の議事録:余計な言葉は落とすイメージ

2011-01-22 13:42:48
takesako @takesako

不自然言語処理っぽい話題が出たので、質問してみた。 #TokyoNLP

2011-01-22 13:44:58
KUBOTA Yuji @sugarlife

単語N-Gramの高精度化の王道パターンとしてコーパス収集を挙げられている。過去、敢えてコーパスを限定して前向きな言語モデルを作ろうとしたことを思い出した。例:惨事→賛辞 #TokyoNLP

2011-01-22 13:45:40
close_yutori @kimukou2628

#TokyoNLP 1)話題適応:LDA,PLSA 2)表現適応:CRL 3)未知N-gram:単語クラスタリングによる Class N-gram化

2011-01-22 13:47:32
close_yutori @kimukou2628

#TokyoNLP 音声合成で歌を歌わせる 等の技術で小手先パターンは使われているかも との事 関西語は難しい!=>標準語 に直して認識させる手も

2011-01-22 13:48:45
sano66 @sano66

RT @takesako: 音声認識のためのN-gram言語モデル by @y_shindohさんの発表開始 #TokyoNLP http://atnd.org/events/11990

2011-01-22 13:52:33
前へ 1 2 ・・ 9 次へ