<a class="info_title emj" href="https://togetter.com/li/608954" title="入力メソッドワークショップ 2013">入力メソッドワークショップ 2013

明日は #IM2013 のみ会です。

2013-12-27 23:40:32

#IM2013 解錠係り到着ナウ。お昼は不在の予定ナウ。

2013-12-28 11:18:21

#IM2013 解錠係り団 ready なう。

2013-12-28 12:39:47

市バスは激混みだったが、清水寺を過ぎたら普通になった。1時半までには会場に着けるかな？京大は1年ぶりだろうか。#IM2013

2013-12-28 12:54:46

みずもともや @tomo_wb

京阪乗り込んだ！1時半前には出町柳　#IM2013

2013-12-28 13:14:24

TOKUNAGA Hiroyuki @tkng

入口に着きました〜 #IM2013

2013-12-28 13:49:38

入力メソッドワークショップ #IM2013 始まりました〜。最初はNAIST久保さんによる、Pronunciation Estimation with Online Discriminative Learning using Second Order Statisticsです！

2013-12-28 14:09:19

係り受け解析でもMIRAやったなぁ。

2013-12-28 14:10:32

やったというか見た。

2013-12-28 14:10:38

皆MIRA大好き。

2013-12-28 14:10:49

めっちゃ面白い。

2013-12-28 14:13:15

#IM2013 面白いなぁ。

2013-12-28 14:16:27

音声認識や入力メソッドと関連する発音推定のタスクを教師あり学習（実際はMIRAで学習）したいが、ウェブから抽出したデータなどノイジーなデータに対して弱いという問題がある。そこでノイズに対して頑健な AROW を使って学習する。#IM2013

2013-12-28 14:16:58

ガウシアンでいじりつつ重みを学習するのすごい。#IM2013

2013-12-28 14:22:30

発音推定（grapheme to phoneme）タスクでは CRF より構造化 MIRA のほうがいい。理由はどうやら発音推定タスクでは書字素の ngram の n が7グラムとか9グラムとか使うので、グラフが巨大になるためらしい。#IM2013

2013-12-28 14:34:22

2番目は京大の高橋さんによる、方言に対応した仮名漢字変換。「子ども向け甲冑ことや」となってしまう入力を「かっちゅうことや」と変換したい。MS-IMEやGoogle日本語入力、iOSではダメらしい。提案手法では変換できる。 #IM2013

2013-12-28 14:52:49

入力メソッドワークショップ #IM2013 京大の高橋さん「方言に対応した仮名漢字変換」

2013-12-28 14:53:42

#IM2013 東山陽は広島なのか問題。まぁ、広島は具体的にどこを指してるのか、ですな。

2013-12-28 14:53:45

近畿、肥筑、北奥羽、東山陽方言を対象に500文ずつ標準語とそれに対応する方言コーパスを用意。日本語書き言葉コーパスに単に追加するだけで、それらの方言の変換精度は向上。標準語の変換精度も大きく下がらない。ただし山陽方言だけはほとんど向上しない。長音を多用するせいか。#IM2013

2013-12-28 15:02:48

そうじゃろか。 #IM2013

2013-12-28 15:04:51

今回は単純に標準語コーパスに方言コーパスを足しているが、方言に対する分野適応の問題なので、標準語言語モデルと方言の言語モデルを作って線形補間する最適なパラメータを開発セットで推定する、というのがスタンダード。東山陽方言はやはり謎じゃけぇ。 #IM2013

2013-12-28 15:11:28

東山陽方言は謎なんじゃろか。#IM2013

2013-12-28 15:12:28