2014年5月 SLP101-NL216@東工大

情報処理学会 第101回音声言語情報処理研究会 (SIG-SLP) 第216回自然言語処理研究会 (SIG-NL) 合同研究発表会 のまとめです。
2
Mamoru B Komachi @mamoruk

5/22(木)と5/23(金)の情報処理学会自然言語処理研究会(NL研)では Ustream による研究発表の中継を試行します。興味のある方、お時間空けておいてください!ks.cs.titech.ac.jp/live/SLP101NL2… プログラムは以下 nl-ipsj.or.jp/NL216program.h…

2014-05-20 07:37:26
Akinori Ito @akinori_ito

NL/SLP研究会はじまりました #nlslp

2014-05-22 09:53:59
Akinori Ito @akinori_ito

発表はtsudaらないであとでまとめます。#nlslp

2014-05-22 10:01:03
Mamoru B Komachi @mamoruk

@conditional 報告ありがとうございます!(=´∀`)人(´∀`=) #nlslp #signl

2014-05-22 10:07:18
Koji Matsuda @conditional

遷移型parsingにおけるスタックの中身と,人間が感じる負荷の関係をしらべる #signl

2014-05-22 10:08:04
Shinnosuke Takamichi / 高道 慎之介 @forthshinji

SP研究会でも是非やってほしいなー。欲を言えば、人も映してほしい。 #nlslp

2014-05-22 10:12:50
Koji Matsuda @conditional

句構造解析においては,木のつくり方と記憶負荷の関係は調べられている (左分岐 = 右分岐 < 中央埋め込み) ただし,ボトムアップなアルゴリズムだと左分岐より右分岐の負荷が高くなってしまう.そこでleft-corner #signl

2014-05-22 10:14:03
Mamoru B Komachi @mamoruk

最初の発表は @nozyh さんの「係り受け解析における Left-corner 型遷移」です。いま前半部分ですが、係り受け解析のいいチュートリアルになっています。自然言語処理で使われているアルゴリズムが認知的にどうか、という話は興味深いですね。#nlslp #signl

2014-05-22 10:15:39
Mamoru B Komachi @mamoruk

Left-corner 型の構文解析器は基本的に句構造文法で作られていたので、依存文法を用いた構成方法を示し、多言語で評価。Arc-eager 型の解析器と比較して、Left-corner 型は言語普遍性(深いスタックが不要)が見られるという結果。 #nlslp #signl

2014-05-22 10:26:04
Shinnosuke Takamichi / 高道 慎之介 @forthshinji

@mamoruk 返信有難う御座います! スライドが小さくなってしまう事を完全に無視してしまっていました。単純に、人を映すことで発表の生生しさが増すので、観る側はより面白く感じるかと思いました。

2014-05-22 10:29:57
Mamoru B Komachi @mamoruk

@forthshinji そうですね、TED トークなんかを見ると、確かに本人の姿は重要だと思います。両方配信、アーカイブできればいいのですが、機材も人手も2倍必要なので、ベストエフォートで試行できればと思います。とりあえず研究発表なのでスライド中心で。改善案どしどし受付中です!

2014-05-22 10:33:24
Mamoru B Komachi @mamoruk

2件目は @u_carrot さんによる「スパース化を用いた k 近傍法におけるハブの軽減」です。 @smly さんの過去の研究の延長線ですね。次元の呪いをいかに克服するか、です。次元圧縮ではハブ(セントロイドの類似オブジェクト)は解消されないのです。 #nlslp #signl

2014-05-22 10:37:38
Mamoru B Komachi @mamoruk

セントロイドに近いオブジェクトはハブになりやすい。ベクトルのスパース化で回避。セントロイドとの距離を遠くするように更新。ハブを減らす先行研究の中心化は内積ベースの類似度尺度でないとダメだが、スパース化だと距離が使え、かつ疎ベクトルになる。対訳抽出で評価 #nlslp #signl

2014-05-22 10:52:50
Mamoru B Komachi @mamoruk

3件目は @akkikiki さんによる「盛り上がり時間帯におけるツイートの言語的特性の解析」。バースト的なツイートの言語的分析をSVMによる分類と Random Forest による特徴量解析、そして言語モデルによる調査を行った、という研究です。 #nlslp #signl

2014-05-22 11:09:18
ストレンジまるむし博士あるいはいかにして労働する事をやめコタツにもぐりこんだか @fjt

情報処理学会の自然言語ナンタラのプログラムでも見るか, と思ったんだが 全然みえん 声だけ聞こえる わら

2014-05-22 11:17:57
ストレンジまるむし博士あるいはいかにして労働する事をやめコタツにもぐりこんだか @fjt

@mamoruk む. きにしていただいてすみません chromium Version 32.0.1700.123 Debian jessie/sid (248368) です. flash の版がよくわかりません

2014-05-22 11:24:24
Mamoru B Komachi @mamoruk

@fjt なるほど。ありがとうございます。こちらでも、同じクライアントでも会場(東工大)のLAN経由だと画像が流れず、iPhone の回線経由だとつながるので、ネットワーク周りのなにかかもしれませんね……。もう少し調べてみます。

2014-05-22 11:34:48
Mamoru B Komachi @mamoruk

4件目は @tomo_wb さんによる「統計的機械翻訳を用いた英語文法誤り訂正の結果をリランキングすることで訂正性能の改善はできるか?」です。華麗な実験結果で学生奨励賞を取ろうとしたけど、結果が思わしくないので分析の報告のみだそうです(笑) #nlslp #signl

2014-05-22 11:38:58
あいうえお @ai_06_14

SLPのUst見てるんだけど、東工大で大砲ぶっ放した音みたいなの聞こえるんだけど。

2014-05-22 11:44:36
Mamoru B Komachi @mamoruk

@ai_06_14 いまも雷光と音が。。。光った瞬間音がするくらいの距離です(汗) #signl #sigslp #nlslp

2014-05-22 11:47:59
Mamoru B Komachi @mamoruk

統計的機械翻訳を用いて英作文の誤り訂正をするが、候補をスコアの上位10個まで出すと、トップより適切な候補が含まれていることが多いので、出力のリランキングを行うことで誤り訂正のさらなる改善をしたい。前置詞や時制は大きく改善しそう。語彙選択は効果低い #signl #nlslp

2014-05-22 11:51:49
Mamoru B Komachi @mamoruk

@langstat 論文を参照していないのですが、別でもいいんじゃないかと。もちろん、揃えた方が視聴者・読者は疑問を持たないので、特別な理由がなければ揃えた方がいいと思います(再実験が必要だったりして、気が乗らないことがよくありますが)。@akkikiki #signl

2014-05-22 11:56:19
Atsushi Fujita @akf

@tomo_wb まずはSMTのリランキングをそのままやってみることですかね.元々の訓練データの規模にもよるけど,EuroparlやNTCIRのデータでもBLEUが1ポイントくらいは上がっていました.個人的には前後文脈をどう素性にするかに関心があります.

2014-05-22 11:59:55
Mamoru B Komachi @mamoruk

情報処理学会自然言語処理研究会・音声言語情報処理研究会の中継は現在180名の視聴者。初めての試行なので、質疑は中継しませんが、後日質疑応答のメモは NL研のサイトで公開されます(数年前から始まりました)。 ustream.tv/channel/slp101… #signl #nlslp

2014-05-22 12:00:49