忍殺語を形態素解析する為の、中黒「・」の処理方法

忍殺語を品詞分解する際の、中黒「・」の解釈の仕方についてまとめました。
9
Reffi @tomo1109_Reffi

ん、とりあえず想定した通りの挙動か。 http://t.co/ToweH68PxB

2014-04-30 22:43:30
拡大
Reffi @tomo1109_Reffi

中黒の読みは消すか。空白は許可されないみたいだけど。

2014-04-30 22:47:16
Reffi @tomo1109_Reffi

語彙数2,792。寝るか・・・

2014-05-01 03:42:10
Reffi @tomo1109_Reffi

寝ると言いつつ作業続けてたら夜が明けた・・・

2014-05-01 05:25:20
Reffi @tomo1109_Reffi

おおおお!!!面白いことに気づいた!!!!!

2014-05-01 15:38:57
Reffi @tomo1109_Reffi

というか、良く考えれば普通の日本語でも同じことじゃないか・・・カタカナ文字の中黒は単に名詞じゃない。これは連体助詞や、形容動詞のダ活用連体形なんだ。

2014-05-01 15:43:00
Reffi @tomo1109_Reffi

例えば、「ザイバツ・ニンジャ」「ザイバツのニンジャ」だし、「イモータル・ニンジャ・ワークショップ」「イモータルなニンジャのワークショップ」と解釈できる。

2014-05-01 15:44:49
Reffi @tomo1109_Reffi

これは別におかしな話じゃなくて、例えば「パーソナル・コンピュータ」「パーソナルなコンピュータ」なわけで。

2014-05-01 15:45:51
Reffi @tomo1109_Reffi

さっきの仮定は正しかった!!きちんと中黒を文法的に解釈できてる!!! #njslyr http://t.co/xMT1i8jU56

2014-05-01 15:55:42
拡大
Reffi @tomo1109_Reffi

ここ1週間ぐらい忍薩語の形態素解析やってるけど、これはブレイクスルーかもしれない。この手法で解析精度上がりそう。 #njslyr

2014-05-01 15:57:40