-
tomo1109_Reffi
- 23781
- 6
- 24
- 3

「オートマチック・ヤクザ・ガン」であれば「オートマチックなヤクザのガン」と推定、「オートマチックヤクザガン」であれば形動→名詞、名詞→名詞は繋がりやすいと判断する、というわけですね。 40
2014-05-06 20:23:14
【再配布について】忍殺語形態素解析辞書の改変・再配布については自由に行って頂いて問題ありません。但し、当辞書はIPA辞書の改変版ですですので、再配布の際はオリジナルのIPA辞書のコピーを、改変版とは別にそのまま添付してください。 41
2014-05-06 20:26:04
【再配布について】忍殺語形態素解析辞書「チャドー」はTwitter小説「ニンジャスレイヤー」の二次創作物です。再配布の際はドキュメントにTwitterの公式アカウント@njslyr と、ウェブサイト「ネオサイタマ電脳IRC空間」のURLを明記してください。 42
2014-05-06 20:27:24
【再配布について】改変版の辞書以外の、辞書を使用した成果物の公開についても、当方では特に制限を設けません。基本的に「ニンジャスレイヤー」公式アカウント@njslyr が提示している二次創作のガイドラインに従ってください。 43
2014-05-06 20:30:04
公式アカウント@njslyr の二次創作に関する指針です。 https://t.co/GnnmbVrja4 https://t.co/XEb7r4p1K7
2014-05-06 20:36:41
実際、辞書というものがその性質上、けっこうグレーゾーンに踏み込んでいるのかなと思わなくもないのですが…お目こぼし頂けるとありがたいかな、と…これを使ってなんかアレなことをするつもりはなく、くだらない分析をして面白がるだけですので… 45
2014-05-06 20:41:31
ところで、なんでチャドーかというと、Mecabの元になった形態素解析エンジンの名前が「茶筌(チャセン)」だからそこに引っかけてみたという。チャドー。フーリンカザン。そしてチャドー。
2014-05-06 21:37:28
忍殺語形態素解析辞書を使用して集計した頻出単語ランキングトップ50、名詞編。(辞書の精度の問題で一部変なところがあります) #njslyr http://t.co/li9Bqxo0Bf http://t.co/kBIQ7K8L1c
2014-05-07 00:04:07

忍殺語形態素解析辞書を使用して集計した頻出単語ランキングトップ50、副詞可能名詞、形容動詞、形容詞、副詞、感動詞。見所はやはり感動詞。イヤーッ、グワーッの多さは流石。 #njslyr http://t.co/li9Bqxo0Bf http://t.co/KI9K7HLaSv
2014-05-07 00:26:40

忍殺語形態素解析辞書を使用して集計した頻出単語ランキングトップ50、代名詞、接頭・接尾語、動詞。「=サン」は突出して多く、あとは「バイオ」「サイバー」「ジツ」等が目立つ。 #njslyr http://t.co/li9Bqxo0Bf http://t.co/XEYFbgXesq
2014-05-07 00:37:13

おっと、かな名詞の「めい」が640もあるのは、「めいて」の誤認識か。「めく」のカ行イ音便として認識されてるのは3,383だから、全体の16%弱か。これは連接の判定を弄った影響が出てるのかも・・・
2014-05-07 01:09:12
ああ、そういえばこの前「○○めいて」のランキング集計してみたときは約4,000だったな。誤認識で16%落ちてると考えれば辻褄が合うから多分そうだ。
2014-05-07 01:13:06辞書の使用例です。興味を持たれた方はこちらもどうぞ。
忍殺語の「○○めいて」「○○めいた」ランキング TOP50
http://togetter.com/li/660688
忍殺語の「○○めいて」研究その2・「忍殺語」と「平均的な日本語」を比較する
http://togetter.com/li/664403