30
ログインして広告を非表示にする
  • Reffi @tomo1109_Reffi 2014-05-08 19:24:40
    追記:形態素解析やテキスト計量分析等のワードから、ニンジャスレイヤーをご存じない方も見に来られることがあるようですので、簡単に紹介ということでPVを貼っておきますね。これを見れば雰囲気がわかるのではないかと思います。https://t.co/t0fJORZb8F
  • 忍殺語形態素解析辞書「チャドー」 @njdict_Chado 2014-05-10 19:30:19
    追記】忍殺語形態素解析辞書「チャドー」の管理用Twitterアカウントを作成しました。最新版はプロフィールのリンクからダウンロードできます。今後、バージョンアップ等のアナウンスは当アカウントで行います。
  • Reffi @tomo1109_Reffi 2014-05-06 17:41:57
    ◆取扱説明◆◆◆◆ Mecab/IPAdic形態素解析辞書「チャドー」 ◆◆◆◆風林火山◆
  • Reffi @tomo1109_Reffi 2014-05-06 17:44:14
    【概要】Twitter@NJSLYRで連載中の小説「ニンジャスレイヤー」における奇妙な日本語、いわゆる「忍殺語」を、形態素解析エンジン「Mecab」で解析する為の形態素解析辞書です。 1
  • Reffi @tomo1109_Reffi 2014-05-06 17:46:18
    【概要】「形態素解析」とは日本語の文章を、名詞や動詞等の品詞に分解することです。コンピュータで日本語を処理する為には必須の技術で、かな漢字変換等で広く使用されています。 2
  • Reffi @tomo1109_Reffi 2014-05-06 17:46:55
    【使用方法】2014/05/06現在、詳細な使用方法を説明するマニュアルを作成していません。とりあえずはベータ版として公開させて頂きます。 3
  • Reffi @tomo1109_Reffi 2014-05-06 17:52:20
    【概要】導入方法は添付のテキストを参照してください。この辞書と形態素解析エンジン「Mecab」、分析ツール「KH Coder」を使用すると例えばこんなふうに単語と単語の関係性を分析することができます。 4 #njslyr http://t.co/4LHESJhgwr
     拡大
  • Reffi @tomo1109_Reffi 2014-05-06 17:58:47
    【概要】また、このように単語の用例を瞬時に確認することもチャメシ・インシデントとなっています。 5 #njslyr http://t.co/xgPf1Wi49U
     拡大
  • Reffi @tomo1109_Reffi 2014-05-06 18:02:31
    【概要】注:公開しているのは辞書のみで、本編のテキストそのものは収録されていません。別途コーパスを作成する知識とかなりの手間が必要ですが、忍殺語をこれまで以上に使いこなしたい重篤なヘッズの皆様には実際おすすめできると思います。 6 #njslyr
  • ◆補足◆

  • Reffi @tomo1109_Reffi 2014-05-06 21:45:49
    ◆◆◆◆◆◆Mecab/IPAdic形態素解析辞書「チャドー」 ◆◆◆◆◆◆ ソフトをインストールして本格的に使おうと思ってない人も、辞書データ自体はテキストで入ってるので、眺めてみると何か発見とかあるかもしれません。 http://t.co/li9Bqxo0Bf #njslyr
  • Reffi @tomo1109_Reffi 2014-05-07 02:07:04
    あと、もし使ってみたという方がいらっしゃいましたら、漏れてる語彙のフィードバック等頂けると大変ありがたいです。単語と品詞の種類だけわかれば結構ですので・・・動詞の活用形付けたり、形態素生起コスト振ったりはこちらでやりますので。
  • Reffi @tomo1109_Reffi 2014-05-06 18:07:44
    【コーパスについて】Twitter@NJSLYRで2010/7/24~2014/4/19までにツイートされた文章のうち、 いわゆる本編(第一部~第三部、および「ニンジャについて」「デイ・オブ・ザ・ロブスター」)に該当する部分のみを解析の対象としています。 7
  • Reffi @tomo1109_Reffi 2014-05-06 18:09:19
    【コーパスについて】2014/5/6現在、それ以外の文章(エイプリルフール企画やボブとエルフのせんし、ほんやくチームからのアナウンス等は除外しています。 8
  • Reffi @tomo1109_Reffi 2014-05-06 18:10:03
    【コーパスについて】よって、いわゆる「ほんやくチーム語」に関しての語彙・文法規則は不足している可能性が高いです。これは今後の課題です。 9
  • Reffi @tomo1109_Reffi 2014-05-06 18:11:06
    【コーパスについて】また、物理書籍のみに掲載されているエピソードも解析の対象に含めていません。 10
  • Reffi @tomo1109_Reffi 2014-05-06 18:21:49
    【コーパスについて】人名・ニンジャネームについては、ニンジャスレイヤーwikiに記載されている名鑑ナンバー等のメタ情報を付与させて頂きました。有志の方々 に感謝致します。11 #njslyr http://t.co/zCiEv6Sdqj
     拡大
  • Reffi @tomo1109_Reffi 2014-05-06 18:26:21
    【基本方針】以下は辞書編纂時のおおまかな方針です。ブレる場合もあります。 12
  • Reffi @tomo1109_Reffi 2014-05-06 18:29:19
    【基本方針】表記揺れ(と推測されるもの)は辞書で吸収します。例えば、「エイリアス」は「エーリアス」に寄せて認識します。但し、苗字のみの呼称をフルネームに寄せる、いわゆる名寄せはしていません。「フジキド」と「フジキド・ケンジ」は区別します。 13
  • Reffi @tomo1109_Reffi 2014-05-06 18:32:26
    【基本方針】IPA辞書には「表層形」と「原形」が定義されており、これを利用することで「エイリアス」と書かれていても「エーリアスのことだな」と認識させることができます。この場合、表層形が「エイリアス」と「エーリアス」、原形はどちらも「エーリアス」です。 14

コメント

カテゴリーからまとめを探す

「芸能」に関連するカテゴリー