言語学でのデータ管理・コーパスについての語らい #gengo
evernote は自動で同期してくれるので,自分が使う前に起こった事故のことを含めても,便利ではあるなぁ.MS Office との互換性はないがしかたあるまい.MS Office 系は skydrive 直でいじれるようになって最近便利.これもmacだとそうでもないんだが.
2011-01-04 17:23:47だからやっぱ S 式ですね(ぉぃ(^_^;;; RT @Mitchara: どーせポリ言語のグロスとか統語情報の記述形式なんて自分で考えるしかないのだ。
2011-01-04 17:24:18@Mitchara そうです〜。第一に軽いし、 第二にexcelに読ませる時だけ特殊文字を一括変換すればいいし… 僕はvistaを使っててIPAのかなりのものがexcelに打ち込めなかったので…新しいOfficeではできる?
2011-01-04 17:24:26ていうか skydrive って,実質 MS office 買わなくてもwebブラウザさえあれば,編集できる状態ってことでいいんだよね?
2011-01-04 17:24:42@satounaoto できそうですね。ダメなら仰るとおり置換すればいいですし…。もっともナワトル語は音素が23しかない上にsuprasegmentalが弁別的でないので代用表記で十分ですw
2011-01-04 17:26:30chasenあるいは茶筅で、形態素解析ソフトです。開発者のページ http://chasen.naist.jp/hiki/ChaSen/ RT @tetshattori 横すみません.ちゃせんって正式名称は何でしょうか?
2011-01-04 17:27:16で、まあ、以外と Mecab (のコーパス形式)って実は便利なんじゃないかという気もしたり(要は CSV なんだけど、素性を自分で拡張できて、言語独立なので)。統語構造は書けないんだけど。
2011-01-04 17:32:00@satounaoto Navajoは各種特殊文字だけでなくUnicodeの組み合わせ記号も使うので、これはIPAでもちょっと工夫しないと検索できなくなりそうですね…。
2011-01-04 17:33:14生成屋さんと Lisp は多分相性が良いと思うので、知っとくと便利かも知れないなとは思うんですが、あの括弧の山を見る人々の視線の冷たさを思うと強くはいえず(^_^;;; RT @Mitchara: なるほど、階層性も再現できるんですよね!
2011-01-04 17:34:58ナバホの母音はトーンと鼻音性がクロスカットだから1つの母音に最低4つの記号がいるんだよな。代用表記だと鼻母音でHのa = 「Ha~」とか書くのがいいかなあ。
2011-01-04 17:36:53まあ、なんというか、列とか表とかは簡単なんだけど、木とかグラフになると急に話がややこしくなって、とっつきが悪くなるというのが問題で、そこで表に逃げるか、思い切って木やグラフに進むかの選択になるんだけど、後者はハードルが高い訳で…
2011-01-04 17:38:12松本裕治「統語情報の付与」という記事があった。http://bit.ly/fDX62f そういえば統語情報付けてるコーパスもあったな、忘れてた…。
2011-01-04 17:48:16私も持ってます。リニューアル版があると良いかも。RT @satounaoto: 日本語学2003年3月臨時増刊が「特集 コーパス言語学」です。持ってます。いいでしょ~ 読んでもわかんないけど。
2011-01-04 17:50:37