言語学でのデータ管理・コーパスについての語らい #gengo
そういえば、俺の友人の博論はシュメール語のコーパス作り(とそれを基にした形態論の分析)だったなぁ。あれ、結局どうなったんだろうか?
2011-01-04 15:59:28@ab07_tact で す よ ね ー w w 多読の一環として修士でできればいいなあ。まずコーパスの人にツールやグロスのつけ方を教えてもらって…
2011-01-04 16:00:45コーパス、とまで行かないけど、文レベルのデータの保存等は皆さんどうやっているのかは知りたい所です。データベースのソフトでもイマイチなんだよなあ。 #gengo
2011-01-04 16:02:43@Mitchara まあ、本格的なコーパスを作ろうと思うと数年単位で共同研究プロジェクトを組んでお上に予算をもらって…という流れになるかとw
2011-01-04 16:04:14@ab07_tact がんばって雇ってもらえるようにがんばります…。まずはLinguist's Toolboxとかでちまちまやるかなあ
2011-01-04 16:23:14切実に知りたい. RT @koda_TO: コーパス、とまで行かないけど、文レベルのデータの保存等は皆さんどうやっているのかは知りたい所です。データベースのソフトでもイマイチなんだよなあ。 #gengo
2011-01-04 16:28:48とりあえずエクセルに放り込んでるけど使い勝手悪いです RT @gotshu: 切実に知りたい.RT @koda_TO: コーパス、とまで行かないけど、文レベルのデータの保存等は皆さんどうやっているのかは知りたい所です。データベースのソフトでもイマイチなんだよなあ。 #gengo
2011-01-04 16:33:03@ab07_tact マクロンは結構不便なことがあるので、代用表記を使うかもしれません。コンコーダンスはもちろんですが、簡単な依存文法的情報をグロスに放り込んで文型分類ができるといいんですけれども…これはもうExcelしかないかな…
2011-01-04 16:36:52@ab07_tact 自分も今はexcel ですが,コピーのしかたで書式(イタリックとか)が消えちゃうのと,1セルの内容が一定量越えると###表示(コピーまで)になってしまうのと.卒論の時は,文はwordに,データだけexcelにわけて,通し番号付けたり…
2011-01-04 16:39:00TEI フラグが立ってる!?(ただ、あの電話帳見るとやる気なくすような気も(^_^;) RT @Mitchara: でも、流用を考えるとXMLでタグつけたほうがいいのかなあ。私まずXMLから勉強しないとダメなんだけども。
2011-01-04 16:39:08@koda_TO 文字コードの問題で、膨大なデータを処理しあぐねています……最近解決したのでなんとかしようと考えていますがw
2011-01-04 16:41:02@MnjaMnia ガタッ 今のところ、自分で使うだけの小規模なデータを考えているので(でないと元テクストの著作権が…)自分用に使いやすいグロスをつけようと思ってるのですが…
2011-01-04 16:42:25@ab07_tact @gotshu エクセル使っている人はこっちでは見かけたことがないですねえ。ごっしゅさんの仰ると事が欠点として、エクセルの利点はありますか? #gengo
2011-01-04 16:42:42@ab07_tact ポリ言語をどう扱うかは厄介ですよね…。通常語にあたる記述単位を接辞と語幹にしてもいいんですが、統語的情報を引っ張り出そうとすると逆に邪魔になりますし…。
2011-01-04 16:43:44@nonomaru116 ののまるさんまで・・・ 結構切実ですねえ。特にデータが大きくなればなるほど。 #gengo
2011-01-04 16:44:33@koda_TO 学校のPCには,たいていexcelが入っているので,学校でも開けるとか,excelは他に触れる機会があれば,新しく遣い方を学ぶ必要がないとか.
2011-01-04 16:45:30