キングズカレッジロンドンデジタルヒューマニティ学科特別講義ノート Prof.Maeda Akira, "Integrated Information Access and Analysis of Japanese Humanities Databases"
平安時代の古典のデジタル化及び浮世絵データベースに関して12/15にキングズカレッジロンドンで行われた講義ノートを自分用にまとめました。
- Cristoforou
- 2211
- 0
- 0
- 0
saebou
@Cristoforou
ネットの調子が良ければデジタルヒューマニティ学科特別講義Prof.Maeda Akira, "Integrated Information Access and Analysis of Japanese Humanities Databases"を #KCLDH でツダります。
2011-12-15 21:53:51
saebou
@Cristoforou
バラバラの断片になった紙からテキストをトランスクリプションするとこから始める。音節分かち書きとかがないので古語のテキストを検索語に切り出すのがまず大変。 #KCLHD
2011-12-15 22:12:27
saebou
@Cristoforou
いとまばゆき人の御おぼえなり → いと まばゆき 人 の 御 おぼえ なり と切り出す。日本古語用の形態素解析ソフトはない。 #KCLHD
2011-12-15 22:13:19
Kiyonori Nagasaki
@knagasaki
一応、こういうのあります。→小木曽智信「通時コーパスの構築に向けた古文用形態素解析辞書の開発」http://t.co/iyyPA6xL @Cristoforou 日本古語用の形態素解析ソフトはない。
2011-12-15 22:19:00
saebou
@Cristoforou
源氏物語を2-10 gramsで切り出す。47%が正しく切り出せたらしい。名詞が60%、同士が35%。80%のセパレーションが正しかった #KCLHD
2011-12-15 22:20:54
Kiyonori Nagasaki
@knagasaki
こっちの論文の方が古いですかね。国語研のグループは割と前から取り組んでたような?→「中古和文を対象とした形態素解析辞書の開発」 http://t.co/kX4Y6oKm @Cristoforou 日本古語用の形態素解析ソフトはない。
2011-12-15 22:22:05