第25回「東洋学へのコンピュータ利用」研究セミナー(#zinbun #jinbun)
Q: 漢文と現代中国語、日本などの使われ方を配慮して漢字を見ていこうとすると、かなり別物だと思うが、文字を使っている人の意識からすると、昔から受け継がれている物を使っているつもりでいる。それが難しい。文脈なしには正しく解釈できない」ということを徹底して理解させるのは困難そう。
2014-03-14 12:09:09これまでよりも広い枠組みが必要と思うが、どのような構想を持っているか。 A: いきなり大きな問題に手を出すと溶けない。いくつかのアプローチはある。一つはコーパスにより文脈情報の形でデータを蓄積すること。文字列として書かれたコーパスは現代語を中心に作られているし、#jinbun
2014-03-14 12:10:18現代の文字コードや組版から完全に距離をとった物にしてしまうと使ってもらえない(接点が無いと発展していかない)。漸進的なマイルストーンをどう設定していくか。標準化の場面においては種々の問題(rがある。工業標準は揺り戻しを含みながら進んでいく物。基礎データの蓄積が重要。#jinbun
2014-03-14 13:30:29時空間情報のうち、時間情報をきっちりと扱わねばという話が出てきている。空間情報についてはGIS等の技術の進展により、整理されてきているが時間関係はまだまだというのが関野氏の問題意識。 #zinbun
2014-03-14 13:34:16時間が空間と違う点:時間は同じように流れていくという前提のはずだが、空間よりも人間の意識により表現のあり方等が変わる度合いが大きいのではないか。それにより困難が生じている。 #jinbun
2014-03-14 13:36:32日本史史料における記述の問題。特殊な時間表寄、年に干支を使用、元号と改元etcは東アジアに一般的。曖昧な時間、すごく長い時間、時代などの扱いをどうするかが難しい。長期間にわたって編纂を経て成立したテキストをどう扱うか。 #zinbun
2014-03-14 13:37:55干支による表記、前の所に一日の干支が書いて所を探し、それから辿らなければ普通の日付表記に直せない。間違っている場合(大の月より長い)あるので、修正して確定する必要もある一方、原文通りの間違った年表記の記述も可能でなければならない。 #zinbun
2014-03-14 13:41:2360年ずれの問題。決めるのは歴史学の仕事だが、入力法はとにかく決めておかねばならない。年号表記は1対1で対応できれば対した問題ではないが、いろいろ面倒。改元ルールが時代によって違う。大正、昭和は即日、平成は翌日。元旦まで遡って改元(明治)、翌年からの改元(前近代に多い)
2014-03-14 13:43:44不吉なことがあった時の改元は例外だったりする。南北朝のような複数年号。南朝の延元元年は北朝の建武3年。後南朝のような勝手な私年号。表記の揺れ:天平勝宝5『年』〜天平勝宝8『歳』のような呼び名の変更。 #zinbun
2014-03-14 13:46:42天皇の名前(長々しい日本名)の何年、という表記、古事記と日本書紀で微妙に違う。マッピングしてしまえばいいのかもしれないが、本当にそれでいいか一応整理の必要がある。 #zinbun
2014-03-14 13:47:36東大寺要録の「天智天『王』『即位』二年」表記:即位年と実際上天皇であった年とのずれがあるので「即位」と書いた。しかもこの記述は誤っていて本当は天武天皇。 #zinbun
2014-03-14 13:49:36相対年代(古墳の順番は分かっていても絶対年代が解らない)→一応のマッピングが必要だが、古墳時代中期=5世紀後半、とかでいいのか。スタートがずれると100年ずれてしまう。 #zinbun
2014-03-14 13:54:25書き方のバリエーションに過ぎないのは確か。人間が入力する時にはタグ付けである程度はどうにかなる。どういうバリエーションがあるかは知っておく必要がある。非公式な基盤はあるが業界全体で共有できる形にする必要がある。 #zinbun
2014-03-14 13:54:45「四月十二日」表記のある古文書。何年かを考えなければならない。天平感宝元年の四月の十二日とあるので、それより右側にある記述はそれより前であろうとは分かる。同年と確定できるとは言いがたい。反故の余白に書いた文書である場合、元の記述はずっと古くなる。
2014-03-14 13:56:24#zinbun 後藤さんの発表、(1) 時間表記の曖昧性・誤謬をどう記述するか、という問題と (2) 直線時間モデルになじまない表記(干支のような循環するモデル)をどう記述するか、という問題は、同じ(曖昧性の)問題なのかな、違う問題なのかな。
2014-03-14 13:58:54「編纂というコピペと複数の時間」複数の研究者が注釈をいれるためのデータベース作り(東大寺要録)をやっている。嘉承元年(1106)に原本、1134年の増補本も散逸、醍醐寺に1、2巻、東大寺に10巻が残されている。当時の年中行事を知るのに貴重な史料。 #zinbun
2014-03-14 13:59:32その後も編集が加えられている文書。画面に示した文の8割ぐらいが続日本紀のコピペ(所々穴が抜けたのは移し間違い)「この寺を東大寺と呼ぶ」という機銃だけがオリジナルでまた引用。 #zinbun
2014-03-14 14:01:22