第25回「東洋学へのコンピュータ利用」研究セミナー(#zinbun #jinbun)

表記セミナーのつぶやきをえいやっとまとめました。 ハッシュタグ #zinbun#jinbun で機械的にかき集めています。漏れや余分なものがあれば、編集可能にしておきますので、適宜修正してください。 セミナーのお知らせページ http://www.kanji.zinbun.kyoto-u.ac.jp/seminars/oricom/2014.html
17
前へ 1 2 3 ・・ 7 次へ
狩野宏樹 @KAN0U

(ちょっと落ちました) A そのあたりは一般キャラクター論のネタになるかなと思う。

2014-03-14 12:07:31
狩野宏樹 @KAN0U

Q: 漢文と現代中国語、日本などの使われ方を配慮して漢字を見ていこうとすると、かなり別物だと思うが、文字を使っている人の意識からすると、昔から受け継がれている物を使っているつもりでいる。それが難しい。文脈なしには正しく解釈できない」ということを徹底して理解させるのは困難そう。

2014-03-14 12:09:09
狩野宏樹 @KAN0U

これまでよりも広い枠組みが必要と思うが、どのような構想を持っているか。 A: いきなり大きな問題に手を出すと溶けない。いくつかのアプローチはある。一つはコーパスにより文脈情報の形でデータを蓄積すること。文字列として書かれたコーパスは現代語を中心に作られているし、#jinbun

2014-03-14 12:10:18
狩野宏樹 @KAN0U

歴史文献もこれから進んでいくだろう。その一方、文字画像の蓄積も進んでいくが、両者を結んだものが少ない。今後の課題。 #jinbun

2014-03-14 12:10:56
狩野宏樹 @KAN0U

現代の文字コードや組版から完全に距離をとった物にしてしまうと使ってもらえない(接点が無いと発展していかない)。漸進的なマイルストーンをどう設定していくか。標準化の場面においては種々の問題(rがある。工業標準は揺り戻しを含みながら進んでいく物。基礎データの蓄積が重要。#jinbun

2014-03-14 13:30:29
狩野宏樹 @KAN0U

午後の最初のセッションは、「時間情報を扱うための課題の整理を試みる−日本誌資料を題材に−」後藤真さんです。

2014-03-14 13:31:42
狩野宏樹 @KAN0U

デジタルデータでの時間情報の扱い、その前提となる手書き文献全般に当てはまる事柄を話す。 #zinbun

2014-03-14 13:32:07
狩野宏樹 @KAN0U

時空間情報のうち、時間情報をきっちりと扱わねばという話が出てきている。空間情報についてはGIS等の技術の進展により、整理されてきているが時間関係はまだまだというのが関野氏の問題意識。 #zinbun

2014-03-14 13:34:16
狩野宏樹 @KAN0U

時間が空間と違う点:時間は同じように流れていくという前提のはずだが、空間よりも人間の意識により表現のあり方等が変わる度合いが大きいのではないか。それにより困難が生じている。 #jinbun

2014-03-14 13:36:32
狩野宏樹 @KAN0U

日本史史料における記述の問題。特殊な時間表寄、年に干支を使用、元号と改元etcは東アジアに一般的。曖昧な時間、すごく長い時間、時代などの扱いをどうするかが難しい。長期間にわたって編纂を経て成立したテキストをどう扱うか。 #zinbun

2014-03-14 13:37:55
山本 茂 @BsdHacker

@BsdHacker タグが、#jinbun#zinbun が混じった感じになってるな。

2014-03-14 13:38:33
狩野宏樹 @KAN0U

干支による表記、前の所に一日の干支が書いて所を探し、それから辿らなければ普通の日付表記に直せない。間違っている場合(大の月より長い)あるので、修正して確定する必要もある一方、原文通りの間違った年表記の記述も可能でなければならない。 #zinbun

2014-03-14 13:41:23
狩野宏樹 @KAN0U

60年ずれの問題。決めるのは歴史学の仕事だが、入力法はとにかく決めておかねばならない。年号表記は1対1で対応できれば対した問題ではないが、いろいろ面倒。改元ルールが時代によって違う。大正、昭和は即日、平成は翌日。元旦まで遡って改元(明治)、翌年からの改元(前近代に多い)

2014-03-14 13:43:44
狩野宏樹 @KAN0U

不吉なことがあった時の改元は例外だったりする。南北朝のような複数年号。南朝の延元元年は北朝の建武3年。後南朝のような勝手な私年号。表記の揺れ:天平勝宝5『年』〜天平勝宝8『歳』のような呼び名の変更。 #zinbun

2014-03-14 13:46:42
狩野宏樹 @KAN0U

天皇の名前(長々しい日本名)の何年、という表記、古事記と日本書紀で微妙に違う。マッピングしてしまえばいいのかもしれないが、本当にそれでいいか一応整理の必要がある。 #zinbun

2014-03-14 13:47:36
狩野宏樹 @KAN0U

東大寺要録の「天智天『王』『即位』二年」表記:即位年と実際上天皇であった年とのずれがあるので「即位」と書いた。しかもこの記述は誤っていて本当は天武天皇。 #zinbun

2014-03-14 13:49:36
狩野宏樹 @KAN0U

範囲のある記述・存在しない時間(昭和89年とか)も一応考慮しといたほうがいい。 #zinbun

2014-03-14 13:50:16
狩野宏樹 @KAN0U

相対年代(古墳の順番は分かっていても絶対年代が解らない)→一応のマッピングが必要だが、古墳時代中期=5世紀後半、とかでいいのか。スタートがずれると100年ずれてしまう。 #zinbun

2014-03-14 13:54:25
狩野宏樹 @KAN0U

書き方のバリエーションに過ぎないのは確か。人間が入力する時にはタグ付けである程度はどうにかなる。どういうバリエーションがあるかは知っておく必要がある。非公式な基盤はあるが業界全体で共有できる形にする必要がある。 #zinbun

2014-03-14 13:54:45
狩野宏樹 @KAN0U

直前の二つは順番が逆です。 #zinbun

2014-03-14 13:54:59
狩野宏樹 @KAN0U

「四月十二日」表記のある古文書。何年かを考えなければならない。天平感宝元年の四月の十二日とあるので、それより右側にある記述はそれより前であろうとは分かる。同年と確定できるとは言いがたい。反故の余白に書いた文書である場合、元の記述はずっと古くなる。

2014-03-14 13:56:24
狩野宏樹 @KAN0U

「ある時点より前」「後」しか確定できない時間をどうするか。 #zinbun

2014-03-14 13:57:57
師茂樹 MORO Shigeki @moroshigeki

#zinbun 後藤さんの発表、(1) 時間表記の曖昧性・誤謬をどう記述するか、という問題と (2) 直線時間モデルになじまない表記(干支のような循環するモデル)をどう記述するか、という問題は、同じ(曖昧性の)問題なのかな、違う問題なのかな。

2014-03-14 13:58:54
狩野宏樹 @KAN0U

「編纂というコピペと複数の時間」複数の研究者が注釈をいれるためのデータベース作り(東大寺要録)をやっている。嘉承元年(1106)に原本、1134年の増補本も散逸、醍醐寺に1、2巻、東大寺に10巻が残されている。当時の年中行事を知るのに貴重な史料。 #zinbun

2014-03-14 13:59:32
狩野宏樹 @KAN0U

その後も編集が加えられている文書。画面に示した文の8割ぐらいが続日本紀のコピペ(所々穴が抜けたのは移し間違い)「この寺を東大寺と呼ぶ」という機銃だけがオリジナルでまた引用。 #zinbun

2014-03-14 14:01:22
前へ 1 2 3 ・・ 7 次へ