近代デジタルライブラリの統合にまつわるあれこれ

5月よりシステム統合がなされた国立国会図書館の近代デジタルライブラリーに関する賛否両論をまとめました。
0
富田倫生 @aobeka

⑭規格か見た目かとなって、見た目を選んだところもある。規格は、確実な情報交換を保証するために、文字とコードの対応を規定しているが、そこから外れた使い方を禁止しているわけではない。\(^o^)/でも、文句は言われない。同様に、そうしたいなら、自己責任で「霞ケ関」とすればいい。

2012-05-12 12:07:27
富田倫生 @aobeka

⑮青空文庫では当初、大きいものをケ、小さいものをヶとすることを誰も疑わなかった。ところが、大きいとも小さいともいいがたいものはどうするのかという疑問から発して、この字の由来を調べ、規定を確認し、底本上のサイズに関わらず、1997改訂が示した5-86の「ヶ」で入れようと決めた。

2012-05-12 12:07:42
富田倫生 @aobeka

⑯(ここから新規tweetに戻る。)近代デジタルライブリーの書誌情報と目次のテキスト入力では、こ、か、がと読むものにケもあてられている。1997改訂には、対応していない。かといって、紙の上の大小でヶケを使い分けてもいない。ただ、正規化さえしてもらえれば、検索の穴は生じない。

2012-05-12 12:08:01
富田倫生 @aobeka

⑰もう一方の緊デジは、この字をどう扱うのだろう。紙面では、大きくも小さくも作られてきた。キャプチャー時には、当然そのまま。リフロー型作成のもととなるテキストは、本来、DTPデータとして作られたものだろうから、ケとヶが混在しているはずだ。

2012-05-12 12:08:16
富田倫生 @aobeka

⑱一からテキストアーカイブをつくるなら、JIS X 0208:1997の立場で、こ、か、がと読む字を扱う、青空文庫の選択もありうる。ただ、いろいろな出版社が紙で出してきたものを電子化するのなら、元データの通りに扱うのが穏当か。

2012-05-12 12:08:37
富田倫生 @aobeka

⑲規格に合わせたとして、霞ケ関を霞ヶ関とすれば、好んで火中の栗を拾いにいくことになる。ただ、横断的な検索に際しては、この文字に宛てられたケとヶの正規化が必要になる。ATOKは、規格重視の立場からかヶしかださな。見かけに応じて、ヶとケを使い分けるという方針も、結構揺らぎやすい。

2012-05-12 12:08:58
富田倫生 @aobeka

⑳今回近デジが達成した検索機能の強化は、あるものが必ずみつかるという、信頼性の確かな基盤となる。青空文庫なら、鐘と太鼓で大宣伝するだろう。一方、静かに、音も立てずに達成されはしたが、この成果の裏には、問題に気づき、解決の道筋を付けてくれた人がいる。心より、ありがとうございました。

2012-05-12 12:09:20
趣味はマリンスポーツです @hitode909

近デジもう完全に飽きてるし直すの厳しい感じがするけどそのうち直します………

2012-05-12 16:05:46
mala @bulkneets

近デジの最近使って動かなかったからちょいちょいいじったけど、なんか検索結果に入ってるidとURLが一致して無くてスクレイピング必要そうでダルそうだった。NDLダウンロードわざと不便にしてんじゃないの

2012-05-12 16:08:41
yajifun @yajifun

目次にキーワードがあれば、該当ページをすぐ閲覧できるようになったようだ。 RT 近代デジタルライブラリー - 検索結果 http://t.co/TLK4e0pu

2012-05-12 16:24:13
能登屋旧館 @notoya3560

“近代デジタルライブラリー | 国立国会図書館” http://t.co/qUWLJbyZ

2012-05-12 16:34:25
kotori @kotoriko

つか近デジ600くらいダウンロードしといてマジ良かったわ。

2012-05-12 16:42:29