まとめの限定公開に「リンク限定」が追加されました。URLを伝えてまとめを共有しよう!

@aobekaさんの文字コード関連の最近のつぶやき

「青空文庫点検組日常」カテゴリーの最近のつぶやきから、文字コードに関連するものをまとめてみました。
人文 テキスト化 青空文庫 デジタル化
856view 0コメント
1
富田倫生 @aobeka
【青空文庫点検組日常】「辶+麦」を、大字典は「違の略字」として掲げている。Unicodeに探すのだが、みつけられない。
富田倫生 @aobeka
【青空文庫点検組日常】南部修太郎「夢」の潰れてよく見えない最後の一字は、「麗」の俗字という「䴡」だ、きっと。U+4D21。ただ、この字体説明が…。「(晋−一−日)/(麁−々)」だとどっちの「一」か決まらないが、他の案が出ない。後は辞書編集グループの判断を仰ぎます。夜も更けたし。
富田倫生 @aobeka
【青空文庫点検組日常】南部修太郎「夢」初出の「寫眞報知」は、字体に特徴がある。違は「辶+麦」。気は氕。来は「未の二に代えて三」。経は「糸+(仝の工に代えて土)」。麗は䴡。甲賀三郎「琥珀のパイプ」初出も同紙。洗えば、他の作品からも用例がとれそう。なぜこうなったかも気になる。
富田倫生 @aobeka
【青空文庫点検組日常】①私たちは、新しい作品を毎日公開し、誤りや形式はずれを修正し続けている。ファイルを変換して利用してくれるのも、もちろんありがたいが、追加と修正の流れから切り離される点は、気になる。資源をフルに活用するには、最新のファイルを開けることが望ましい。
富田倫生 @aobeka
【青空文庫点検組日常】②KinoppyのiOS版には、青空文庫にも対応したbREADERが組み込まれ、その体制ができている。紀伊國屋の売り上げへの直接の寄与はないが、「読書ライフをトータルサポート」の志を示すビュワーは支持を集め、裾野がやがて、同社の売り上げを下支えするだろう。
富田倫生 @aobeka
【青空文庫点検組日常】③電子ペーパー装置でも然り。Readerでも、Kindleでも、Koboでもファイルを利用してほしいが、追加、修正の流れを断ち切らない選択は、ここでも最強の資源活用法。青空文庫テキスト対応ビュワーの組み込みに踏み込めば、撒き餌が人を集め、利用の裾野が育つ。
富田倫生 @aobeka
【青空文庫点検組日常】今井邦子「誠心院の一夜」を読む。赤染衛門、和泉式部。ググって、基礎知識を頭に置くとようやく、彼らに託されたものが、伝わってくる。入力者とは、しばらくやりとりが絶えている。お元気だろうか。あずかったファイルは、確かに受け取りました。公開に向けて進めます。
富田倫生 @aobeka
【青空文庫点検組日常】①南部修太郎「夢」で、「来」の異体字として、「未の二に代えて三」が使われている。Unicodeにない文字として、外字注記せざるを得ないのではと報告したところ、辞書グループのKさんから、UCVの2で「耒」に統合ではとの指摘があった。
富田倫生 @aobeka
【青空文庫点検組日常】②これを別字とせざるをえないと思ったのは、「大字典」109頁「來」の項に、「來の俗字にして「未の二に代えて三」あり。耒(スキ)と混すべからず」とあったからだ。ところが、Kさんの指摘を得てあらためて、UDを確認すると… http://t.co/8ktvrxpB
富田倫生 @aobeka
【青空文庫点検組日常】③U+8012 耒には、kJapaneseKunのSUKIに加えて、kJapaneseOnにRAI RUIと掲げてある。さらにVariantsにU+4F86 來が示してある。「大字典」が「べからず」としている「混」が、生じているようにみえる。
富田倫生 @aobeka
【青空文庫点検組日常】④では、翻刻ファイル作成者としての青空文庫は、南部修太郎「夢」のこの字をどう処理するべきか。「大字典」の立場をとれば、規格の現状には問題があるのかもしれない、との確認事項をどこかにメモとして、当該文字には、「耒」をあてるということではどうだろうか。
富田倫生 @aobeka
【青空文庫点検組日常】⑤耒について補遺。この字は、JIS X 0208に70-48で登録されている。音訓には「すき,ライ,(らいすき)」。参照区点には来、來ともに掲げられていない。包摂規準2にある、「耒」と「未の二に代えて三」は、へんとしての規定にみえる。
富田倫生 @aobeka
【青空文庫点検組日常】0213にない文字に、Unicodeをあてようとするとき、包摂と統合の渡りの問題が生じる。「未の二に代えて三」と「耒」は、包摂できないのでは。それでUnicodeに。そこでよりどころと頼むUCVは、統合と言う。0208に戻り、耒なのか。何度目かのこの問題。
ログインして広告を非表示にする
ログインして広告を非表示にする