こういうの、正規表現使って検索する点検工程があるんだけど、手作業ではなくまとめて自動チェックできないものだろうか。ノウハウが蓄積されてるのはよくわかる。 #aozora20th pic.twitter.com/lFHvyzZ6hJ
2017-10-14 14:19:16親本や初出は、解題解説がややこしくて見落としたり、單純に見落としたりするから誠に申し譯無いと思ふ。 #aozora20th
2017-10-14 14:23:15#aozora20th 富田: 見つからない外字検索は CHISE IDS 漢字検索を使う 最後に底本の奥付けを確認。基本は底本のとおりに記載する。 底本の親本も調べて記載する。 寄せ集めの本の場合なかなか大変である。 ファイル名のローマ字表記。touhoku → tohoku
2017-10-14 14:24:15結城浩さんの「文字チェッカー 3.60(通称:チェッカー君)」 hyuki.com/aozora/checker… を非常に重宝しているとのこと。 #aozora20th
2017-10-14 14:26:46#aozora20th 校正 大久保: 校正はリラックスしてやっている。ファイルを印刷して底本のコピーと比較しておこなっている。最近は変換してKindle に入れて底本と比べて校正することもある。文庫本の文字数と Kindle も文字数が大体一致している。
2017-10-14 14:32:56#aozora20th 旧字「國」などはそのように入れる必要がある。「強」などは「包摂基準」の問題がある。たとえば「渚」は昔の字では「日」の上に点があったが、今はコンピュータ上同じ文字とみなしている。これを「包摂」といっている。この判断はなかなか難しい。
2017-10-14 14:37:38前半の大久保ゆうさん・富田晶子さんの入力・点検・校正作業のボランティア入門講座が、抜群におもしろい。これ自体を一個の日本語・文章講座として、学校など巡回すべきではないか。#aozora20th >青空文庫20周年記念シンポジウム aozorabunko20th.peatix.com
2017-10-14 14:38:10青空文庫の入力の際の舊字變換は、↓が便利だと思ふ(恐らく點檢、校正には使へない)。 geocities.jp/qjitai/ #aozora20th
2017-10-14 14:38:14(「初音ミクはネットの自由の象徴」………はつねミクはネットのじゆうのしょうちょう………覚えましたし) #aozora20th
2017-10-14 14:39:21#aozora20th 大久保: グリム童話の校正はドイツの現地をみながら楽しみながらやったこともある。 富田: 青空文庫では 3回見るというのがルールだが、一人ではとても難しい。 大久保: 自分で友人に手伝ってもらっている人もいる。
2017-10-14 14:41:25Unicode化の最大の問題点は、たぶん入力ルールとツールとにあるというのは非常に分かる #aozora20th
2017-10-14 14:43:29#aozora20th Q: Shift JIS を Unicode に直す予定はないか。海外で読めないという声がある。 A: HTML だけ Unicode にする考えもある。 製作を Unicode にするのは容易でない。
2017-10-14 14:43:35#aozora20th Unicode化については、ルールを整理して合意をとるのが一番コストがかかりそうですが、それさえできれば技術的にはまあ大丈夫だと思います。ある意味(X)HTMLになっているということはすでにUnicodeとの1対1対応ができてるということでもあるので
2017-10-14 14:47:16これから「活用セッション」 #aozora20th インプレスR&D「青空文庫POD」。青空文庫をプリント・オン・デマンドで印刷。ポケット版 (A6変型)、通常版 (四六判)、大活字版 (B5) を作成している。22point, 10.5p, 9p。印刷可能なPDFがあればよい。
2017-10-14 14:56:13インプレスR&D「青空文庫POD」#aozora20th テキストファイル → EPUB → 校正用PDF → 本番用PDF → 表紙作成 神保町三省堂に展示しています。
2017-10-14 15:00:26「辞書の向こう側 青空文庫の生きた用例たち」 高橋さきの (翻訳者) #aozora20th 1日数十回お世話になっている。 20年前は原稿は紙、ランダムハウスの辞書 今は電子化辞書で串刺し検索。青空文庫も串刺し検索
2017-10-14 15:05:18