青空文庫の注記記法改訂検討のまとめ

青空文庫での入力に用いられる注記記法(タグ)の改訂について、いくつかの場所で議論が進みました。 http://aozorabunko.pbworks.com/%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E7%89%88%E3%81%AE%E6%B3%A8%E8%A8%98 http://hpcgi1.nifty.com/hongming/komorebi/wforum.cgi ここではTwitter上でのコメントをまとめました。
3
富田倫生 @aobeka

坂本竜馬「手紙」シリーズで、手持ちの注記法では書けないパターンに、まとめてぶつかりました。問題の所在を、 http://tinyurl.com/3yk6hvj にメモしました。新しい書き方を一つ新設しないと、解決ははかれなさそう。 #aozorabunko

2010-10-01 15:38:18
狩野宏樹 @KAN0U

@aobeka このパッチで被ルビ文字内やルビ文字内に外字注記が入る場合問題が解決するはずです。search_front_reference, kuten2png が二重に呼び出されても動作するように変更しました http://bit.ly/92XZbY #aozorabunko

2010-10-01 21:29:58
富田倫生 @aobeka

ありがとうございます。開発者に伝えます。QT @KAN0U このパッチで被ルビ文字内やルビ文字内に外字注記が入る場合問題が解決するはずです。… http://bit.ly/92XZbY #aozorabunko

2010-10-01 22:26:14
富田倫生 @aobeka

①「表示プログラムの作りやすい注記にすれば、利用が促され、結局、青空文庫が得をする」開発者からは、前方参照型はやめて、開始/終了型に変更するのが望ましいと指摘されました。 @KAN0U #aozorabunko

2010-10-01 22:31:20
富田倫生 @aobeka

②既に作ったファイルと作業経験があるのだから、それは無理。ただし、外字注記、アクセント分解が絡むややこしいものは、開始/終了型でファイルを作るようにすると、折り合いました。 @KAN0U #aozorabunko

2010-10-01 22:31:46
富田倫生 @aobeka

③今回の問題は、その合意に反して、ルビタグで処理される注記に、開始/終了型を求めなかった、仕様要求側のミスだったと、私自身は思います。 @KAN0U #aozorabunko

2010-10-01 22:32:15
富田倫生 @aobeka

④お力を得て、XHTML変換プログラムでの問題解決が図られたとしても、ここにはやはり開始/終了型をもうけ、ややこしいものはそちらで書くように方向付けるのが、「生態系」全体の流れにそっているように思うのです。 @KAN0U #aozorabunko

2010-10-01 22:32:48
狩野宏樹 @KAN0U

@aobeka 現在御提案中の注記の開始/終了型記法は、テキスト版を通常のエディタ等で読む人にとって不自然だと感じます。注記される文字列が先にあり後から注記を付け加えるという形なので、ルビと同じく後ろに(終了側に注記を)記述したほうが読みやすく感じます。 #aozorabunko

2010-10-03 03:44:22
富田倫生 @aobeka

なるほど。他の記法とのなじみも考慮して想定すると、[#注記]〜[#「○○」の注記終わり]といった形でしょうか。QT @KAN0U @aobeka …ルビと同じく後ろに(終了側に注記を)記述したほうが読みやすく感じます。 #aozorabunko

2010-10-03 09:50:03
快技庵 高橋政明 @houhei

注記の中に注記がある場合や注記の中に[]が記述されている場合はこれまでもありました。対応しないと最初の]以降は本文に注記が表示されてしまうためリーダーアプリはネスティングには対応済みと思われます。 #aozorabunko

2010-10-03 11:44:26
富田倫生 @aobeka

ルビタグに変換される注記の開始/終了型について、掲示板にコメントしました。 http://tinyurl.com/257e687 「注記内容は後ろに」というご指摘に対応した候補を、追記しました。 http://tinyurl.com/3yk6hvj #aozorabunko

2010-10-04 00:31:57
快技庵 高橋政明 @houhei

追加情報ありがとうございます RT @aobeka ルビタグに変換される注記の開始/終了型について、掲示板にコメントしました http://tinyurl.com/257e687 ...追記しました。 http://tinyurl.com/3yk6hvj #aozorabunko

2010-10-04 08:24:38
野口英司 @agtc

今考えれば青空文庫の注記は開始/終了型にするのがベストでした。でも当初は、なるべくテキストを汚さない、という配慮が優先事項になっていたような気がします。テキストデータはなるべく無駄な情報のない方が望ましいけど、現状ではそれも捨てないといけないのでしょう。 #aozorabunko

2010-10-04 09:16:44
富田倫生 @aobeka

ルビタグに変換される注記の開始/終了型は、[#ルビ注記]……[#「○○」のルビ注記終わり]としようかと。「ルビ注記」といっていない前方参照型と対称性を欠きますが、わかりやすさをとって。乞うコメント。 http://tinyurl.com/3yk6hvj #aozorabunko

2010-10-04 15:24:56
2SC1815J @2SC1815J

#注記対象]……[#「○○」の注記対象終わり]でいかがでしょうか。他候補に対するコメントや上記以外の案などを追記しました。 http://bit.ly/aYdKwj QT @aobeka#ルビ注記]……[#「○○」のルビ注記終わり]としようかと。 #aozorabunko

2010-10-05 01:10:16
富田倫生 @aobeka

2010年9月分の、青空文庫アクセスランキングを、公開しています。過去からの流れをみると、テキスト版で読む人が、あきらかに増えています。 http://www.aozora.gr.jp/access_ranking/ #aozorabunko

2010-10-05 11:29:26
富田倫生 @aobeka

ルビタグに変換される注記の開始/終了型。すでに示された形ではなく、[#注記対象]……[#「○○」の注記対象終わり]ではと、コメントがついています。なるほど。 http://bit.ly/aYdKwj #aozorabunko

2010-10-05 11:36:05
佐藤和彦 / えあ草紙工房 @satokazzz

左に注釈というのもお忘れなく。 RT @aobeka: ルビタグに変換される注記の開始/終了型。すでに示された形ではなく、[#注記対象]……[#「○○」の注記対象終わり]ではと、コメントがついています。なるほど。 http://bit.ly/aYdKwj #aozorabunko

2010-10-05 11:57:16
佐藤和彦 / えあ草紙工房 @satokazzz

どうも他のタグとの整合性が気になります。とりあえず変換スクリプトの修正だけやって、タグの追加はしばらく寝かせたほうがいいんじゃないでしょうか。 #aozorabunko

2010-10-05 12:00:05
富田倫生 @aobeka

外字注記、アクセント分解が絡むケースは、必ず開始/終了で書いてある。だから表示側は、それを前提にプログラムすれば良いという合意を、成り立たせたいのです。前方参照で問題が生じないようにできたとしても、その書き方は使わないのです。 @satokazzz #aozorabunko

2010-10-05 12:27:47
富田倫生 @aobeka

外字注記、アクセント分解が絡む注記的なルビが、左に付く場合がありえます。そのパターンをどう書くかも繰り込んで、決めなければいけません。ご指摘、ありがとうございました。 @satokazzz #aozorabunko

2010-10-05 12:31:41
佐藤和彦 / えあ草紙工房 @satokazzz

寝かせるというのは、これだ!っていう記法を思いつくまで待ったほうがいいんじゃないかという程度の意味です。私としては[#(左に)「〜」の注記]…[#注記終わり]に一票。ソースを直接読む人も少ないでしょうし。 #aozorabunko

2010-10-05 12:40:12
野口英司 @agtc

青空文庫のテキストファイルはXHTMLファイルを生成する上での中間ファイルのような役割を担って行くんでしょうね。 RT @satokazzz: ソースを直接読む人も少ないでしょうし。 #aozorabunko

2010-10-05 12:47:56
佐藤和彦 / えあ草紙工房 @satokazzz

もしくは直接ビューワーで表示するかですね。 RT @agtc: 青空文庫のテキストファイルはXHTMLファイルを生成する上での中間ファイルのような役割を担って行くんでしょうね。 RT @satokazzz: ソースを直接読む人も少ないでしょうし。 #aozorabunko

2010-10-05 12:51:00
野口英司 @agtc

そうだった。とすると青空文庫のテキストファイルって、面白い位置に存在してる。 RT @satokazzz: もしくは直接ビューワーで表示するかですね。 RT @agtc: 青空文庫のテキストファイルはXHTMLファイルを生成する上での中間ファイルのような #aozorabunko

2010-10-05 12:58:10