【売れる!?】 中堅作家が絶版本を電子書籍にする話 【売れぬ!!】
#竹の子書房 そして、15年以上前に刊行され、かつ著者が死んで50年経ってない(もしくは著者存命)本というのは、出版物の総量が非常に潤沢というか多い時期なんじゃないかなー、と。まあ、大部分は重版が掛からなくて消えた本wですので、商業的には失敗してるんですが(^^;)
2013-09-24 16:02:58#竹の子書房 ただ、レガシーな書籍を電子化することの意義は、「売れなかったけどもしかしたら面白かったかも知れない本」に後年の人がアクセスできる機会を残しておく、という点にもあるので、日の目を見ない絶版本の内容の是非はここでは問わないことにしておきます。(問うたら自分にダメージ)
2013-09-24 16:03:58リフロー電子書籍の作成手順と校正地獄変
#竹の子書房 で。この「紙の書籍からテキストデータを取り出す」というのは、技術的には割と確立されています。手順としては、「本を裁断(最近は裁断しないでスキャンするスキャナも出てきました)」→「スキャンして画像データを取り出す」→「同時にOCRでテキストを読み出す」→
2013-09-24 16:05:22#竹の子書房 OCRで読み出したテキストの信頼性は年々精度が高まっている――とはいえ、100%の精度であるわけではありません。残念ながらそこまで高性能にはなってないです。縦書き主体の文庫本はまだマシなほうで、横組みキャプション混在の本はたぶんもっと苦労してます(´Д`)
2013-09-24 16:06:41#竹の子書房 OCRソフトの側で縦組みと横組み、ルビなどを区別して読み込んでくれるものもあるようですが、そういう複雑な組版をしているものは当然ながら識字率が下がってきます。つまり誤認識が出ます。
2013-09-24 16:07:50#竹の子書房 この、「断裁」「スキャン」「OCR取り込みしてテキスト化」ここまではほとんど自動化できてるというか(人間の手は介しますが)、手順としては確立されてるかなー、と。問題はこの先。
2013-09-24 16:08:25#竹の子書房 OCRで取り込んで吸い出したテキストデータは、100%信頼できません。ので、元の原本と読み合わせて校正をしなければなりません。元の原稿に直し漏れの誤字がある場合はともかく、OCRで吸い出す時点で「紙書籍には存在していないはずの誤字」が新たに生えてるわけです。
2013-09-24 16:09:45#竹の子書房 で、この文字校正というのは実は出版という分野全体でもあまり自動化が進んでいない分野です。日本語は同音異義語や、同じ読み近い意味だけどシチュエーションによって当てはめるべき言葉が違ったり、というのが結構あるので、ソフトで全部処理するのがまだ難しいのです。
2013-09-24 16:11:16#竹の子書房 つーかたぶん、技術的には可能なんだろうなあとは思います。前後の文脈から、「固い」か「硬い」か「難い」か、どれを当てはめるのが正しいか判断する校正ソフトとか。が、それを必要とする現場の規模が小さすぎて、そういうソフトを開発してもペイできないんじゃないかなあ、と。
2013-09-24 16:12:24#校正ソフト 僕はジャストシステムの校正ソフト(共同通信でも使われてるらしい)を使ってますが、これでも「年に何冊も本を出さない個人が、自作の本の校正をするためだけに買うソフト」としては高価すぎるというか元が取れないレベルではないかという気が……。
2013-09-24 16:13:54#竹の子書房 話は戻って、要するに「OCRが間違えた文字」を「人間の目で確かめて直す」という校正作業は、どうあっても避けられない。そして、ここに一番コストが掛かるのではないかと思います。コストは「校正作業者を拘束する人件費」と「時間」。
2013-09-24 16:14:57#竹の子書房 繰り返しますが、絶版本というのは(一部の例外を除き)「売れないから絶版になった」わけで(ぐふっ)、紙で売れなかった本を電子化したからといって売れるアテがあるわけではありません(ぐはっ)。電子化に関わるコストを掛けても元が取れない可能性のほうが高いわけです(げふっ)
2013-09-24 16:16:12校正ソフトではほとんど「未登録単語」か「誤字」扱いにされますからねえw QT @keiji_kazami: @azukiglg ラノベとかSFの造語沢山とかになってくるとどんなに賢くなっても無理っぽいですねぇw
2013-09-24 16:17:04何かがザクザク突き刺さっていて死にそうに苦しいです(´・ω・`) QT @sekkyonsan: @azukiglg 論じてて苦しそうですが大丈夫ですか
2013-09-24 16:17:30売れないから絶版になったんだよ!(´;ω;`)
#竹の子書房 繰り返しますが「売れなくて絶版にした本を電子書籍にしても売れるアテがないから、そのための経費を掛けられない」。これが絶版本が電子書籍になりにくい最大の理由だと僕は思います。そこらへんの詳しい話はこちらにw(ステマ) http://t.co/NcO41Ou1Bv
2013-09-24 16:19:02#竹の子書房 加えて、電子書籍というのは「実際にDLされた(売れた)分」しか収益が発生しません。紙の本は刷った分を取次に納品した時点で前払いが出ますけど、電子書籍はそれがない。つまり、絶版本を電子書籍にするのは、出版社にとって経費負担と回収リスクが大きすぎる。
2013-09-24 16:20:39#竹の子書房 でも、著者は自分の原稿かわいいですからねw 「売れなかったのは版元に見る目がなかったんだ」とか「営業のターゲッティングが間違ってたんだ」とか「読者がぼんくらだったんだ」とか「時代が早すぎたんだ」とか言って、自分はまちがってなかったと思いたがるもんなんですよw
2013-09-24 16:21:38#竹の子書房 その意味で、「絶版本を電子書籍にして再放流したがっている」のは、出版社ではなくて著者当人だろうなあ、とは思います。絶版本を抱える著者が言うんだから間違いないです(`・ω・´)
2013-09-24 16:22:22@azukiglg Jコミのファンドシステムは一つの回答なんでしょうねぇ。元が取れるだけの予約があればやる、無ければ残念、という。
2013-09-24 16:22:42#竹の子書房 「だったら、著者が身銭切って電子化コストを負担すりゃいいじゃん!」となるわけですが……と・こ・ろ・が。著者は「自分の原稿を売ってお金を貰う」という意識はあっても「自分の本を出すのに自分が身銭を切るのはアマチュアがやること」というプライドがあります。プロほどそうです。
2013-09-24 16:23:58