『「青空文庫」はアブナイ?』に、日本語学研究者から一言

近藤泰弘 http://researchmap.jp/yhkondo 青山学院大学 文学部 教授 文法およびコーパス言語学を中心に研究 関連: 「青空文庫」はアブナイ? http://togetter.com/li/434271  以下、私見を述べさせてもらいます。  紙の本を文字コードによる電子データに変換することは、複製ではなく「写本」にならざるをえないのだ、という大前提を忘れた議論は実りがないよ、ということでしょう。  たとえば字の形について。文字コードは限られていますが、紙の続きを読む近藤泰弘 http://researchmap.jp/yhkondo 青山学院大学 文学部 教授 文法およびコーパス言語学を中心に研究 関連: 「青空文庫」はアブナイ? http://togetter.com/li/434271  以下、私見を述べさせてもらいます。  紙の本を文字コードによる電子データに変換することは、複製ではなく「写本」にならざるをえないのだ、という大前提を忘れた議論は実りがないよ、ということでしょう。  たとえば字の形について。文字コードは限られていますが、紙の本に使われている活字には無限と言っていいほどのバリエーションがあります。一例を挙げると、「渡邊」の「邊」の字には、最新のUNICODEには30パターンほどの形が登録されています。 http://internet.watch.impress.co.jp/img/iw/docs/572/392/html/ivs01.png.html しかし、実際の本に登場する「邊」の字の形は、もっと多くのバリエーションがあることでしょう。それを青空文庫は、UNICODEよりも格段にバリエーションの少ないシフトJISコードで表現しようとしています。必然的に、完全な複製は望めず、なんらかのルールの元に変換する=「写す」ことになります。  このようにバリエーションの少ない(自由度の低い)方向に「写す」場合、何らかの情報が欠落するのは避けられません。どの情報を写し、どの情報を捨てるか、そこには価値判断はありますが、論理的に正しい/間違っているという話にはならないでしょう。  たとえば「ケ」問題。「『ケ』に見える文字がある。表音文字に複数の読みがあるのはおかしいが、見え方が大事だ」という価値観と、「『ケ』に見える文字があるが、これは漢字の『个』を意味している。意味が大事だ」という価値観が衝突するわけです。見え方を取るか(ケ)、意味を取るか(ヶ)。文字コードに「写す」ときに両立はしないので、どちらかを捨てねばなりません。言い換えれば、見え方を捨てるか、意味を捨てるか、どちらかを選べ、ということです。これは論理的に正誤が定まる問題ではなく、人の価値観の問題です。  価値観の問題ですから、メリット・デメリットを検討して「こちらの方がより良いのだ」という議論はありえましょうが、「間違いだ」という指摘は自分の価値観を絶対視しているだけの言い掛かりに堕してしまいます。
青空文庫
biac 77009view 31コメント
279
ログインして広告を非表示にする
  • yhkondo @yhkondo 2013-01-06 13:11:26
    「「青空文庫」はアブナイ?」という話題で盛り上がっているようなので、古典語を電子アーカイブにする仕事(研究)をしている日本語研究者の立場から、ちょっと続けて書いてみます。
  • yhkondo @yhkondo 2013-01-06 13:14:22
    まず、ひとつ。「夏目漱石の原稿にあって、(活字)印刷された東京朝日新聞、単行本にはなくなってしまっているものは何か。この問いに稿者なりに答えてみようとしたのが本書である。」という本があります。今野真二『消された漱石』(笠間書院)です。
  • yhkondo @yhkondo 2013-01-06 13:16:53
    今野真二氏には、同様の趣旨をわかりやすく書いた岩波新書の新刊『百年前の日本語』もあるのでお読み下さい。そのまま「写す」ということが至難であり、出版社や研究者にも「難しい」ということがよくわかります。
  • yhkondo @yhkondo 2013-01-06 13:19:12
    そもそも、日本語の文献の歴史を振り返って見ると、「写す」ことは、昔は印刷ではなく、手作業でした。それを「写本」といいます。その写本の方針はどうだったかというと、文字を正確に一字一字写すことよりも、本文が誤って読解されなければよいという方針が第一でした。
  • yhkondo @yhkondo 2013-01-06 13:21:45
    だから、仮名を漢字に置き換えたり、送り仮名を変えたりなどはもちろん、わかりやすくするための字句の書き換えすらよくあったわけです。『源氏物語』など、多くのの古典作品はそうやって今に伝わっています。
  • yhkondo @yhkondo 2013-01-06 13:25:08
    青空文庫は、そういう意味で、現代の「写本」だと思います。人々が電子時代の中で、世に作品を広め、後世に残そうと、電子化することは、昔、『万葉集』や『源氏物語』を写して広めた人々と志を同じくするものだと思います。
  • yhkondo @yhkondo 2013-01-06 13:27:53
    近世・近代になって、印刷術が発展し、商業化されることで、「写す」行為は、出版社が独占し、そこに「著作権」の概念も発生してきたわけですが、著作権から自由になって、無名のボランティアが、写して広める青空文庫は、日本の文献の広まり方の原点に戻るものです。
  • yhkondo @yhkondo 2013-01-06 13:30:14
    いろいろと問題はあり、校訂の方針は決めるべきところは決めるのがいいでしょうが、今後も、日本語文学作品流布の王道を自信を持って進めていって欲しいと思います。日本語研究者もそれを心から応援していると思います。 青空文庫、がんばれ。
  •  
     


    補足と「国がやるべきか」について
  • yhkondo @yhkondo 2013-01-07 14:42:16
    前のツイートは「『「青空文庫」はアブナイ?』に、日本語学研究者から一言」( http://t.co/inJL6JTF)という形で多くの方に読んでいただけて感謝です。 それへの反応の中で、「青空文庫」は、国がするべきではないか?」というご意見もあったのでまたちょっと書きます。
  • yhkondo @yhkondo 2013-01-07 14:43:04
    前回の補足から。青空文庫は「写本」だと書きましたが、それは決して間違いが多いとか、信頼性がないという意味ではありません。いろいろな制約の中で大変にしっかりした仕事をされています。ですから、青空文庫の中の漱石を使って、表記の研究はできませんが、文法研究をすることはできます。
  • yhkondo @yhkondo 2013-01-07 14:44:17
    国がやるべきかどうかということですが、例えば、漱石の場合、青空文庫では、絶版になった一般向け書籍の印刷本を底本に電子化しているわけですが、国が新たに行うとなれば、原稿から行うべきだということになるでしょう。しかし、そのためには、漱石の用語法などについて詳しい研究が必要です。
  • yhkondo @yhkondo 2013-01-07 14:45:24
    日本語を「写す」のは大変に難しいことで、原稿から活字化するにしても、印刷本を電子化するにしても、文字を文字のまま単純に写すだけではことが済みません。
  • yhkondo @yhkondo 2013-01-07 14:45:52
    たとえば、原稿に「生まれる」と「生れる」が混在している場合、印刷に回す際に、意図的な使い分けか、単なるミスかを判断する必要があります。つまり、「写す」際に、文字だけでなく、「生まれる」という単語を絶えず意識しなくてはなりません。
  • yhkondo @yhkondo 2013-01-07 14:46:44
    もし国が漱石の電子版を作るとしたら、漱石の用語からして様々な研究を行って作ることになりますが、多くの研究者が依拠して研究している『漱石全集』とは別バージョンを新たに、国費で作ることになります。それよりは、すでにある、厳密な『漱石全集』を電子化するほうがいいと誰もが思うでしょう。
  • yhkondo @yhkondo 2013-01-07 14:47:40
    しかし、厳密な校訂や注釈を施した全集は、現在も需要があるので、出版社が出版していますし、その全集を編纂し、注釈をつけた研究者の著作権も考えなくてはなりません。ですので、国がするならば、出版社とのコラボレーションによって、出版社と共同で事業を行うのがいいと思います。
  • yhkondo @yhkondo 2013-01-07 14:48:23
    国立国語研究所では、すでにそのような作業を始めています。『現代日本語書き言葉均衡コーパス』というものでは、いろいろな文学作品や雑誌の一部分だけを抜き出して読めるようにして、出版社や著者に損害を与えないような工夫をして、言語研究ができるように研究用本文の公開をしています。
  • yhkondo @yhkondo 2013-01-07 14:49:18
    同じく、国語研究所の『日本語歴史コーパス 平安時代編』では、小学館が、電子化された古典語本文(『古今集』『源氏物語』等)を作成し有料でオンライン公開し(ジャパンナレッジ)、国語研究所が、それをもとに研究者むけの索引を作って公開しています。
  • yhkondo @yhkondo 2013-01-07 14:50:39
    ということで、多くの人が「楽しむ」ための文学作品本文の提供は、やはり、国の仕事ではないと思います。著作権の切れたものについては、民間のボランティアや団体で、そうでないものについては、出版社自らが積極的に電子化を行っていくことが望ましい形だと思います。作者・出版社に期待します。

コメント

  • JBOYSOFT JunjiSuzuki @jboysoft 2013-01-07 01:25:20
    「写本」の解説が面白いと思いました。ちょっと考えただけでも「1.私的なノートテイキング(欲しい本の複写)」「2.依頼された仕事として書き写す(個人依頼と量産)」「3.修行として」「4.読み書きの勉強として」「5.勝手な商売として」などがあり、2.は決定権者の意向が影響すると思うので、「方針」はやはり「時と場合により様々」なのではないかなと想像しました。
  • 山本康彦@BluewaterSoft @biac 2013-01-07 12:15:22
    「青空文庫は間違いだらけ」という風説が広まってるようだが。一連の『「青空文庫」はアブナイ?』騒ぎの中で、写し間違い(底本の読み間違い/ファイルへの書き間違い)は、ただのひとつも発見されなかったはずだ。 青空文庫の「写本ルール」が気に食わない話と、写し間違いを混同してはいけない。
  • たるたる @heporap 2013-01-07 15:05:33
    なぜ文学者ではなく言語学者からこういう話が出るのか、わかりませんが。出版社、出版年(版)によっても記述が違う事があります。そのため、青空文庫では出典として何を元に複製しているか明記する事が(投稿者に)義務づけられています。
  • たるたる @heporap 2013-01-07 15:07:17
    こういう違いは読みやすさや時代背景に応じての再編集という出版社の意見もあり、これは虹著作物として、出版年が著作権の発表年にすべきだという意見もあります。つまり平成元年に書版発行、改変した物を平成20年に発行すると、著作権は平成70年まで有効だ、という考え方です。
  • たるたる @heporap 2013-01-07 15:11:06
    改変、じゃなくて改訂ですね。改訂版に関する編集著作権(表現のアドバイスなど)は、著者にあるのか、出版社(編集者)にあるのか、という点が非常に曖昧だと思います。これが出版権として(おそらく習慣、慣例として)認められていますし、電子出版されない理由もここにあります。
  • たるたる @heporap 2013-01-07 15:15:28
    青空文庫は複数の人により検証される事が多いため、写し間違いはほぼないと思います。間違いは速やかに訂正されますしね。
  • たるたる @heporap 2013-01-07 15:16:30
    昔の写本は墨で書いているため、間違えるとその紙一枚分を丸ごと書き直さなければならなかった、というのも、訂正しなかった理由としてはありえるのではないでしょうか。
  • 山本康彦@BluewaterSoft @biac 2013-01-07 15:18:29
    まとめを更新しました。補足と「国がやるべきか」についてのツイートを追加しました。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-07 15:38:02
    「言葉づかい」の問題だからじゃないですか?日本語学者の方からのコメントが入った理由。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-07 15:39:46
    日本文学と日本語学は分断された「全く異質な学問」というわけではありません(勿論、同一でもないんですけど)専攻を選択する直前までは同じ勉強もします。また文学的著作物への「語学的見地」からアプローチした研究も存在します。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-07 15:41:05
    それはそうと、こういうアーカイブは、むしろ「国は手出ししない方が良い」というのが私個人の見解です。国が関わるとどうしても政治的意図に翻弄されやすくなりますし。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-07 15:45:23
    有志・企業・その気がある人が居るなら、電子写本の基金を立ちあげて運営する等。「民」の方でやった方がいいでしょうね。そもそも作家の皆様は政府に雇われて著作物を記したわけではないのですし。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-07 15:48:28
    青空文庫の志は高く評価するものですが、競争相手は居てもいいと思っています。意識しあうことで切磋琢磨もされると期待されるところですし、取りこぼされた作品を別の団体が拾うということも、複数団体あれば起きるでしょう。読者の選択肢は多い方が良いと思っています。
  • yhkondo @yhkondo 2013-01-07 15:49:46
    ochagashidouzoさん、私の意図をうまく説明してくだってありがとうございます。ツイートをたどったら、写本論も、ochagashidouzoさんがおっしゃってましたね。^^;
  • たるたる @heporap 2013-01-08 01:27:47
    ochagashidouzo なるほど。http://togetter.com/li/434271 こちらでは「話」「話し」の違いが例に挙がってますが、名詞としての「はなし」は「話」、動詞の連体形としての「はなし」は「話し」と書きますし、そういうミスがありそうですね。
  • たるたる @heporap 2013-01-08 01:28:55
    そういう点を考えれば、国語の文法が間違って伝わってしまう可能性もあるかもしれません。教科書だけが国語を習う場ではありませんから。
  • たるたる @heporap 2013-01-08 01:32:30
    ochagashidouzo 元々はそういう作業を個人個人で勝手に行われた事を、「パブリックドメイン」を理由に一カ所に集めたもの(複製した)が、青空文庫の原点では無いでしょうか。選択肢は多い方が良いとはいえ、有料の電子出版業界のような「客の取り合い」になると、また主旨が変わってくると懸念します。
  • たるたる @heporap 2013-01-08 01:33:31
    読みやすさ等もありますし、お互いに情報提供し合えるようになれば良いと思いますけどね。
  • たるたる @heporap 2013-01-08 02:04:58
    http://togetter.com/li/434271 こちらのコメントにもありますが、間違い指摘があれば訂正されます。「この出版社のこの版と違う」というのであれば、それはむしろ出版社に指摘すべきだと思います。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-08 07:37:14
    heporap 有料メディアであっても、著作権失効作品は複数の出版社で発行されている例があります。それで誰かが損失を被ったとも聞き及びません。無料で開放されているものに、複数の選択肢ができることのデメリットは、私にはちょっと思いつけません。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-08 07:43:18
    「話」と「話し」の違いについては、現在は名詞と動詞として区別されていますが、文法も「昔からこのように定まっていた」というものではありません。「アブナイ」の方でも若干言及していますが、中古の文章には句読点・カギ括弧・濁点もありません。段落もそうじゃなかったかな?これらは文章が連綿と綴られるにつれて発明や導入されたものです。ですから、変化=間違いと見るのは、些か短絡的ではないかな、と考えます。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-08 07:47:27
    青空文庫さんの内情は知りませんが、誰か一人の思いつきだけでできたものでないことは確かかと思います。賛同者が多数いてこそ成り立った企画です。一方で、同じ志を持つ人が全て青空文庫さんに所属する決まりも必要も無いと思うのですね。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-08 08:06:14
    なお、今回俎上にあがりました漱石につきましては、「現代小説の礎」を築く為に作家が悪戦苦闘(言文一致運動など有名ですね)していた時代の人であり、作品です。翻れば、現代国語文法というものは明治以降から、と比較的歴史浅いんですよね。土台はあったんですけど。勿論、それ以前からの土台もあったんですけれど。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-08 08:19:57
    えーと、まあ、なんか散漫になってしまってすみません。「文法至上主義」に流れるのもちょっと危ないかな、と思ったりなどします。写すにあたっては、底本に忠実であることが望ましく、しかし、それが読みやすさを損ねるなら議論の余地があるかな、と。難しいですね。
  • お茶菓子の司書刀匠@壱岐津 礼 @ochagashidouzo 2013-01-08 08:23:33
    難しいのは……、これまた別口の話になりますが、「読みにくい書き方がその人のスタイル」みたいな場合もありまして、この辺に見極めなどはなかなか悩ましいな、と思います。
  • たるたる @heporap 2013-01-11 01:07:48
    公的文書か私的文書かで違うと思うのですが、物書きのプロが公的な文書を書くのであれば、その時点での最新の正しい文法を使うべきではないかと思います。私に取っては、小説家の書く小説はプロが書く公的文書(「公文書」という意味ではなく、公の場での文書)ではないかと思います。
  • たるたる @heporap 2013-01-11 01:09:16
    必ずしも文法至上主義をやっているわけではありません。いわゆるTPOだと思いますが、小説家であるなら小説家としてのプライドくらいは持っていてもいいんじゃないでしょうか。その見せ場の一つが文法だと思います。
  • murk @peacete 2013-01-12 01:34:26
    最新の正しい文法ってなんじゃらほい。小説の可能性は文法の可能性よりよりも大きいものですぜ。
  • NiKe @fnord_jp 2013-01-12 10:17:59
    いくつかのまとめとブログを見たところでは、ここでの話題は面白いけど本筋とは関係ないと思う。
  • きゃっつ(Kats)⊿7/29欅京都個握 @grayengineer 2013-01-12 13:42:58
    歴史学やってると「ママ」(おそらく間違いと思われるけど原文にそう書いてあるのでそのまま)とかたくさん経験するし、聖書をまじめにちゃんと読むと、写本による差異などが注釈としてついていたりするので、このへんの問題は身近なものですね
  • くゐかう @seijun45 2013-01-12 19:36:02
    根本的問題として、假名遣を改めてゐる時點で既に終つてゐる。誤字脫字の類の修正等は問題無いと思ふが、假名遣を現代表記に差替へるのは著者等に對する冒瀆以外の何者でもない。

カテゴリーからまとめを探す

「写真」に関連するカテゴリー