クメール文字とUnicode

クメール文字がUnicodeに入った経緯がひどいという連続ツイートを見かけたので、感想をまじえつつまとめてみました。 カンボジア在住の皆様の見解や情報などありましたら追記させていただきます。
83
@LGRikka

今日の4限は、Unicodeにクメール文字を入れたとき、どれだけ揉めたかという話だったのだけれど、なかなかそれが複雑な問題を孕んでいたので、自分用の整理がてら連続ツイートしようかなと。

2014-12-01 21:51:00
@LGRikka

「主にカンボジアで使われるクメール文字をUnicodeに入れようとしたとき、カンボジアの言語学者どころかカンボジア人が誰もいない状態で、文字コードの専門家(外国人)だけが集まってリストを作ったせいで、ワケわからん文字は入ってるわ、必要な文字はないわのウンコードになった」っていう。

2014-12-01 21:53:36
(Ǝ)ɐsıɥıɥso⅄ ouɐɓnS @koshian

2009年の BarCamp Phnom Phen で クメール文字が Unicode に入ってみんなこれで母国語が使えるよという発表を会場拍手大喝采で迎えてた現場を見て涙した人間として、とても興味深い話。

2014-12-02 02:44:55
@LGRikka

これだけ聞くと「いやいやいや言語学者呼べよアホか」で済みそうな話なのだけれど、そうはいかない。なぜならカンボジアには当時、「連絡するべきお上の機関」がなかったのだ、という。

2014-12-01 21:54:47
@LGRikka

クメール文字の辞書はロクなのがない、政府なりなんなりの機関もない、正書法が確立されていないからどうしようもない状態だったら、まあ、母語話者の直観とズレた文字コードが出来ちゃっても仕方ないよねという感はある。

2014-12-01 21:56:05
@LGRikka

日本で考えたら、日本に政府がなくて、ひらがなもカタカナも各地方で好き勝手に使ってて、教科書も辞書もなくて、日本語の学者すらいないっていう状態で、アメリカ人とフランス人とドイツ人がひらがなのリスト作るようなもん……そりゃ、変体がなとか、「ヶ」とか間違って収録しちゃうよねーみたいな。

2014-12-01 21:57:38
@LGRikka

しかしながらこれに激怒した人もいた。「何これ全然違うんですけど」っていうことを抗議しに行ったらしい、の、だが、抗議した側はあまりにもデジタルの流行について無知すぎた。そのせいで、ボロカスにやられてしまったのである……。

2014-12-01 21:59:01
@LGRikka

これがその「ボロカス」の内容。そんな言う……?ってくらいボロカス。 pic.twitter.com/GjgfgdlS49

2014-12-01 22:01:12
拡大
@LGRikka

そんでもって、現状、クメール文字は「腐った」文字コードのまま、Unicodeに収録されている(腐ってると言ったのは某先生)。文字コードがウンコードでも、レンダリングを頑張ったり、ワープロソフト側で頑張ってもらえば、使えることは使えるから、という理由で、組み直されることはなかった。

2014-12-01 22:03:10
@LGRikka

「ワープロソフトが頑張る」内容は、たとえばひらがなで説明すると、「ぷ」をひと文字で表すのではなく、「ふ」のコード+「半濁点」のコードで表し、レンダリングでなんとかする、ということ。

2014-12-01 22:04:47
(Ǝ)ɐsıɥıɥso⅄ ouɐɓnS @koshian

これは合字の話か。2〜3年位前にカンボジアの BarCamp に行った時に、この合字が Android でうまくできないみたいな話を聞いてきた覚えがある。

2014-12-02 02:43:29
@LGRikka

確かに、技術を使えば、見た目的には問題がないのかもしれないけれど、やっぱり母語話者の直観とはまったくズレたものが世界で使われるコードとして入れられていることには、私は違和感を覚える。たんなる技術の問題と割り切るか、アイデンティティまで拡大するかは、人によって違うのだろう。

2014-12-01 22:06:29
@LGRikka

私は、たとえ技術上、問題がなくとも、Unicodeに「あいうえおかきくけこ」でも「いろはにほへと」でもなく、「ぬろなしあげすぴ」みたいな順番でひらがなが収録されていたらイヤだと思う。でも、「順番なんてどうでもいいじゃん。ワープロ使ってる間、誰が意識するのさ」っていうのも事実。

2014-12-01 22:07:43
狩野宏樹 @KAN0U

@LGRikka この辺の比較は、 峰岸真琴先生の『タイ語,ラオス語,カンボジア語(クメール語)の文字処理と組版における課題』 aa.tufs.ac.jp/~mmine/lecture… がオンラインで読める日本語情報としては最も詳しいかと思います。

2014-12-02 00:11:11
@LGRikka

クメール文字に関する今回の問題を考えるにあたって、教訓となることは多い。まずは、正書法とも呼べるものを確立しておくこと。その根拠をきちんと示せること。そして、これはとても重要だと思うのだけれど、デジタルに関する知識を仕入れておくこと。

2014-12-01 22:09:05
@LGRikka

最後のことは私がいつも言っていることで、相手のことを知らないままに、相手を批判したり、自分の要求を通すのは難しい。理論言語学に関する学会発表でも、たまに、「その理論、ウン年前に終わったやつじゃない?」みたいな古い理論を例に挙げて、「だから○○はダメだ」みたいなことを言う人がいる。

2014-12-01 22:11:46
@LGRikka

今回のことも、デジタル技術についてもう少し詳しければ、もしくは、教えてもらおう、という感じで下手に出れば、ウンコードになる前に、もう少し前向きな解決策があったように思えてならない。

2014-12-01 22:12:29
@LGRikka

何かの製品が8割組み上がっている段階でそれをブチ壊そうとしてもOKが出ることはそうそうないわけで、「予算の範囲内で、ここと、ここだけ直せませんかね?」っていう提案をしなきゃダメなんじゃないかと。

2014-12-01 22:13:31
@LGRikka

クメール文字に関しても、Unicodeに入れる表が出来上がっていて、実装も始まっていた段階で、突然、丸腰で抗議を入れたのが本当に良くなかった。もう少し、文字コードの流行について詳しかったら、お互いが折り合える点を探すことで、ここまでひどい文字コードにはならなかったんじゃないかと。

2014-12-01 22:14:32
(Ǝ)ɐsıɥıɥso⅄ ouɐɓnS @koshian

クメール文字、カンボジアは70年代に一度完全に文化や伝統を破壊しちゃったから……。首都プノンペンには何度も行ってるが、俺はいまだに「年寄りのカンボジア人」を見たことがない。みんな虐殺されちゃったんだよね……

2014-12-02 02:47:11
@LGRikka

文字コードの話は、聞いているといろいろなことを考えさせられますね。正書法があることがいかに嬉しいことか。辞書があることがいかに恵まれているか。

2014-12-01 22:15:34
@LGRikka

今後、カンボジアが辞書も教科書もしっかり作っていって、正書法が確立して、「誰から見てもこれはクソですわ」みたいな感じになったら、また新たなクメール文字コードができるのかもしれないですね。

2014-12-01 22:16:29
@LGRikka

でも、Unicode側の「クメール文字はカンボジア以外でも使われてるからお前らが代表とか認めないからねプププ」は卑怯だと思うんだな……。「漢字は日本でも使われてるから中国人のもんじゃありませーんwwwww」って言ってるようなもんだ。そりゃ、まあ、そうなんだけど、さあ、っていう。

2014-12-01 22:20:29
@LGRikka

クメール文字のツイート、すごい勢いでRTされてるので関連の資料(今日もらったやつ)を公開しておきますね。 カンボジア代表団をボロカスに叩いてたのはこれです。 ci.nii.ac.jp/naid/400153415… 事のなりゆきが読めるのはこれ。 iss.ndl.go.jp/books/R0000000…

2014-12-01 22:38:06
@LGRikka

ちなみに、実際の文字コード(右)と、カンボジア代表団の提案(左)はこんなにも違った。しかし、代表団の提案も完璧かというとそうでもなく、冗長なところも多々、見受けられる。 pic.twitter.com/huluujGYbP

2014-12-01 22:40:24
拡大