「クメール文字とUnicode」補遺
@LGRikka 小林氏の論文が収録されている当該誌のPDFは、jaet.gr.jp/jj/6.htmlで公開されています。
2014-12-01 23:17:15@LGRikka 「か゚」等はその仕組で表すことになっています。JIS X 0213:2000に入ったので追加申請したけど組み合わせで行けるから、と却下されました。ネームドキャラクターシーケンスunicode.org/reports/tr34/で対応したのもクメール文字と同じ落し所。
2014-12-01 23:42:25@KAN0U 前回の授業は日本語に関してのものだったので、半濁点つきの文字に関しても伺いました。アイヌ語の小さい「プ」に関しても、小さい「フ」があるからということで、「フ」+半濁点で表すようになっているみたいですね。
2014-12-01 23:44:55@LGRikka 母語話者の直観というか、素朴に形にコードを割り当てて表示順にコード化する方法を取り入れたタイ文字(先に国内規格が普及していた)では並べ替えの処理が要らない分、辞書順の並べ替えとか音節境界を守った改行の禁則処理とか音声読み上げとかではソフト側が頑張る必要があります
2014-12-02 00:06:41@LGRikka この辺の比較は、 峰岸真琴先生の『タイ語,ラオス語,カンボジア語(クメール語)の文字処理と組版における課題』 aa.tufs.ac.jp/~mmine/lecture… がオンラインで読める日本語情報としては最も詳しいかと思います。
2014-12-02 00:11:11これは合字の話か。2〜3年位前にカンボジアの BarCamp に行った時に、この合字が Android でうまくできないみたいな話を聞いてきた覚えがある。
2014-12-02 02:43:29クメール文字とUnicode - Togetterまとめ togetter.com/li/752547 自分でまとめようと思っていたら、まとめて下さった方がいらっしゃったようです。ありがとうございます。
2014-12-02 12:06:47.@koshian さんの「クメール文字とUnicode」をお気に入りにしました。山田崇仁先生と私のリプライ(コメントに書きました)も参考にしていただければ(拾遺: twitter.com/KAN0U.. togetter.com/li/752547
2014-12-02 12:52:25FBでプノンペン在住の日本人の方に情報を頂いたのだけど、クメール文字のUnicode対応は合字(リガチャ)のアルゴリズムを開発できるほど市場が大きくなくて、アラビア文字あたりのを流用してるのだとか。こういうの NGO とか NPO とかで開発できないものかなあ。文字とか基本じゃん
2014-12-02 13:13:39現状の Unicode に収録されてるクメール文字も、決して実際の使用に則したものではないらしい。2文字のものが1文字になってたり使用頻度の低い文字が入ってる割によく使う文字が入ってなかったりしてるんだとか。
2014-12-02 13:15:56虐殺により文化の継承が途切れた結果。 クメール文字とUnicode - Togetterまとめ togetter.com/li/752547
2014-12-02 16:12:08文字コードを決めないと使えないとはいえ、文字は文化に根ざしてるから、外国人とか言語を知らないパソコンオタクが決めてもなあ>クメール文字とUnicode - Togetterまとめ togetter.com/li/752547
2014-12-02 16:58:02たいへん興味深く読みました。小林氏の論文も読んでみたのですが、そこでのポイントは〈カンボジア問題の悲劇は、母語利用者だけではなく、善意の協力者のすべてが、現代的な情報通信技術の水準について無知だった.. togetter.com/li/752547#c169…
2014-12-02 17:41:17#unicode でクメール文字を制定する際にブロック問題があったのですが、カンボジア側にとって当初は脚文字も1個のグリフで表現したかったこともあったようです。togetter.com/li/752547
2014-12-02 20:30:42クメール文字のUnicodeでの実装が酷いって話が流れてきてるけど、きちんとした文字体系が確立していない以上、おかしなコードでもとりあえず表示できるように実装するか、もしくはその言語の辞書が出来るまでUnicode環境で一切表示できない状態にしておくかを選ぶって事だよなぁ。
2014-12-02 20:31:25クメール語がUnicodeに入ったのは3から?2000年あたりのことなのかな。内戦が終わって20年といったところか。 言語学者なんかいないのも無理はない・・・。
2014-12-02 20:37:54#unicode のクメール文字は、U+17A2 QA《អ》とU+17A3 QAQ《ឣ》は見た目が同じで前者が母音字、後者が《ក្ឣ》とCOENG記号を使って合字を作るための字母なので、見分けが難しいものです。
2014-12-02 20:52:18@kki_nyan なぜこのタイミングでクメール文字をUnicodeで規定したのだろうか?然るべきnational bodyが出来るまで待てば良いのにと思うのはナイーブ過ぎるのか(^^)
2014-12-02 21:02:30クメール文字とUnicode のまとめを読んで:、日本史に興味が湧いた。日本文学の変遷が政体と対応させられていて、その始まりが飛鳥時代からの上代文学だそうだ。この時期に古墳時代までのヤマト王権スタイルから中華風天皇スタイルに政体を切り替えつつ文字を導入した恩恵を現代受けてるんだな
2014-12-02 21:13:29クメール文字に限らず、漢字もたいがいだけどな。やっぱUnicodeは犯罪なのでやめて、TRONコードを復活させてオープンにした方がマシじゃね?
2014-12-02 21:15:06『クメール文字とUnicode』 togetter.com/li/752547 日本語はちゃんと見てくれている人がいる点で恵まれている。いつまでいるかわからないけど。
2014-12-02 22:36:43