「クメール文字とUnicode」補遺

@koshian さんのまとめ(http://togetter.com/li/752547)に関連する補足情報です。技術的に細かい話にも立ち入っています(また調べたら追記する予定)。
13
山田崇仁 @TakahitoYamada

@LGRikka 小林氏の論文が収録されている当該誌のPDFは、jaet.gr.jp/jj/6.htmlで公開されています。

2014-12-01 23:17:15
@LGRikka

@TakahitoYamada 情報ありがとうございます。興味を持ってくださった方が多くいらっしゃるので、RTさせていただきました。

2014-12-01 23:28:49
狩野宏樹 @KAN0U

@LGRikka 「か゚」等はその仕組で表すことになっています。JIS X 0213:2000に入ったので追加申請したけど組み合わせで行けるから、と却下されました。ネームドキャラクターシーケンスunicode.org/reports/tr34/で対応したのもクメール文字と同じ落し所。

2014-12-01 23:42:25
@LGRikka

@KAN0U 前回の授業は日本語に関してのものだったので、半濁点つきの文字に関しても伺いました。アイヌ語の小さい「プ」に関しても、小さい「フ」があるからということで、「フ」+半濁点で表すようになっているみたいですね。

2014-12-01 23:44:55
狩野宏樹 @KAN0U

@LGRikka 母語話者の直観というか、素朴に形にコードを割り当てて表示順にコード化する方法を取り入れたタイ文字(先に国内規格が普及していた)では並べ替えの処理が要らない分、辞書順の並べ替えとか音節境界を守った改行の禁則処理とか音声読み上げとかではソフト側が頑張る必要があります

2014-12-02 00:06:41
狩野宏樹 @KAN0U

@LGRikka この辺の比較は、 峰岸真琴先生の『タイ語,ラオス語,カンボジア語(クメール語)の文字処理と組版における課題』 aa.tufs.ac.jp/~mmine/lecture… がオンラインで読める日本語情報としては最も詳しいかと思います。

2014-12-02 00:11:11
(Ǝ)ɐsıɥıɥso⅄ ouɐɓnS @koshian

これは合字の話か。2〜3年位前にカンボジアの BarCamp に行った時に、この合字が Android でうまくできないみたいな話を聞いてきた覚えがある。

2014-12-02 02:43:29
@LGRikka

クメール文字とUnicode - Togetterまとめ togetter.com/li/752547 自分でまとめようと思っていたら、まとめて下さった方がいらっしゃったようです。ありがとうございます。

2014-12-02 12:06:47
狩野宏樹 @KAN0U

.@koshian さんの「クメール文字とUnicode」をお気に入りにしました。山田崇仁先生と私のリプライ(コメントに書きました)も参考にしていただければ(拾遺: twitter.com/KAN0U.. togetter.com/li/752547

2014-12-02 12:52:25
(Ǝ)ɐsıɥıɥso⅄ ouɐɓnS @koshian

FBでプノンペン在住の日本人の方に情報を頂いたのだけど、クメール文字のUnicode対応は合字(リガチャ)のアルゴリズムを開発できるほど市場が大きくなくて、アラビア文字あたりのを流用してるのだとか。こういうの NGO とか NPO とかで開発できないものかなあ。文字とか基本じゃん

2014-12-02 13:13:39
(Ǝ)ɐsıɥıɥso⅄ ouɐɓnS @koshian

現状の Unicode に収録されてるクメール文字も、決して実際の使用に則したものではないらしい。2文字のものが1文字になってたり使用頻度の低い文字が入ってる割によく使う文字が入ってなかったりしてるんだとか。

2014-12-02 13:15:56
Yasu @yasuns

虐殺により文化の継承が途切れた結果。 クメール文字とUnicode - Togetterまとめ togetter.com/li/752547

2014-12-02 16:12:08
銀杏並木 @gingkotrees

文字コードを決めないと使えないとはいえ、文字は文化に根ざしてるから、外国人とか言語を知らないパソコンオタクが決めてもなあ>クメール文字とUnicode - Togetterまとめ togetter.com/li/752547

2014-12-02 16:58:02
小形克宏 @ogwata

たいへん興味深く読みました。小林氏の論文も読んでみたのですが、そこでのポイントは〈カンボジア問題の悲劇は、母語利用者だけではなく、善意の協力者のすべてが、現代的な情報通信技術の水準について無知だった.. togetter.com/li/752547#c169…

2014-12-02 17:41:17
ɐʇuoɓ @gnt

わりと具体的なデジタル・ディバイド。 / “クメール文字とUnicode - Togetterまとめ” htn.to/x4DfWz

2014-12-02 20:10:27
Qvarie @qvarie

#unicode でクメール文字を制定する際にブロック問題があったのですが、カンボジア側にとって当初は脚文字も1個のグリフで表現したかったこともあったようです。togetter.com/li/752547

2014-12-02 20:30:42
TokusiN @toku51n

クメール文字のUnicodeでの実装が酷いって話が流れてきてるけど、きちんとした文字体系が確立していない以上、おかしなコードでもとりあえず表示できるように実装するか、もしくはその言語の辞書が出来るまでUnicode環境で一切表示できない状態にしておくかを選ぶって事だよなぁ。

2014-12-02 20:31:25
くま ก็็็็็็็็็็็็็ʕ•͡ᴥ•ʔ ก้้้้้้้้้้้ @kumack55

クメール語がUnicodeに入ったのは3から?2000年あたりのことなのかな。内戦が終わって20年といったところか。 言語学者なんかいないのも無理はない・・・。

2014-12-02 20:37:54
Qvarie @qvarie

#unicode のクメール文字は、U+17A2 QA《អ》とU+17A3 QAQ《ឣ》は見た目が同じで前者が母音字、後者が《ក្ឣ》とCOENG記号を使って合字を作るための字母なので、見分けが難しいものです。

2014-12-02 20:52:18
Norihiro Kumagai @tendai22plus

@kki_nyan なぜこのタイミングでクメール文字をUnicodeで規定したのだろうか?然るべきnational bodyが出来るまで待てば良いのにと思うのはナイーブ過ぎるのか(^^)

2014-12-02 21:02:30
藁科 英司 @hamanako

クメール文字とUnicode のまとめを読んで:、日本史に興味が湧いた。日本文学の変遷が政体と対応させられていて、その始まりが飛鳥時代からの上代文学だそうだ。この時期に古墳時代までのヤマト王権スタイルから中華風天皇スタイルに政体を切り替えつつ文字を導入した恩恵を現代受けてるんだな

2014-12-02 21:13:29
だよもんフレンズは在宅BSD仕事したい @daemon1995

クメール文字に限らず、漢字もたいがいだけどな。やっぱUnicodeは犯罪なのでやめて、TRONコードを復活させてオープンにした方がマシじゃね?

2014-12-02 21:15:06
成瀬 @nalsh

クメール文字とか日本人が安易に触っていいような話じゃないと思うのだが

2014-12-02 21:18:33
SODA Noriyuki @n_soda

「ユニコード戦記」 amazon.co.jp/dp/450154970X にも、クメール文字の話載ってたような

2014-12-02 21:48:23
LM-7 @LunarModule7

『クメール文字とUnicode』 togetter.com/li/752547 日本語はちゃんと見てくれている人がいる点で恵まれている。いつまでいるかわからないけど。

2014-12-02 22:36:43