西村賢さんのPython内部文字コードの話題から端を発するUnicodeの話
@nalsh ソースセパレーションの原則で異体字としていろいろと入ってるのかもしれませんが、渡辺問題も、歴史的に蓄積した誤字や書体の違いでしかないわけですよね。同じ字である、と。歴史的には活版職人がゲートウェイになって揺れは吸収されていた。抽象して漏すべき違いでは?
2012-03-07 16:44:56@knsmr その判断はわたし達のレイヤで行うものではありません。そもそも人名用漢字とかだと法的に文字種が決まっていたりするので、事は政治問題なのです
2012-03-07 16:47:45@yukihiro_matz 文字のプロだった活版職人が何が同じ文字であるかを判断して包摂するゲートウェイの役割を果たしていたというのは、小林龍生さんの「ユニコード戦記」の受け売りですが、Unicodeが包摂をしているのか抽象して漏らしてるのか、それは議論の余地がありそうな
2012-03-07 16:50:31@nalsh 利用者の感情というのもありますしね、文字の話ってムズカシイどころじゃないのでしょうね、、、
2012-03-07 16:58:32@knsmr @yukihiro_matz あの主張にはわたしは疑問で、そういうの決める主戦場って文化審議会国語分科会なんですよね。そこで戦う武装ってあんまり簡単じゃありませんぜ
2012-03-07 16:59:46@hutai @nalsh 固定長をマーケティングのために喧伝したのは、誤りだった、幻想でしかなかったのに、マーケティングに利用したバカがいるのだと、故樋浦氏が言っていたのを思い出しました。16でも32でも128でもダメなんだ、と
2012-03-07 17:00:38@nalsh @yukihiro_matz 文字は誰が決めるのかって、ヘゲモニー争いもありそうですよね。そういえば「お前の言葉は間違ってる!」と辞書を示して人は罵り合うのに、お前の「邉」は単なる誤字だ!と誰も言わないのはなぜでしょう
2012-03-07 17:02:39@knsmr @nalsh なんか自分が先祖伝来受け継いだ(と思い込んでる)苗字の文字を使うかどうかは、アイデンティティにかかわるんだそうですよ。そうなると人権問題ですよね。
2012-03-07 17:04:16@yukihiro_matz 吉野家の土吉も典型ですよね。あれはブランドロゴでもありますしね
2012-03-07 17:09:17@knsmr そうですね。それらをひっくるめて全部「あれは誤字だ」と決めつけてしまう勇気は私にはありません。あと50年くらいすればなんとかなる、かも?
2012-03-07 17:21:08@nalsh @knsmr 私の希望的観測ですが、そもそも文字とはコンピュータで表現されるものであるという世代ばかりになれば、コンピュータで表示しにくい文字をあきらめることに対する抵抗が減るのではないかと。
2012-03-07 17:23:08@yukihiro_matz @knsmr 我々のレイヤではこれ以上複雑化しないと思いますが、プレゼンテーションレイヤでは最近もiPhoneやMacでの色つき絵文字とか、Unicode結合文字列駆使した複雑な顔文字とか出ているわけで、複雑化はするんじゃないかと
2012-03-07 17:28:12@nalsh @knsmr 50年後なら文字集合を単純化したいという希望が通るかもしれないという予測と、プレゼンテーションレイヤーまで含めると文字列処理は将来、現状よりも複雑化するかもしれないという予測は矛盾はしませんね。
2012-03-07 17:33:05@nalsh それだ! Acid Face Composition Testとかで、正しくUnicode顔文字が出るかをチェック!
2012-03-07 17:34:21明朝時代の書を一生懸命に真似て字を取り入れた日本が、現代になって中国の字なんかと一緒にするなという。変なフォントという。怪しいフォントと言う
2012-03-07 19:27:54java やってる身からすると内部UTF-16というのは実にすばらしいことだという認識なのだが……>西村賢さんのPython内部文字コードの話題から端を発するUnicodeの話 http://t.co/hxYN8LmH
2012-03-07 19:30:56中国人とは英語に漢字を混ぜてチャットする。繁体、簡体、日本の字、どれでも分かればいいやん。友だちの香港人は、どれが簡体なのか意識せずに書くという。便利だから。以前、それは日本の字体だと指摘したら、ああそう?だって。それでいいやん
2012-03-07 19:33:26JavaがUTF-16ですばらしいって思ってる人は、BMP外の文字は非対応って暗黙のうちに決めてるんだろうな。たとえば、String#length()とString#codePointCount()を使い分けているとは思えない。で、いつか泣く、と。
2012-03-08 01:34:29@yukihiro_matz length() とcodePointCount() の違いが効いてくる場面ってどんなのがあるのでしょうか。。。?
2012-03-08 01:50:28