西村賢さんのPython内部文字コードの話題から端を発するUnicodeの話

西村賢 (@knsmr)さんのPython内部文字コードの話題から端を発するUnicodeの話というかハンドアックスの応酬。
41
前へ 1 ・・ 3 4 次へ
成瀬 @nalsh

@kumasiro BlackBerryとかWindowsMobileとか

2012-03-07 16:43:30
西村 賢🐠Coral Capital, Partner @knsmr

@nalsh ソースセパレーションの原則で異体字としていろいろと入ってるのかもしれませんが、渡辺問題も、歴史的に蓄積した誤字や書体の違いでしかないわけですよね。同じ字である、と。歴史的には活版職人がゲートウェイになって揺れは吸収されていた。抽象して漏すべき違いでは?

2012-03-07 16:44:56
成瀬 @nalsh

@knsmr その判断はわたし達のレイヤで行うものではありません。そもそも人名用漢字とかだと法的に文字種が決まっていたりするので、事は政治問題なのです

2012-03-07 16:47:45
西村 賢🐠Coral Capital, Partner @knsmr

@yukihiro_matz 文字のプロだった活版職人が何が同じ文字であるかを判断して包摂するゲートウェイの役割を果たしていたというのは、小林龍生さんの「ユニコード戦記」の受け売りですが、Unicodeが包摂をしているのか抽象して漏らしてるのか、それは議論の余地がありそうな

2012-03-07 16:50:31
西村 賢🐠Coral Capital, Partner @knsmr

@nalsh 利用者の感情というのもありますしね、文字の話ってムズカシイどころじゃないのでしょうね、、、

2012-03-07 16:58:32
成瀬 @nalsh

@knsmr @yukihiro_matz あの主張にはわたしは疑問で、そういうの決める主戦場って文化審議会国語分科会なんですよね。そこで戦う武装ってあんまり簡単じゃありませんぜ

2012-03-07 16:59:46
西村 賢🐠Coral Capital, Partner @knsmr

@hutai @nalsh 固定長をマーケティングのために喧伝したのは、誤りだった、幻想でしかなかったのに、マーケティングに利用したバカがいるのだと、故樋浦氏が言っていたのを思い出しました。16でも32でも128でもダメなんだ、と

2012-03-07 17:00:38
西村 賢🐠Coral Capital, Partner @knsmr

@nalsh @yukihiro_matz 文字は誰が決めるのかって、ヘゲモニー争いもありそうですよね。そういえば「お前の言葉は間違ってる!」と辞書を示して人は罵り合うのに、お前の「邉」は単なる誤字だ!と誰も言わないのはなぜでしょう

2012-03-07 17:02:39
成瀬 @nalsh

@knsmr @yukihiro_matz 言ってますよ。答えて曰く森鴎外が云々

2012-03-07 17:04:00
Yukihiro Matz @yukihiro_matz

@knsmr @nalsh なんか自分が先祖伝来受け継いだ(と思い込んでる)苗字の文字を使うかどうかは、アイデンティティにかかわるんだそうですよ。そうなると人権問題ですよね。

2012-03-07 17:04:16
西村 賢🐠Coral Capital, Partner @knsmr

@yukihiro_matz 吉野家の土吉も典型ですよね。あれはブランドロゴでもありますしね

2012-03-07 17:09:17
西村 賢🐠Coral Capital, Partner @knsmr

(モヒカンなRubyコミッタの人たちに斧を投げられまくった。恐ろしい午後でした...)

2012-03-07 17:12:06
Yukihiro Matz @yukihiro_matz

@knsmr そうですね。それらをひっくるめて全部「あれは誤字だ」と決めつけてしまう勇気は私にはありません。あと50年くらいすればなんとかなる、かも?

2012-03-07 17:21:08
成瀬 @nalsh

@yukihiro_matz @knsmr ぼかぁもっとカオスになると思うなー

2012-03-07 17:21:30
Yukihiro Matz @yukihiro_matz

@nalsh @knsmr 私の希望的観測ですが、そもそも文字とはコンピュータで表現されるものであるという世代ばかりになれば、コンピュータで表示しにくい文字をあきらめることに対する抵抗が減るのではないかと。

2012-03-07 17:23:08
成瀬 @nalsh

@yukihiro_matz @knsmr 我々のレイヤではこれ以上複雑化しないと思いますが、プレゼンテーションレイヤでは最近もiPhoneやMacでの色つき絵文字とか、Unicode結合文字列駆使した複雑な顔文字とか出ているわけで、複雑化はするんじゃないかと

2012-03-07 17:28:12
Yukihiro Matz @yukihiro_matz

@nalsh @knsmr 50年後なら文字集合を単純化したいという希望が通るかもしれないという予測と、プレゼンテーションレイヤーまで含めると文字列処理は将来、現状よりも複雑化するかもしれないという予測は矛盾はしませんね。

2012-03-07 17:33:05
西村 賢🐠Coral Capital, Partner @knsmr

@nalsh それだ! Acid Face Composition Testとかで、正しくUnicode顔文字が出るかをチェック!

2012-03-07 17:34:21
西村 賢🐠Coral Capital, Partner @knsmr

明朝時代の書を一生懸命に真似て字を取り入れた日本が、現代になって中国の字なんかと一緒にするなという。変なフォントという。怪しいフォントと言う

2012-03-07 19:27:54
伊津野 英克 @hidekatsu_izuno

java やってる身からすると内部UTF-16というのは実にすばらしいことだという認識なのだが……>西村賢さんのPython内部文字コードの話題から端を発するUnicodeの話 http://t.co/hxYN8LmH

2012-03-07 19:30:56
西村 賢🐠Coral Capital, Partner @knsmr

中国人とは英語に漢字を混ぜてチャットする。繁体、簡体、日本の字、どれでも分かればいいやん。友だちの香港人は、どれが簡体なのか意識せずに書くという。便利だから。以前、それは日本の字体だと指摘したら、ああそう?だって。それでいいやん

2012-03-07 19:33:26
Yukihiro Matz @yukihiro_matz

JavaがUTF-16ですばらしいって思ってる人は、BMP外の文字は非対応って暗黙のうちに決めてるんだろうな。たとえば、String#length()とString#codePointCount()を使い分けているとは思えない。で、いつか泣く、と。

2012-03-08 01:34:29
fkm @fkm

@yukihiro_matz サロゲートペアあたりの話でしょうか。。。?

2012-03-08 01:41:49
fkm @fkm

@yukihiro_matz length() とcodePointCount() の違いが効いてくる場面ってどんなのがあるのでしょうか。。。?

2012-03-08 01:50:28
前へ 1 ・・ 3 4 次へ