あー! しまったぁあ! ご指摘猛烈感謝です!! RT @vyv03354: @monokano NFKCで「ド」になりますよ? 半角濁点はU+3099と互換等価です。U+309Bではありません。
2011-03-28 19:45:39『半角カナ2文字「ド」を全角1文字「ド」にするUnicode正規化は存在しない』は正しいです。NFKCでは『基底文字+結合文字の2文字「ド」』になります(Cなのにさらに合成されて全角1文字「ド」にならないのが面白いですね)。 @vyv03354 @query1000
2011-03-28 21:07:10「ド」は、NFKCでは「ド」になるはずです…あれ、Emacsのucs-normalizeはならないなぁ。バグかな。 RT @monokano:『半角カナ2文字「ド」を全角1文字「ド」にするUnicode正規化は存在しない』は正しいです。@vyv03354 @query1000
2011-03-28 23:08:10@kawabata: なるはず…と言われれば、はずですよねえ。でもOSXのAPIを利用した自作ソフトでは合成済み文字のド「U+30C9」にはなりません。バグ?w http://t.co/jHMqmYk @vyv03354 @query1000
2011-03-28 23:26:34【緩募】「ド」をNFKCで正規化すれば「FF84 FF9E > 30C8 3099 > 30C9」になりそうなものなのに、なぜか「30C8 3099」にはなるけど「30C9」にならない理由。
2011-03-28 23:40:17@monokano なるはずですよね。なんでだろ。ここのテストページでは1文字の「ド」になります。 http://bit.ly/fqrenh @query1000 @kawabata @vyv03354
2011-03-28 23:46:24@moji_memo そのテストページ良いですね。ん〜ライブラリの違い? @query1000 @kawabata @vyv03354
2011-03-29 00:04:38@mori_tacsi CotEditoでもやっぱりできませんね。ものかのさんのと同じライブラリなんでしょう。 @usamik26 http://twitpic.com/4ebaf9
2011-03-29 00:31:48@monokano UnicodeCheckerでは、U+FF84 と U+FF9EをNFKCすると U+30C9となりますね。 http://twitpic.com/4ebhub @kawabata @query1000 @vyv03354
2011-03-29 00:54:53ucs-normalizeのNFKCのバグは特定しました。が、これは一部 Unicode.org にも責がある気が… @monokano さんの使ったライブラリはApple謹製ですか?それともソースコード公開のフリーソフト?ひょっとしたら私と同じ場所でミスをしているかもしれない。
2011-03-29 01:10:33だとしたら、ちょっと内部動作は分からないんですね。私は高速化のための最適化処理で、一部ミスりました。問題なのは、Unicodeから提供されている適合性テストスイートではこのミスは検出できない点です。 RT @monokano Apple謹製のCFStringでやってます。
2011-03-29 01:22:05@kawabata 内部動作は分かりません。しかしどうやらCFStringのバグくさいですね。UnicodeChecker.appはNSStringでやっていて、そっちだと正常な結果になるようです。
2011-03-29 01:34:53