限定公開でまとめを作れば、相互フォローやフォロワー限定でまとめを共有できます!

文字化けの饗宴:スマートフォンにおける厄介な文字の表示実験(当日編)

ツイッターにて、情報交換で問題になりそうな漢字を送出し、スマートフォン・ユーザーにスクリーンショットを送ってもらうよう呼びかけました。このまとめは当日のものです。後日のやりとりは「文字化けの饗宴:スマートフォンにおける厄介な文字の表示実験(後日編)」 http://togetter.com/li/160102 を御参照ください。
インターネット 文字化け 文字コード 正規化 Unicode
10921view 12コメント
30
小形克宏 @ogwata
【募集】auのIS03以外をお持ちの、スマートフォンのオーナーにお願いします。とくにドコモ、及びiPhoneの方。この直後に流すツィートのスクリーンショットを撮って、小形にリプライしていただけないでしょうか。執筆中の原稿に使用します。採用の場合はお名前を掲載させていただきます。
小形克宏 @ogwata
【テスト】(U+20BB7)、(U+20B9F)、髙(U+9AD9)、神(U+FA19)、海(U+FA45)、塡(U+5861)、剝(U+525D)、頰(U+9830)、餌(U+990C)、辻(U+8FBB)、葛(U+845B)、鯖(U+9BD6)、噌(U+564C)
鶚/みさご @osprey74
@ogwata スクリーンショットはこれで良いのでしょうか? http://flic.kr/p/9VqnSt
小形克宏 @ogwata
あー、中止、ごめんなさい、ペーストしたらサロゲートペアの文字が消えた〜〜w 
鈴木一雅/TAO-TAO@親10年目 @dont_eats
IS03は、SDKが必要なんでしたっけ?RT @ogwata 【募集】auのIS03以外をお持ちの、スマートフォンのオーナーにお願いします。とくにドコモ、及びiPhoneの方。この直後に流すツィートのスクリーンショットを撮って、小形にリプライしていただけないでしょうか。
小形克宏 @ogwata
@osprey74 さっそくありがとうございます。問題があったので、例題をこの後再送します。
小形克宏 @ogwata
@tonybin すいません、ちょっとお待ちください。この後再送したもので撮影をお願いします!
小形克宏 @ogwata
では、みなさん、いきますよ。
小形克宏 @ogwata
【テスト】𠮷(U+20BB7)、𠮟(U+20B9F)、髙(U+9AD9)、神(U+FA19)、海(U+FA45)、塡(U+5861)、剝(U+525D)、頰(U+9830)、餌(U+990C)、辻(U+8FBB)、葛(U+845B)、鯖(U+9BD6)、噌(U+564C)
小形克宏 @ogwata
ClipMenuというペーストボード・ツールを経由して例題をコピーしたら、サロゲートペアが消失してやんの。なんたること!
小形克宏 @ogwata
ありがとうございます! ドコモの機種は何でしょう? RT @osprey74: @ogwata 送ります~ http://flic.kr/p/9VtfpW
小形克宏 @ogwata
ありがとうございます! これはiPhoneですね?RT @kochima3: @ogwata http://twitpic.com/5em0rs
 拡大
鶚/みさご @osprey74
@ogwata SIMフリー版iPhoneにdocomoのSIM入れてますw
小形克宏 @ogwata
@assause うわ、GALAXY S のSSって、サロゲートペアダメのうえに略字体で、しかもU+FA45を正規化してる!! 
小形克宏 @ogwata
おお、ややこしいことしてますねww ごくろうさまです!RT @osprey74: @ogwata SIMフリー版iPhoneにdocomoのSIM入れてますw
小形克宏 @ogwata
@koikekaisho @tonybin @clavi_t 今のところ、iPhoneはパーフェクトですね。何も足さない、何も変わらない。さすが。
小形克宏 @ogwata
ずいぶんサロゲートペアがユニークな化け方ですが、機種はなんでしょう? RT @soba_udon: RT @ogwata: 【テスト】 http://twitpic.com/5em2o6
 拡大
残りを読む(94)

コメント

小形克宏 @ogwata 2011年6月21日
ははは、トゥギャッター自体がサロゲートペアに対応していず、説明分が消失してやんの。情けないというか、これが現実というか。
小形克宏 @ogwata 2011年6月21日
ご協力いただいた皆さまには、あらためてお礼申し上げます。どうもありがとうございました。
小形克宏 @ogwata 2011年6月21日
その後いただいたスクリーンショットを追加しました。それから自分のIS03のも。サロゲートペアが一部だけ化ける不思議なパターンです。
小形克宏 @ogwata 2011年6月21日
漢字の内訳→①サロゲートペア(
小形克宏 @ogwata 2011年6月21日
やっぱりダメだ。再送:漢字の内訳→①サロゲートペア(〓〓)、②UnicodeにあるがJIS X 0213にない字(髙)、③IBM拡張文字(神)、④IBM拡張文字でないJIS X 0213出自の互換漢字(海)、⑤JIS X 0213にある常用漢字(塡剝頰)、⑥2004JIS変更字体の常用漢字(餌葛)、⑦それ以外の2004JIS変更字体(辻鯖噌)
小形克宏 @ogwata 2011年6月21日
ちなみに、U+20B9Fって常用漢字なんだよね〜w。まあ、こんなもんなんだろうな。
あどばーす・よー @AdvYaw 2011年6月22日
OSがサロゲートペアをちゃんと1文字として扱うかと、表示に使用するフォントの対応に依存した気がする。XPでGDIだったかGDI+だったかを使って描画したときは、ピッチが変になった記憶が…。
しめすへん@ネ人造人間 @shimesuhen 2011年6月22日
ちなみにtwitter自身も2年くらい前はサロゲートペア使うとすぐには問題が起きないがしばらくするとサロゲートペア以降が表示されなくなってしまうというバグが発生してました。いつのまにか治ったみたいだけど
小形克宏 @ogwata 2011年6月23日
その後のモロモロを追加しました。
小形克宏 @ogwata 2011年6月25日
応募写真をまとめたページを作成しました。『スマートフォンにおける厄介な漢字の表示実験』 https://idisk.mac.com/ogwata//Public/yakkaina_moji/index.html
E-WA/いーわ @ewa4618 2011年6月30日
Tweetbotの開発元Tapbotsには、とりいそぎ「レアなカンジキャラクタの表示に問題がある」的な文言を添えて、まとめページのURLを送っときました。
小形克宏 @ogwata 2011年7月11日
実験当日と後日の2つに分けたのにともない、説明を書き直しました。これにともない、一部のコメントの意味が通りにくくなってしまいましたがご了承ください。
ログインして広告を非表示にする
ログインして広告を非表示にする