新元号「令和」と文字コード(主にUnicode)の問題

境真良@iU/GLOCOM/METI（あーりん推し/芸能人スキャンダル要らない） @sakaima

「令和」ですが、「令」はUnicode「U+4EE4」、UTF-8だと「E4 BB A4」、シフトJISだと「97DF」、また「和」はUnicode「U+548C」、UTF-8で「E5 92 8C」、シフトJISだと「9861」です。とりあえずご参考まで。 #さてお仕事ですよ

2019-04-01 11:46:49

BugbearR @BugbearR

平成の次、新元号のUnicodeコードポイントは「U 32FF」 | マイナビニュース news.mynavi.jp/article/201809… #マイナビニュース

2019-04-01 17:24:53

プロ生ちゃん（暮井慧）🍍 @pronama

おや！？ U+32FF のようすが……！ #新元号 #プロ生ちゃん pic.twitter.com/4tpw0BX1Bg

2019-04-01 12:52:55

Taro Yabuki @yabuki

U+FA98 unicode.org/cgi-bin/GetUni… は互換漢字，トラブルのもとです．たとえば，・Twitterで使うと，U+FA98はU+4EE4に変わります．・U+FA98とU+4EE4を（Ctrl+Fで）検索するときに同一視するかどうかはブラウザによります．お仕事がちょっと増えた人がいるかもしれません． pic.twitter.com/Ujg5dbXEN2

2019-04-01 13:00:57

拡大

Taro Yabuki @yabuki

U+F9A8です．すいません．

2019-04-01 13:18:20

Haruhiko Okumura @h_okumura

試してみる。 U+4EE4 令 U+F9A8 令 twitter.com/yabuki/status/…

2019-04-01 13:16:36

Haruhiko Okumura @h_okumura

ほんとだ，どちらも U+4EE4 になった

2019-04-01 13:20:00

MAEDA Katsuyuki @keikuma

年号扱うシステムを運用しているところは、これから30日でテスト完了させなきゃいけないわけだけど、U+F9A8 U+548C (令和) のケースと、U+4EE4 U+548C (令和) のケースがあるみたいなのを想定していなかった…って事例はなんかすごくありそう。大丈夫かなぁ…

2019-04-01 14:34:58

Haruhiko Okumura @h_okumura

うちのEmacsだとU+F9A8はショボい字になる。I-searchでも同一視してくれない。いずれにせよU+4EE4で統一してほしい＞令和 pic.twitter.com/Sxc11cz1Uw

2019-04-01 14:54:47

拡大

みずぴ⋈＠NGS（5鯖） @mizpy

Unicodeで「令」の文字コードが２つあるのは KS X 1001 規格の弊害ですね…。（韓国で同じ漢字でも読みが異なる場合に別の文字コードを当てたのが原因）基本的に日本国内で「令」を表示する場合はU+4EE4が使われているはず。

2019-04-01 15:58:15

なぎせゆうき @nagise

「韓国の文字コード規格KS X 1001（収録当時の規格番号はKS C 5601）に含まれる重複漢字との往復変換を保証するために収録された漢字。」とあるので、要するに韓国語の漢字ということになるか。日本語で用いるならU+4EE4を用いるのが正解のようだ。

2019-04-01 16:00:10

㆑ @Wartemeinnicht

令︀(U+4EE4 U+FE00)「令(U+F9A8)がサニタイズされたようだな…」令󠄀(U+4EE4 U+E0100)「フフフ…奴は四天王の中でも最弱…」令󠄁(U+4EE4 U+E0101)「コードポイントではねられるとは異体字のツラ汚しよ…」ちなみに手書き風の令󠄂(U+4EE4 U+E0102)もあります 747.github.io/vsselector/ pic.twitter.com/GjTjBGqVGy

2019-04-01 16:27:06

拡大

わっしー 왓시 @xhioe

いや、U+F9A8は韓国語の頭音法則用に用意された互換漢字（령ではなく영の字として使用）なので日本語で使う選択肢は初めからないのですが…

2019-04-01 16:29:58

㆑ @Wartemeinnicht

むしろ「令和」では語頭に立つので、何かの手違いでKS X 1001式の変換を噛ませたU+F9A8が混入することが現実の可能性として発生する

2019-04-01 16:38:08

ちょまど@ ITエンジニア @chomado

Adobe さん仕事早過ぎではーーーアドビのフォントが新元号「令和」に対応--2パターンの合字を追加 japan.cnet.com/article/351350…

2019-04-01 18:46:02

日本規格協会 @jsainfra

国際標準化機関のISO/IEC JTC1/SC2で、U+32FFの文字コードに割り当てられることが決定している／Adobeが新しい元号の“令和”の合字を小塚明朝や源ノ角ゴシックなどのフォントで追加 mdn.co.jp/di/newstopics/…

2019-04-02 09:28:16

zomysan @zomysan

ブログを書きました。「 #令和」の「令」は、Unicodeにおいて「U+4EE4」「U+F9A8」の２つの符号位置を持つ文字です。| CJK互換漢字とは？新元号「令和」の「令」Unicode符号に注意！ – cod-log cod-sushi.com/unicode-rei/ pic.twitter.com/l7dvIRb7VH

2019-04-01 20:39:16