鬼滅の刃の禰󠄀豆子の「禰󠄀」は「禰+異体字セレクタU+E0100」を使わないと表現出来ない字なのでMySQLとかでトラブルが起きるらしい

漢字は難しい
43
ritsuka @ritsukaPya

鬼滅の刃に禰󠄀豆子というキャラがいるらしいけど、禰+異体字セレクタU+E0100を使わないと表現出来ない字なのか。 それでデフォルトではUTF-8は3バイトまでと決め打ちしてたMySQLとかそれを使うWordPressでトラブル起こすらしい

2022-02-01 11:41:18

本当だ!

Enomotchy @Oos1812

「禰」でも「祢」でもなく 「禰󠄀」だったか。 twitter.com/ritsukaPya/sta…

2022-02-02 22:30:08
takelog / WATANABE, Takeo @takelog

そんな字を当てた、原作の作者を小一時間問い詰めたい。 twitter.com/ritsukaPya/sta…

2022-02-02 01:15:34
さぼへんてこ太郎 @sabonawa

常用漢字じゃないし公的な文書なら「ね豆子」になんのかなあ twitter.com/ritsukaPya/sta…

2022-02-01 18:21:21
deepster @rolly_jp

あれ?と思い本家で確認したら「禰󠄀豆子」だった Wikipedia とかで「禰豆子」になってるのはそういうことなのかな? twitter.com/ritsukaPya/sta…

2022-02-01 18:13:35
Jako(旧名:色寺三夜)(𝘿𝙚𝙥𝙧𝙚𝙘𝙖𝙩𝙚𝙙) @shikizimiya

ネ豆子表記にしないと駄目なのか tomcatとかも若干怪しいんだが大丈夫なんだろうか…… twitter.com/ritsukaPya/sta…

2022-02-02 00:50:06
k @YWx0bm9p

うっかり本番で踏みそうな、本当に踏みそうな怖い話。 twitter.com/ritsukaPya/sta…

2022-02-01 13:28:44
じゅび。 @haiirojubit

アマプラくんもそういう事なんだろうか。 twitter.com/ritsukaPya/sta… pic.twitter.com/XFQxaRW07I

2022-02-02 19:07:26
拡大
拡大
YAMAMOTO Yuji (HN: すがすがC言語) @igrep

github.com/minimaxir/big-… に既に載ってるかな、と思ってみたら載ってなかった(同類の文字が載っていそうだけど twitter.com/ritsukaPya/sta…

2022-02-01 17:44:48

贅沢な文字だな

Tellur @Tellur128

しょぼいUTF-8の実装は鬼扱いされている・・・ というか絵文字が通らないDBなんてしょぼすぎる。 twitter.com/ritsukaPya/sta…

2022-02-01 20:12:04
さつまいも星人 (LLM:Limited Language Man) @jpnchk

ふん。異体字セレクタも使うのかい。贅沢な名だね。今からお前の名前は、ね豆子(ねはネに爾)だ。 twitter.com/ritsukaPya/sta…

2022-02-02 12:10:18
那賀 樹一郎 Kiichiro-Kyle NAKA @knaka

先行文字に後置される「異体字セレクタ文字」VARIATION SELECTOR 1~256があり、17~が漢字用。「禰󠄀」一文字がUTF-8だと7バイトかよ、うへー禰󠄀豆子よ贅沢だぞ // 異体字セレクタ - Wikipedia ja.wikipedia.org/wiki/%E7%95%B0… twitter.com/ritsukaPya/sta…

2022-02-01 21:37:35

回避方法はあるのか

てもさわ @6LR61YXJ

utf8mb4に切り替えるきっかけになりがち twitter.com/ritsukaPya/sta…

2022-02-01 21:47:43
anatawa12 @anatawa12@misskey.niri.la @kakerigawa

mysqlのutf8とutf8mb4かぁ (トラブルって何だろ。普通にサロゲートペアにならないってこと?) twitter.com/ritsukaPya/sta…

2022-02-01 23:02:44
すぎむらよしひこ @ysugimura_it

その発想はなかった! 絵文字でUTF-8対応が一般化したのと同じように、禰豆子で4バイトデータ型が一般化するのかも知れません。 dev.mysql.com/doc/refman/5.6… twitter.com/ritsukaPya/sta…

2022-02-02 12:07:37
expa / Shu Oogawara @expajp

つちよしテストがねずこテストに置き換わる時代が来たか twitter.com/ritsukaPya/sta…

2022-02-02 12:00:28
リンク Qiita UTF-8時代の環境依存文字チェック ~そこに文字はあるか~ - Qiita UTF-8が標準的に扱われるようになり、また、③やⅢなどの過去には機種依存文字だったものが規格で追認された今、文字化けに悩まされることは少なくなってきました。 しかし、スマホの普及に伴い絵文字という刺客が現れます。 そんな時代... 5 users