編集可能

TwitterにUnicode正規化が導入された時刻の推定 by zeeksphere

言語大好きzeeksphereさんが、TwitterにUnicode正規化が導入された時刻の推定されていたのが面白かったのでトゥギャリました。
3
zeeksphere @zeeksphere

福 U+798F 福 U+FA1B 福︀ U+798F U+FE00 (提案中) 福󠄁 U+798F U+E0101

2016-02-21 17:35:55
zeeksphere @zeeksphere

互換漢字は統合漢字のに正規化されたので、IVSっぽい twitter.com/takeda25/statu…

2016-02-21 17:40:05
zeeksphere @zeeksphere

@bromne どの段階かはわからん(投稿前にアプリでやってるのかも)

2016-02-21 17:41:21
zeeksphere @zeeksphere

@zeeksphere う〜ん、正規化されてる!(結合用で打った)

2016-02-21 17:44:52
zeeksphere @zeeksphere

@zeeksphere 2012年から認識が切り替わってなかったんですが、互換漢字字形の Standardized Variants はもう提案じゃなくて規格化されてました。

2016-02-21 18:08:09
zeeksphere @zeeksphere

ヒラギノ角ゴが2013年より前だからSV が出ないのかな。(iPhone 6)

2016-02-21 18:11:35
zeeksphere @zeeksphere

@Xiu24 ということで (U+7DF4 U+FE00) も(Standardized Variant 使用)

2016-02-21 18:13:42
さゆぬ @sayunu

@zeeksphere そう言えば最近ツイッターの挙動が変わったんですかね ? 以前は結合用のラテン文字ダイアクリティックがそのまま投稿されたのに、最近は同じ操作をすると合成済みの字になる。

2016-02-21 18:20:12
zeeksphere @zeeksphere

@sayunu いつごろからかはわからないですが、記憶によれば以前は正規化はしてなかったのが、置換するようになったんだと思います。いつごろからだろう。

2016-02-21 18:25:13
さゆぬ @sayunu

@zeeksphere ツイログでダイアクリティックだけ検索してみると、私のログの中では 2015/9/3 に使ったのが最新。普段たくさん使ってる人のログならもっと絞れそうですが。 twitter.com/sayunu/status/…

2016-02-21 18:50:06
名状しがたい旧字体bot @TKanji_bot

】……禍の旧字体 ※手書きの楷書では、示偏は示ではなくネと書く。 ※機種依存文字 《画像》 p.twipple.jp/v3grH

2015-11-04 08:07:46
拡大
名状しがたい旧字体bot @TKanji_bot

】……禍の旧字体 ※手書きの楷書では、示偏は示ではなくネと書く。 ※機種依存文字 《画像》 p.twipple.jp/v3grH

2015-10-25 12:08:07
拡大
zeeksphere @zeeksphere

2015/10/25から2015/11/04のどこかの時点で、正規化が働き始めたことまで特定した。

2016-02-21 19:53:40
名状しがたい旧字体bot @TKanji_bot

【漢】……漢の旧字体 ※共通:難⇔難 ※ただし例へば「灘(なだ)」に新字体は定められてゐない。(「灘」の字体は環境により異なる。) ※機種依存文字 《関聯画像》 p.twipple.jp/TrOX5

2015-11-04 03:37:27
拡大
名状しがたい旧字体bot @TKanji_bot

【倂】……併の旧字体 ※共通:瓶⇔甁、、餅⇔餠 ※「“屛”風(ビヤウブ、現代仮名遣いではビョウブ)」「幷」に新字体は定められてゐない。ゆゑに「屛・幷」は旧字体ではないし、「屏・并」も新字体ではない。 ※機種依存文字 《画像》 p.twipple.jp/K4211

2016-02-19 20:07:43
拡大
名状しがたい旧字体bot @TKanji_bot

【倂】……併の旧字体 ※共通:瓶⇔甁、、餅⇔餠 ※「“屛”風(ビヤウブ、現代仮名遣いではビョウブ)」「幷」に新字体は定められてゐない。ゆゑに「屛・幷」は旧字体ではないし、「屏・并」も新字体ではない。 ※機種依存文字 《画像》 p.twipple.jp/K4211

2015-11-04 04:37:03
拡大
zeeksphere @zeeksphere

が正規化されていない。4:37 にもまだ正規化は導入されていない。

2016-02-21 19:59:27
名状しがたい旧字体bot @TKanji_bot

【者】……者の旧字体 ※共通:煮⇔煮、署⇔署、、緒⇔緖、など ※手書きの楷書では、日の上の点は書かない。 ※常用漢字の「賭」に新字体はないが常用漢字表には「賭」に関して「筆写の楷書では(点を打つ形と打たない形との)どちらの字形で書いても差し支えない」とある。 ※機種依存文字

2015-11-02 16:07:33
残りを読む(11)

コメント

さゆぬ @sayunu 2016年2月23日
〈禍〉の辺りの時系列を直しました。
0