Togetter/min.tを安心してお使い頂くためのガイドラインを公開しました。

C++標準化委員会、ついに文字とは何かを理解する: char8_t

19
リンク teratail[テラテイル] C++20に採択されたchar8_t型を追加する提案の不可解な点|teratail P0482R5: char8_t: A type for UTF-8 characters and strings (Revision 5) がC++20に採択され、めでたくchar8_tが標準入り
リンク Qiita C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita # C++ Advent Calendar 2018 この記事は[C++ Advent Calendar 2018](https://qiita.com/advent-calendar/2018/cpp) 15日目の記事です。 -... 692 users 97
リンク はてなブックマーク 『C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita』へのコメント この記事に対して128件のコメントがあります。人気のあるコメントは「ここはじーごーくー!じーごーくー!すーてーきーなーじーごーくー!じーごじごじごじごくだよー! ASCII、JIS X 0201、Shift_JIS、EUC-JP、JIS X 0208、ISO-2022-JP、UTF-8、UTF-16、UTF-32(以下略)」、「こういうことを言うと、厳密に理解しているプログラマも希だったりする。あるいは未だに "全角文字は2バイト" という謎の呪いが残っているところがある。2018年も終わるというのに。」 3 users
yumetodo @yumetodo

BT cpper.xyz/@yumetodo p0482r5を読んでいるんだけど、最高に意味がわからないのは、なぜかchar8_tとchar16_t/char32_tの間のcodecvtとcodecvt_bynameが追加されていること。codecvtはエラーハンドリング周りがガバのプーさんだから消すねっ!ってことやなかったんか・・・?(困惑) #cpp

2018-12-22 18:16:08
yumetodo @yumetodo

BT cpper.xyz/@yumetodo 「C++20に採択されたchar8_t型を追加する提案の不可解な点 」 teratail.com/questions/1654… #teratail #cpp

2018-12-22 19:44:19
yumetodo @yumetodo

BT cpper.xyz/@yumetodo C++標準化委員会、ついに文字とは何かを理解する: char8_t qiita.com/yumetodo/items… #cpp

2018-12-22 19:44:20
yumetodo @yumetodo

BT cpper.xyz/@yumetodo 最終的に32460文字になった。記事の長さ。

2018-12-22 19:44:20
yumetodo @yumetodo

C++Advent Calendar 15日目の記事をようやく投稿しました! #cpp twitter.com/yumetodo/statu…

2018-12-22 19:45:34
橙虫 @wanotaitei

ぜんぶよんだ。(40分かかった) びっしり書いてある。 とても面白かった。 C++標準化委員会、ついに文字とは何かを理解する: char8_t qiita.com/yumetodo/items…

2018-12-22 20:07:53
イトー君 @TaKeZo_I

この手の話はさっさと考古学になってしまうべきなのだが、現在進行系で戦っている問題であるという事実に辟易とする いずれにしても良いまとめ(多分に本の虫からの引用を含むが) qiita.com/yumetodo/items…

2018-12-22 20:32:06
お惣菜 @n7k7

とりあえずいいたいことはC++はダメみたいですねということです(Cがだめでないとはいっていない)

2018-12-22 22:09:44
horiem @yellowshippo

C++標準化委員会、ついに文字とは何かを理解する: char8_t qiita.com/yumetodo/items… 文字とは、闇

2018-12-22 22:10:38
erukiti.server.ts @erukiti

文字コードを取り巻く歴史はほんと病みしかない / “C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita” htn.to/qgJokxE

2018-12-22 22:45:27
Osumi, Yusuke😇 @ozuma5119

ものすごい力作で文章も上手いなぁ。素晴らしい記事。Unicode完全に理解した。 / C++標準化委員会、ついに文字とは何かを理解する: char8_t qiita.com/yumetodo/items…

2018-12-22 23:05:05
電波猫 @dempacat

超大作。すごい。 / C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita qiita.com/yumetodo/items…

2018-12-22 23:08:02
うらく @lf_ur_

C++書かない人だけど、よくこんなものが非英語圏で使われ続けているなと思ってしまう内容だった

2018-12-22 23:09:47
|ω・`)もんぐれ @mongrelP

正直全体的に江添さんかわいそうという感じが。 / “C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita” htn.to/pmxQhkGk

2018-12-22 23:26:03
htsuji @Hideyuki_TSUJI

思えば、ASCIIしか考えなくてよかった時代でさえ、例えばfiの合字(fの曲がりの先端とiの点の部分が一体化したもの)を表現できない。英語圏だけでも、戦前のタイプライター的出発点の1バイト文字。ああ。 ◆C++標準化委員会、ついに文字とは何かを理解する: char8_t qiita.com/yumetodo/items…

2018-12-22 23:45:31
Natalis @yasakappe

炎上中のニコニコを立て直したドワンゴの取締役、ドコモの絵文字を作った人なんやな

2018-12-22 23:50:39
htsuji @Hideyuki_TSUJI

@yellowshippo @moffattwt そもそも論で過去に遡ると、C言語のcharには、8ビットだという保証さえない。だって、「1バイトの定義」にそんなものはないから。いや、そりゃ、高級アセンブラだったC言語は、完全に環境依存であることを是とする思想だったのだから当然だけど。互換ではなく「うごかん」を積極的に認めていたわけで。

2018-12-22 23:55:40
htsuji @Hideyuki_TSUJI

そう言えば、Unicodeには、「明治」「大正」「昭和」「平成」について、それぞれを一文字として扱う「㍾」「㍽」「㍼」「㍻」という割り当てがある。機種依存文字ではなく、れっきとした国際規格なのだ。いっぽう、来年の新元号はまだ秘密だから、Unicodeにあるわけがない。いつ盛り込まれることか。 twitter.com/Hideyuki_TSUJI…

2018-12-23 00:16:01
九堂フレア @ooblog

「デーヴァナーガリー~結合文字列~文字とコードポイント数~ここまでがまえがき~wchar_tは実装依存~charと区別がつく形でchar8_t型~C++20に採択~変換がガバ~戦いは始まったばかり」 / “C++標準化委員会、つ…” htn.to/9DxpRK

2018-12-23 00:17:36
Maekawa @maekk

世の中UTF-8が支配的になってきたので、文字コードまで踏み込んで規定する型の利便性が実装コストを上回ってきたという理解。

2018-12-23 00:19:25
残りを読む(343)

コメント

ちいさいおおかみ〜クリアカード編〜 @siu_long 2018年12月24日
だから、グローバリストは罵過なのだ。それを知れば、何故に、ロボガオンラインで、犯ゲームと連携始めてから、トラブルに苛まれる様になったかも、万人に理解可能になる。文字化けの真犯人は将に、文化を擾乱している。 #Culture_Terrorist_KOREA #Terrorist_named_KOREA #Terrorist_called_KOREA
1
ちいさいおおかみ〜クリアカード編〜 @siu_long 2018年12月24日
何故国際化は不要なのか??そう云う意味からも、この話は面白い。
0