ISO/IEC 10646(≒Unicode)でなぜ「ゴミ文字」が増えていくのか?

18
tomo.(むにゃむにゃ) @MnjaMnia

@ogwata えっと、ここで芝野さんも書いてるように、実装水準というのは文字合成に関する話なんです(この文脈では Unicode ってのは ISO/IEC 10646 実装水準3相当になる)。

2010-04-26 01:57:21
tomo.(むにゃむにゃ) @MnjaMnia

でもって、なんとなく実装水準って廃止になったような気がしてたんだけど、ISO/IEC 10646:2003 にはまだあるような気がする(Amd は未チェック)。

2010-04-26 02:00:28
木田泰夫 @kidayasuo

@ogwata ゴミだというのは一つの見方でしかありませんよね。エバーソンはこれで中途半端なセットが美しい物になったと考えていることでしょう。私にとっての正しさではなく、多視点での正しさを目指さなければならないのが難しいところ。

2010-04-26 02:10:35
成瀬 @nalsh

Unicodeってそもそも文字の同定情報が足りてない気がするんだよな。そのうちJIS X 0208:1997でやったような作業が必要になるんじゃあるまいか

2010-04-26 02:12:50
成瀬 @nalsh

それぞれの文字の重要性は相対的な物だけれど、同定情報が足りてない文字は絶対的にゴミだ

2010-04-26 02:13:49
成瀬 @nalsh

ケータイ絵文字作成時の議事録とか残ってないかなぁ、残ってないよなぁ

2010-04-26 02:15:09
小形克宏 @ogwata

@MnjaMnia ええ、規定そのものは結合文字を基準にしたレベル分けですが、この話は芝野論文の次のあたりを典拠にしています。〈また,世界中の人に読めもしない文字フォントの購入と実装を要求することは望ましくない.これが,部分実装の適合性につながる.〉

2010-04-26 02:22:47
tomo.(むにゃむにゃ) @MnjaMnia

@ogwata だから部分実装と実装水準は別の話ではということです(小形さんの言いたいことが間違ってると言いたいのではなく、用語が間違ってるという指摘)。

2010-04-26 02:25:59
小形克宏 @ogwata

なるほど。改めて読むと、箇条2.3「装置の適合性」で部分実装を許していると思えました。RT @MnjaMnia: @ogwata だから部分実装と実装水準は別の話ではということです(小形さんの言いたいことが間違ってると言いたいのではなく、用語が間違ってるという指摘)。

2010-04-26 02:34:17
小形克宏 @ogwata

@kidayasuo 例えばアイルランドは1F610 NEUTRAL FACEの典拠でThe Book of Mahjong (Boston,Rutland, Tokyo: Tuttle, 2001) を示しましたが、これは弧例と考えるべき。分類は美しくとも、中味はゴミでは?

2010-04-26 02:45:04
小形克宏 @ogwata

@kidayasuo 他にも「乗り物」において自動車や列車をあれほど細分化しておきながら、船は3文字だけ。またカザフスタンやイラン、ベトナムの十二支の出展資料は未提示です。たしかに多視点での正しさは目指すべきでしょうが、彼の主張が本当に正しいかは疑問に思えるのですが。

2010-04-26 02:48:56
木田泰夫 @kidayasuo

@ogwata あと半年、あと一年、時間を掛ければより正しく美しい物になったかもしれませんね。

2010-04-26 03:30:04
木田泰夫 @kidayasuo

そうだと思います。文字符号はアートやサイエンスではなく目的に対して評価される工業製品 RT @ogwata おお! 割り切った考え方ww RT @MnjaMnia: @ogwata 文字符号は形式言語の一種で、ソフトウェアの一種だということですかね?…

2010-04-26 04:01:09
UTF-8はBOMなしでって言ったよね? @moji_memo

@ogwata NEUTRAL FACEの典拠(The Book of Mahjong)が記載されているドキュメントってどれですか。n3790-NSAI.pdfには典拠までは載っていなかったので。

2010-04-27 19:04:01
小形克宏 @ogwata

N3684-I, pp24-25です。http://bit.ly/cnfmUc (PDF) @mojimemo: @ogwata NEUTRAL FACEの典拠(The Book of Mahjong)が記載されているドキュメントってどれですか。n3790-NSAI.pdfには典

2010-04-27 20:32:46
小形克宏 @ogwata

吹くでしょ? RT @mojimemo: @ogwata NEUTRAL FACEの典拠(The Book of Mahjong)が記載されているドキュメントってどれですか。n3790-NSAI.pdfには典拠までは載っていなかったので。

2010-04-27 20:45:35
UTF-8はBOMなしでって言ったよね? @moji_memo

@ogwata ありがとうございます。なるほど、この典拠はないわ。

2010-04-27 23:07:58
小形克宏 @ogwata

このようにして「ゴミ」がまた一つISO/IEC 10646(≒Unicode)に入ってしまったわけであります。RT @mojimemo: @ogwata ありがとうございます。なるほど、この典拠はないわ。

2010-04-27 23:11:41
UTF-8はBOMなしでって言ったよね? @moji_memo

@ogwata いや、 わたしはNEUTRAL FACEがゴミとは思わないですけどね。ホテルのアンケート用紙とか別の用例もあったし、探せばもっと適切な用例もあるんじゃないかと。

2010-04-27 23:20:56
小形克宏 @ogwata

う〜ん、このN3769は見落としていました。NEUTRAL FACEがゴミというのは取り下げねば。RT @mojimemo: @ogwata ホテルのアンケート用紙の用例は、これですね。http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3769.pdf

2010-04-28 00:05:57
小形克宏 @ogwata

ただ、1F610 NEUTRAL FACEには、次の注釈が付くのですね。「used for the West Wind in some Mahjong annotation」http://std.dkuug.dk/JTC1/SC2/WG2/docs/n3826.pdf p.34

2010-04-28 00:11:36
小形克宏 @ogwata

@mojimemo わざわざ孤例と思える麻雀入門を持ち出さなくても、N3769に掲載した例を出せば良かったのにとは思えます。しょせん注釈ではあるのですが。

2010-04-28 00:16:48
小形克宏 @ogwata

ともあれ、日本の携帯電話以外にアイルランドが追加した文字は、もう一度きちんと洗い直す必要があると感じています。

2010-04-28 00:18:51
UTF-8はBOMなしでって言ったよね? @moji_memo

@ogwata ですね。どうして西と南だけ残ったのかなあ。

2010-04-28 00:22:51