シフトJISの闇を訪ねる旅

各ベンダーのシフトJIS外字について調べていたところ、さまざまな方に知恵を授けていただいた。
72
Ken Lunde 小林剣 @ken_lunde

@moji_memo 漢字Talk 6.0.7の外字は0xF040から0xF9FCまで(1,880字)だと思います。@ogwata

2013-05-15 11:59:20
小形克宏 @ogwata

相変わらずシフトJISについて調べているわけだが、先日の文字の学校で狩野さんから「『CJKV』第2版ではシフトJIS関連がばっさり削られているんですよね」との情報を得て、ひょっとしたらと一番最初の版『日本語情報処理』(1995年、ソフトバンク)を見てみたら、これが一番詳しい!

2013-05-23 22:08:51
小形克宏 @ogwata

さすが1995年の本だけあって、ベンダーごとの実装差は必要不可欠。新しい版が出たらかといって、古い版を捨てなくてよかった…と書いたところで、Facebook経由で安岡さん曰く「でもミスも多い!」だそうです。しょぼん。

2013-05-23 22:12:38
小形克宏 @ogwata

そうか、EPSONの98互換機は単純にJIS83だと思っていたけど、符号化文字集合としては78JISにJIS83の追加分を加え、レパートリにJIS83例示字体を採用というややこしい実装なのね。つまりJIS83における追加はサポートするが、入れ替えはサポートしてない。

2013-05-24 18:34:45
小形克宏 @ogwata

ただし、JIS83における符号位置の入れ替えのうち、伝統的な字体を略字体に入れ換え、入れ換えられた字を別区点に追加した4組についてはJIS83準拠。まあ現実的だけどね。

2013-05-24 18:38:33
小形克宏 @ogwata

先のエプソン98互換機のツィート、1993年『EPSON PCシステム・ガイド』クリエイト・クルーズの文言、〈EPSON PC シリーズのコード体系は基本的に旧JIS(JISC6226)にしたがっている。〉に引きずられたが、要するに「22組の入れ替え以外はJIS83」ということ。

2013-05-24 23:47:45
小形克宏 @ogwata

まあ、どっちつかずの折衷的、でも現実的な実装ではある。しかし、シフトJISの実装って調べるほど面白いなあ。当時のエンジニアには地獄だったろうけど。

2013-05-24 23:49:35
小形克宏 @ogwata

この「EPSON PC システム・ガイド」という本は、巻頭の推薦文をエプソンが書いている。副題も「100万人EPSONユーザーのためのオフィシャル・データブック」だから、信頼性が高いように思える。でも間違いはある。

2013-05-25 00:21:58
小形克宏 @ogwata

p.301 「新JISで字体を変更した漢字」での間違い。「稽」のつもり→ http://t.co/yWsUNhG08r どういう字体なのかなあ。

2013-05-25 00:23:54
拡大
小形克宏 @ogwata

p.302 「新JISで字体を変更した漢字」新旧字体を比較しているんだが、どうも同じ字っぽい。 http://t.co/Is8PjD1V0d

2013-05-25 00:31:30
拡大
小形克宏 @ogwata

p.302 「新JISで字体を変更した漢字」どうも字体の解釈を間違っているっぽい。 http://t.co/qsrYphIryy 「最終画が離れる」と解釈したみたいだが、そうではなくて、「免」のうち「口」の内部から足が生えるか、外部からかの違い(書くのがむずかしいw)。

2013-05-25 00:38:54
拡大
小形克宏 @ogwata

p.302 「新JISで字体を変更した漢字」これは二画少ない。 http://t.co/3h3iXqCLiT

2013-05-25 00:41:45
拡大
小形克宏 @ogwata

p.303 「新JISで字体を変更した漢字」これはどこが違うというのか。 http://t.co/8vfD7reUbd というか、そもそもJISコード 613A(区点65-25)は例示字体を変更されてないと思うけど。

2013-05-25 00:51:29
拡大
小形克宏 @ogwata

p.303 「新JISで字体を変更した漢字」 http://t.co/kOaV5W8Lqr 「輓」。これも同じっぽい。

2013-05-25 00:55:10
拡大
小形克宏 @ogwata

こんなものかな。まあ、1993年の本とはいえね…。やはり字体を扱うと、どうしても間違いはでるので、プリンタの出力をそのまま印刷というのは、やはり見識ではあるのだろう。

2013-05-25 00:58:46
小形克宏 @ogwata

まあ、まさかこの本をつくった人も、20年後に1600dpiでスキャニングされて校正されるとは思ってもいなかっただろう。

2013-05-25 01:05:23
小形克宏 @ogwata

どなたか、「NEC特殊文字」「NEC選定IBM拡張文字」「IBM拡張文字」などの語の初出、典拠をご存知ないでしょうか? 少なくとも日本アイ・ビー・エム『漢字コード一覧表』(1987年)には「IBM拡張文字」の語は見えません。どこの誰が最初に使ったのか。

2013-05-28 18:00:53
小形克宏 @ogwata

「NEC特殊文字」「NEC選定IBM拡張文字」「IBM拡張文字」等の初出の件、安岡さんがFacebookで「私が最初にその文字列を見たのは、Windows NT3.1J 日本語マニュアルの末尾だったような…。」とコメントくれた。

2013-05-28 21:18:51
小形克宏 @ogwata

返答。〈お答え、ありがとうございます。IBMとNECの外字を呼び分ける必要が生じたのは、1993年のWindows 3.1Jのはずなので、このあたりかなあと当たりをつけていたんですが、なるほど、1994年のNT3.1J ですか。Windows 3.1Jで見た覚えはありません?〉

2013-05-28 21:19:24
小形克宏 @ogwata

この迂遠なやり取りはなんなんだw

2013-05-28 21:19:54
SKMT/坂本英樹 @sakamotoh

@ogwata Windows 3.1 の外字周りのコードを書かれた 川俣 晶さん曰く「 むむ。難しい話ですね。おそらく、IBMではなく互換機メーカーが使ったのではないでしょうか。」だそうです。

2013-05-28 21:40:31
小形克宏 @ogwata

関連した疑問。「NEC選定IBM拡張文字」という語はIBMが先行していたことを示唆しているが、IBM最初の日本語パソコンは1983年3月発表のマルチステーション5550。他方でNECの初代PC-9801は1982年10月発売。つまりNECの方が先。5550より先があったのかな?

2013-05-28 21:44:12
小形克宏 @ogwata

まあ、元を辿れば大型機の文字セットということになるのでしょうけれど。このあたり、本当は大型機だけでなく、日本語専用ワープロの実装も丹念に調べないといけないのだろうけど。

2013-05-28 21:45:59
小形克宏 @ogwata

@sakamotoh ありがとうございます。互換機メーカーって、1Compaqなどのことでしょうか? DOS/Vの普及が背景になり、Windows 3.1Jで各社の外字を統一する必要ができた、という動きをイメージしていたのですが…。

2013-05-28 21:55:50
SKMT/坂本英樹 @sakamotoh

@ogwata メインフレーム用が先です。 http://t.co/EezVtJaQGM漢字システム

2013-05-28 21:58:10
1 ・・ 4 次へ