シフトJISの闇を訪ねる旅

各ベンダーのシフトJIS外字について調べていたところ、さまざまな方に知恵を授けていただいた。
72
SKMT/坂本英樹 @sakamotoh

@ogwata 別コメントもしましたが、メインフレーム用のIBM漢字や富士通のJEFがJISの前にあって、入らない文字をIBMが割り当てたとかの経緯かと。

2013-05-28 22:01:06
Kazuhiro Kazama @kazuhiro_kazama

@ogwata 「日本語情報処理」の「IBM漢字」のところを見ると,IBM漢字にはDBCS-Host文字セットと,DBCS-PC/DBCS-EUC文字セットの2種類があったとか書かれているから,前者が大元ですかね?

2013-05-28 22:06:07
小形克宏 @ogwata

@kazuhiro_kazama ええ、ケン・ランディさん『CJKV』にレパートリや文字符号化スキームの流れは説明されていますが、残念ながら実装については書かれていないんです。具体的には、IBM拡張文字が実装された機種は何か? @sakamotoh

2013-05-28 22:17:57
小形克宏 @ogwata

@sakamotoh マルチステーション5550は、日本IBMで最初の(IBM拡張文字を実装した)シフトJISだと思いますが、よれよりメインフレームが先ということでしょうか?

2013-05-28 22:21:46
SKMT/坂本英樹 @sakamotoh

@ogwata はい、そうです。3270端末から16進で打ち込んでも漢字コードは入力可能。

2013-05-28 22:24:22
小形克宏 @ogwata

@sakamotoh ありがとうございます。整理すると、IBMの大型機においてDBCS-PC/DBCS-EUC文字セットが使われており、その部分集合である(後にいう)IBM拡張文字がマルチステーション5550に実装されたという流れですか。(要検証)

2013-05-28 22:51:33
小形克宏 @ogwata

@kazuhiro_kazama ご教示ありがとうございます。このページ、非常に参考になりますね。作者の益山さんとは、JIS X 0208原案作成委員会の益山健(ボーランド)さんでしょうか。

2013-05-28 23:08:19
小形克宏 @ogwata

@sakamotoh ああ、ようやく分かりました。DBCS-HostからJIS X 0208を除いたものがIBM拡張文字ということですね。

2013-05-28 23:15:37
SKMT/坂本英樹 @sakamotoh

@ogwata 要確認ですが多分そうです。Windows 3.0の漢字は全部ホストで扱えて無い文字を文字コード表で入れた記憶は無いので。

2013-05-28 23:23:16
小形克宏 @ogwata

@sakamotoh ありがとうございます。おかげさまで、だいぶスッキリしました。

2013-05-28 23:25:42
小形克宏 @ogwata

ケン・ランディ「CJKV」には、ちゃんとDBCS-HostとDBCS-PC/DBCS-EUCは〈ユーザ定義文字の数を除けば、文字総数はまったく同じで、7,267文字である。〉と書いてある(p.592)。読み過ごしていたが、この部分はそういう意味だったんだね。

2013-05-28 23:28:44
MORIOKA Tomohiko @CHISE_ja

(Super ASCII 1991年2月号によれば、漢字 Talk 6.0.7附属の「Foreign System Fonts」という漢字フォントはPC-9801の拡張文字を含んでいたらしい。日本語PSプリンターとかDOS/Vも怪しいが、本命はやっぱ Windows NT か?)

2013-05-28 22:33:30
小形克宏 @ogwata

@CHISE_ja 漢字 Talk 6.0.7以降では、13区がそのままNEC特殊文字だったんですよ。なので、この部分はPC-9801と互換がとれていたんですが、1992年の漢字Talk7.1で符号位置が変更されてしまい、初期DTPは大打撃という話しです。

2013-05-29 00:50:02
MORIOKA Tomohiko @CHISE_ja

@ogwata そうだったんですね。あと、漢字 Talk 6.0.7 には一太郎とか PC-9801 のアプリケーションとのデータコンバーターソフトも附属してたとのことですが、こういう互換路線をやめちゃった訳なんですね。

2013-05-29 00:55:22
小形克宏 @ogwata

@CHISE_ja ええ、なにを考えていたんだか…。なのでAppleの外字については、漢字 Talk 6.0.7以降と漢字Talk7.1以降の両方を押さえないと話しができないのですね。

2013-05-29 00:59:01
MORIOKA Tomohiko @CHISE_ja

@ogwata 考えてみるとあの頃の Apple って全体的に大迷走してた時期だったんですよね。w(景気良く機能切っちゃうのは今もだけどw)

2013-05-29 01:20:08
小形克宏 @ogwata

昨晩のIBM拡張文字他の件。このソースがIBMの大型機用文字セットDBCS-Hostに遡るらしいことは理解できたが、IBM拡張文字とNEC選定IBM拡張文字の先後については解決がつかない。IBM5550は1983年3月発表なのに、PC-9801は1982年10月発売だからだ。

2013-05-29 12:38:29
小形克宏 @ogwata

これについて、安岡さんがFacebookで次のようなコメントをくれた。〈個人的には、NECがPC-9801シリーズの漢字ROMを拡張(第2水準のさらにオプションのROMを搭載)した際に、IBM 5550の漢字から選んできたもの、っていう意味だと思ってました。〉

2013-05-29 12:39:22
小形克宏 @ogwata

早速調べたところ、以下のようなページを発見。 「PC-9801DA本体内蔵ROMと漢字ROMについてメモ」 http://t.co/6kJDKDMK5t 「【パソコン狂時代】58 ●覇道を歩み出した、NEC PC-9801E/F」 http://t.co/FIfq9rn1aG

2013-05-29 12:39:54
小形克宏 @ogwata

つまり、NEC選定IBM拡張文字の初出は、1983年10月発売のPC-9801Fにオプション設定された拡張ボード、PC-9801-18らしい。

2013-05-29 12:41:14
小形克宏 @ogwata

ただ、これらをどうやって裏付けをとるのか、それが問題。とりあえず都立中央図書館に月刊アスキーの架蔵が確認できたので、1983年前後のバックナンバーを調べる。それから「蘇るPC-9801伝説 永久保存版―月刊アスキー別冊」 http://t.co/I4rQvcfyaK

2013-05-29 12:44:14
小形克宏 @ogwata

なお、NEC特殊文字、NEC選定IBM拡張文字、IBM拡張文字等の領域名は実装メーカーが名乗ったものではない可能性が高い。既述のごとく日本IBM「漢字コード一覧表」(1987年第4版)にIBM拡張文字という語は見当たらないからだ。

2013-05-29 13:01:53
小形克宏 @ogwata

誰が命名者かは不明とするしかないが、IBMとNECの外字を呼び分ける必要があったマイクロソフトはその第一候補だろう。他にも互換機メーカーではという推測もあるが、いずれにせよ1990年代に入ってからの話し。

2013-05-29 13:04:05