シフトJISの闇を訪ねる旅

各ベンダーのシフトJIS外字について調べていたところ、さまざまな方に知恵を授けていただいた。
72
ある(degenerated) @ardarim

@ogwata NEC公式としてはJIPSに由来する9区~13区はNEC付加文字と呼んでいると思います。Windows31Jで入ったいわゆるNEC特殊文字はこのうち13区のみですね。

2013-05-29 18:35:59
小形克宏 @ogwata

@ardarim ご教示ありがとうございます。「NEC付加文字」という語が見える資料などご存知でしょうか?

2013-05-29 18:47:38
ある(degenerated) @ardarim

@ogwata 不確実で申し訳ないのですが、以前NECのフォント部門の方とお仕事した際はそのように定義されてました。Web上だとオフコンとの情報交換用パッケージの説明で出てくる程度です。説明書にはちゃんと書かれているとは思うのですが… http://t.co/lPA9Aum75Q

2013-05-29 19:44:18
小形克宏 @ogwata

@ardarim ありがとうございます。"NEC付加文字" で検索してみると、NEC自身はたしかにこの語を使っていた様子が伺えます。ということは、ということは、やはり「NEC特殊文字」「NEC選定IBM拡張文字」は、NEC以外の誰かが言い出したもののようです。

2013-05-29 20:28:04
ある(degenerated) @ardarim

@ogwata Wikipediaでは明確にマイクロソフトが命名したとあるのですが、如何せん出典の記載がないのが残念です。 http://t.co/xPH9wRM3Gg

2013-05-29 20:38:20
小形克宏 @ogwata

@ken_lunde 申し訳ありません、15日付の漢字Talk 6.0.7外字のツィートを見落としておりました。ご教示ありがとうございます。ところで漢字Talk 7.1のユーザ定義外字も、同じ0xF040から0xF9FCまでと考えてよろしいでしょうか?

2013-05-29 23:29:05
Ken Lunde 小林剣 @ken_lunde

@ogwata これは「Macintosh漢字Talkテクニカル・リファレンス」 (1990; KanjiTalk 6.0)の92ページです。 http://t.co/Q4P5deykJn

2013-05-30 02:26:28
拡大
小形克宏 @ogwata

@ken_lunde 「Macintosh漢字Talkテクニカル・リファレンス」、著者がアップルなので信頼できそうです。よい本を教えていただき感謝します。ところで漢字Talk 7.1のユーザ定義外字の領域について、ご存知ないでしょうか?

2013-05-30 12:17:56
Ken Lunde 小林剣 @ken_lunde

@ogwata 調査してから、漢字Talk6と漢字Talk7も0xFCFC(2,444字のユーザ定義外字)までサポートできそうです。 @moji_memo

2013-05-30 12:27:44
小形克宏 @ogwata

@ken_lunde つまり調査の結果、漢字Talk 6.0.7も漢字Talk 7.1も、ユーザ定義外字は0xF040から0xFCFCまでの2,444字だったということですね。ありがとうございます!

2013-05-30 12:38:42
小形克宏 @ogwata

FMR漢字の件。狩野さん @KAN0U が推薦してくれた 「富士通FMRシリーズ徹底解析マニュアル」が届いた。早速読んでいるが、外字に関しては機器仕様の「漢字ROM/外字RAM」の欄に〈JIS第1水準、第2水準、JIS非漢字453種、ユーザ登録188種〉(p.9)とあるだけ。

2013-05-30 16:05:43
小形克宏 @ogwata

この〈JIS非漢字453種〉というのが謎。なぜならFMRが準拠していたJIS83の非漢字は524文字だから。なぜ71文字も減っているのか? しかし、同書には文字表は掲載されていないので、不明とするしかない。

2013-05-30 16:13:54
小形克宏 @ogwata

シフトJISは調べれば調べるほど闇が深くなるw まあ、日経バイト1996年6月号にある、87~93区に富士通拡張583文字、120区に33文字(p.197)という記述よりも、ケン・ランディ『CJKV』にあるFMR漢字は平仮名3文字以外は外字なしとする記述の方が信頼できるかも。

2013-05-30 16:34:50
小形克宏 @ogwata

さきに〈JIS非漢字453種〉というのが謎と書いたが、遅まきながらこの数字はJIS78の非漢字数であることに気づいた。ということは???

2013-05-30 17:12:46
小形克宏 @ogwata

『富士通FMRシリーズ徹底解析マニュアル』の〈JIS非漢字453種〉だけを見るとFMRはJIS78のように思える。しかし「1.10 ディスプレイ制御部」p.23の仕様表では、文字コード欄に〈ANK/2バイトコード/漢字/新JISコード(83)〉とあり、やはりJIS83のようだ。

2013-05-30 17:24:55
wakufactory 🍥𝕏 @wakufactory

@ogwata 1984年発売のFM16βのスペックには "JIS非漢字453種"とあります。このころのスペックを単に引き写してたという可能性もなきにしも。FMRの漢字表って昔あったと思うのですがさすがにもう持ってません・・ http://t.co/cTU6i5m48Z

2013-05-30 17:41:45
SKMT/坂本英樹 @sakamotoh

@ogwata FMRの前、FACOM 9450の漢字の解説 http://t.co/iPy98x99zM ホスト系漢字解説 http://t.co/vpcR866KTM が参考になるかも。JEFはやたら漢字を使えてIBM漢字に持って行くと化ける文字があったと記憶します

2013-05-30 17:43:06
小形克宏 @ogwata

闇を深めるついでに書くか。 @0guma さんが教えてくれたPC-9801VMのマニュアル、無事に落札して入手できたのはいいが、掲載されていた文字表はJIS X 0208だけで、外字部分は無視されていた。しかし入力できないわけではないようで、丸付き数字等の入力方法が載ってたり。

2013-05-30 17:44:01
SKMT/坂本英樹 @sakamotoh

@ogwata ご存じかもですが、ホスト系システムは、2バイト文字を扱い始めるときにシフトインの制御コード1バイト、終わりにシフトアウトの制御コード1バイトを入れて区切ってました。なので、シフトJISのような制約が少なく多くの漢字を扱えました。

2013-05-30 17:46:02
小形克宏 @ogwata

それで『ガイドブック』に「PC-9801VM0/VM2の機能仕様」が掲載されているが、その日本語表示欄。〈JIS第1水準、第2水準、漢字ROM標準装備、JIS第1水準 2,965字、JIS第2水準 3,384字、非漢字 885種、ユーザー定義文字 188種〉この非漢字の数は?

2013-05-30 17:48:37
小形克宏 @ogwata

@wakufactory ありがとうございます。たしかに誤植の可能性もありますね。巻末に正誤票が貼ってありましたが、この部分の記述はありませんでした。ところで、自分は昔PC-9801Fを使ってたんです。確実に漢字拡張ボードを入れていたので、あの頃にタイムスリップして調べたいっす。

2013-05-30 17:56:26
小形克宏 @ogwata

@sakamotoh 今まで知らん振りしてきた大型機のコードについて調べる必要性を感じていたので、ご教示のウェブページは大変ありがたいものでした。感謝。

2013-05-30 17:57:28
當山日出夫 @htoym

@ogwata 書庫のなかをさがせば…私が昔買った、PC-9801M2のマニュアルが残っているかもしれない。(機会があれば、探してみますけど。)

2013-05-30 17:51:18
小形克宏 @ogwata

@htoym お時間のあるときで結構ですので、ぜひお願いいたします。PC-9801Mはもしや標準では第1水準のみとかではなかったでしょうか。とすれば拡張カードをつけていたはずで、そのマニュアル類も……無理かなあ。

2013-05-30 17:59:42
當山日出夫 @htoym

@ogwata その当時、パソコン本体は、第一水準までしか実装していませんでした。第二水準は、漢字ROMを、ふたをあけて、中にいれました。

2013-05-30 18:01:08