日本語コード+外字問題

日本語コードが国際準拠しておらずガラパゴスな上に、国内で複数のコード体系を併用していることについてのぼやき。ぼやいたので、また数年間忘れそうなので、ここに備忘しておくと。その後、外字問題も追加。
1
三輪信雄 @NobMiwa

半角カナの処理でバクが発覚、ヤバイな

2010-08-12 12:59:58
三輪信雄 @NobMiwa

今頃、EUC半角カナの判定ではまっている、30年位損した気分だ

2010-08-12 17:55:51
Takashi Shitamichi @shita

It was in 1985. see http://bit.ly/d7JAg0 RT @NobMiwa: 今頃、EUC半角カナの判定ではまっている、30年位損した気分だ

2010-08-12 18:04:00
佐藤慶浩 Yoshihiro Satoh @4416sato

日本語コードは1つに統一というか国際コードに準拠すべきと思う。複数認めているのは、もはや世界中で日本だけ。ブービー賞の韓国は大反発を受けても既存データ移行を断行して、もはや無問題化した。 RT @NobMiwa: 今頃、EUC半角カナの判定ではまっている、30年位損した気分だ

2010-08-12 18:23:06
三輪信雄 @NobMiwa

@shita ホント、日本語の文字コードって困ったもんですね、政府でも未だに外字問題が片付く気配はなく、、、IT化の大きな障害でありコストですよね

2010-08-12 18:25:01
三輪信雄 @NobMiwa

今時、半角カナのみのEUCなんて、、、ったく、、でも生きているうちに半角カナはなくならないだろうな

2010-08-12 18:32:35
佐藤慶浩 Yoshihiro Satoh @4416sato

あきらめたらそこまでですw > 総務省CIO補佐官殿! @NobMiwa: 今時、半角カナのみのEUCなんて、、、ったく、、でも生きているうちに半角カナはなくならないだろうな

2010-08-12 18:34:07
Takashi Shitamichi @shita

+1 RT @4416_310: あきらめたらそこまでですw > 総務省CIO補佐官殿! @NobMiwa: 今時、半角カナのみのEUCなんて、、、ったく、、でも生きているうちに半角カナはなくならないだろうな

2010-08-12 18:36:10
佐藤慶浩 Yoshihiro Satoh @4416sato

以前取り組んだ人からの説明によると、文部科学省と経済産業省と総務省が連携すれば、文字コード統一は手続きとしてはできるとのこと。逆に連携しないと手続き的に無理らしい。

2010-08-12 18:36:13
佐藤慶浩 Yoshihiro Satoh @4416sato

各省が恐れているのは、文字コード移行して事故が起きたときに、その責任を問われること。それを免責することを国民が同意しない限り、かれらは動けない。(動かない?w)

2010-08-12 18:37:29
佐藤慶浩 Yoshihiro Satoh @4416sato

外字の一部が使えなくなる人も出るし、コード移行時に事故が起きるのも避けられない。でも、これをしないと、情報検索ひとつとっても、日本は永遠にIT効率が不利な状態のままになる。

2010-08-12 18:39:53
Masanori Kusunoki / 楠 正憲 @masanork

.@NobMiwa @shita クラウド騒ぎのドサクサで外字なくせないかと期待しているのですが、どうでしょう。外堀は徐々に埋まってきた手応えもあり

2010-08-12 18:39:35
steeler @steeler3

なるほど、クラウドの普及で独自仕様は減るかもしれませんね。RT @masanork .@NobMiwa @shita クラウド騒ぎのドサクサで外字なくせないかと期待しているのですが、どうでしょう。外堀は徐々に埋まってきた手応えもあり

2010-08-12 18:42:42
三輪信雄 @NobMiwa

@masanork おー、いっそ、クラウドで外字を全てカバーするとかw それにしてもホントにあっちこっちにあるんですよね -> 外字

2010-08-12 18:44:42
三輪信雄 @NobMiwa

あ、違った、クラウドで独自仕様を減らそう、ですね! <役人の頭は、逆に働く可能性も高いですが>

2010-08-12 18:47:05
三輪信雄 @NobMiwa

半角カナのみのEUCファイルを読む、という罰ゲーム終了、ビール飲む

2010-08-12 18:54:02
佐藤慶浩 Yoshihiro Satoh @4416sato

そういえば、すっかり忘れてたが e文書法ガイドライン作成のときに委員としてコード問題を指摘したのだった。総務と経産合同委員会だったが文科がいないので明言は無理と言われた。そのとき役人が考えてくれた限界文章は同ガイドラインの3.2.1にある。

2010-08-12 18:54:22
佐藤慶浩 Yoshihiro Satoh @4416sato

文字コードの標準化:「電子文書の作成にあたっては、複数の文字コードが併用されていることが見読性を損なうことがありうる。これらのコード間の相違が小さい場合には、気づかれないうちに見読性が損なわれていることもありうる。(つづく)

2010-08-12 18:55:12
佐藤慶浩 Yoshihiro Satoh @4416sato

(つづき) このため、文字コードの一貫性ある標準化と文書フォーマット中で、用いられている文字コードを示す仕組みの整備が求められる。」

2010-08-12 18:55:51
佐藤慶浩 Yoshihiro Satoh @4416sato

担当の役人の努力には敬意を払うが、結果的に、いまだに、文字コードの判定は、文章を何文字か読んでみて推定するしかない。特徴的文字が含まれないと判定できないこともある。

2010-08-12 18:57:35
Takashi Shitamichi @shita

困る人もいる・・ RT @steeler3: なるほど、クラウドの普及で独自仕様は減るかもしれませんね。RT @masanork .@NobMiwa @shita クラウド騒ぎのドサクサで外字なくせないかと期待しているのですが、どうでしょう。外堀は徐々に埋まってきた手応えもあり

2010-08-12 18:56:11
Takashi Shitamichi @shita

そーいえば、昔設計した仮名漢機構とX font server 機構使えばネット上に外字サーバを作れる! RT @NobMiwa: 外字クラウド!

2010-08-12 18:58:44
三輪信雄 @NobMiwa

@shita なにせ名前ですからね〜、困りますよね

2010-08-12 19:02:15
1 ・・ 11 次へ