高木浩光先生@HiromitsuTakagiの「いろいろ言っていることがおかしい。なぜ君らおかしいと思わないの?→「個人番号」では串刺し検索ができない(マイナンバー、その「複雑さ」の真相)」
高木 浩光(たかぎ ひろみつ)はセキュリティ研究者。2012年現在、産業技術総合研究所情報セキュリティ研究センター主任研究員。情報セキュリティの研究者。
http://ja.wikipedia.org/wiki/高木浩光
高木浩光@自宅の日記
http://takagi-hiromitsu.jp/diary/
第1回 「個人番号」では串刺し検索ができない(マイナンバー、その「複雑さ」の真相) http://t.co/UXnxaEc1u8 #itprojp
2013-05-17 01:26:41安岡先生によるマイナンバーの紹介。今回は表記揺らぎとクエリポリシ問題。次回以降も楽しみ。/表記揺らぎ問題は漢字コードもさることながら住所表記も深刻。さらに最近は外国人名表記の問題も。 / “マイナンバー、その「複雑さ」の真相 - …” http://t.co/oIkIgOW6YW
2013-05-17 18:33:33マイナンバー「システム」の解説。何故複雑になるのか。安岡先生がわかり易く解説して頂いています。:第1回「個人番号」では串刺し検索ができない http://t.co/0cKcH64VuG via @nikkeibpITpro
2013-05-18 18:42:42いろいろ言っていることがおかしい。なぜ君らおかしいと思わないの? http://t.co/ZJKVlQlKN1
2013-05-19 18:19:12どこがおかしいか。まず、「情報提供ネットワークシステムはその場合、どこに拒絶されたかすら明らかにせずに、日本年金機構に対して、クエリを拒絶する旨を返す。」とあるが、そんなことどこで決まったの? 独自の推測なのか何かを根拠に述べているのかすら明らかにされていない。
2013-05-19 20:57:06次に、1頁目の「同時に、個人番号に関するクエリを許さない方式になっているのである」、2頁目の「個人番号を問い合わせるようなクエリを、すべて拒絶するようにシステムを設計するのは当たり前のことだ」が意味不明。
2013-05-19 21:04:492頁目「「利用番号C」を問い合わせるようなクエリにどう答えるべきか」とあるが、「利用番号C」で問い合わせることなどないことが理解されていない疑い。
2013-05-19 21:05:28そして致命的におかしいのが、2頁目の「それでは、個人番号を問い合わせるクエリの代わりに、上図の「符号C」…のような個人番号と1対1に対応する情報を問い合わせて…というクエリを使うのはどうだろうか。…」から続く部分。どうだろうかも何も、ズバリそれが「符号C」なのに何を言ってるの?
2013-05-19 21:15:13というか、これは直前の「個人番号を問い合わせるようなクエリを使うことで、データの完全性を確保したいと思ってしまう…」を受けているようなので、「符号C」による要求に「個人番号」を応答するのを想定したようだが、そんなことするまでもなくC側で「符号C」と「個人番号」が元々対応している。
2013-05-19 21:19:10そもそも、「このような例を考えると、各サーバーの設計や改修を受注したITベンダーは、個人番号を問い合わせるようなクエリを使うことで、データの完全性を確保したいと思ってしまうだろう。」というのが意味不明。
2013-05-19 21:19:40「データの完全性」という表現も意味不明だが、意味を酌んで、文字コードが違っても同一人物だと機械的に同定できるようにするという意味なのだろうが、それこそが個人番号の意義なのであって、個人番号の整備が完了した時点で、文字とか関係ないし氏名すら関係ないわけで。
2013-05-19 21:38:10個人番号の整備完了後は、個人番号で属性情報をやりとりするのだから、氏名の文字が「「濵田鷗」になっていたり、「濵田鴎」になっていたり、「濱田鴎」になっていたり、「浜田鴎」になっていたりする」とか、関係のない話。
2013-05-19 21:39:51初期突合をするときに文字が問題になるという話なら理解できるが、それなら、1頁目に書かれているような連係方式でやるわけじゃない。
2013-05-19 21:40:46それなのに、「となると、濵→濱→浜、鷗→鴎、のような異体字書換表を各サーバーごとに準備して、その範囲での「あいまいなマッチング」を行うように実装するしかない」などと、あたかも氏名をキーに1頁目の情報提供ネットワークシステムの連係処理が行われるかのようなことが書かれている。
2013-05-19 22:12:05情報提供ネットワークシステムが何をするものなのかまったく理解しないまま、「マイナンバーのシステム調達が、巨額になってしまっている理由は、すなわちこういうことだ。」などと言っており、全く信用に値しない連載になるだろう。
2013-05-19 22:13:09
------------------------------
yasuokaの日記: 『マイナンバー、その「複雑さ」の真相』第1回の「濵田鷗」
私(安岡孝一)が日経ITproに書いた『マイナンバー、その「複雑さ」の真相』第1回『「個人番号」では串刺し検索ができない』に対して、高木浩光さんにtwitterで盛大に突っ込まれた。
的を射た御指摘なので、すぐにでも答えなきゃいけないのだけど、実はかなりの部分を今後の回でネタにしているので、今は「もうちょっと待ってください、ごめんなさい」にしておきたい。
ただ、以下のtweetだけは、私がうまい例を考え付かなかったせいだし、今後の回では出てこない(はずの)ネタなので、今、あやまっておきます。
>個人番号の整備完了後は、個人番号で属性情報をやりとりするのだから、氏名の文字が「「濵田鷗」になっていたり、「濵田鴎」になっていたり、「濱田鴎」になっていたり、「浜田鴎」になっていたりする」とか、関係のない話。
確かにおっしゃる通りで、私自身ここは本当は「両方のサーバーでデータが変わり得て、実は文字コードの範囲を考えればどっちも正しいのだけど、間違ってお互いにやりとりし合っちゃう」例を考えたかったのだけど…。でも、なかなかうまい例がなくて、つい、氏名を例にして書いてしまった。ごめんなさい。