厚生労働省メタボ健診システムの不備を会計検査院の公開資料から読み解いてみる

同種の失敗事例を招かないよう、自戒の意味を込めて今回の事例について自分なりに分析・咀嚼するためにまとめてみました。
5
sk @sk_exe

更に会計検査院の資料7ページ目「NDBシステムにおける収集・保存データの不突合の重要な要因」の辺りに、文字通り重要な記述があった。

2015-09-08 16:31:30
sk @sk_exe

引用:『レセプトデータについては、従来、審査支払機関のレセプト電算処理システムにおいて、例えば、半角英数文字又は全角文字で入力された「被保険者証等記号」については全て全角文字に置き換えるなど、(続く

2015-09-08 16:35:37
sk @sk_exe

承前)被保険者の個人情報の入力形式等を同じものとする処理(以下「置換処理」という。)が行われていた。』

2015-09-08 16:36:27
sk @sk_exe

引用:『一方、特定健診等データについては、一部の保険者、健康保険組合連合会又は国保連合会の特定健診等データに関する電算処理システムにおいて、例えば、半角英数文字又は全角文字で入力された「被保険者証等記号」については全て半角英数文字に置き換えるなど、(続く

2015-09-08 16:36:59
sk @sk_exe

承前)レセプト電算処理システムとは異なる置換処理が行われていた。』

2015-09-08 16:37:22
sk @sk_exe

引用:『このため、両データで被保険者の個人情報の入力形式等が同じ場合であっても、異なるハッシュ値が生成される場合があることも判明した。』 jbaudit.go.jp/pr/kensa/resul…

2015-09-08 16:38:24
sk @sk_exe

つまり、ナショナルデータベース(NDB)に統合する手前の段階で、それぞれのシステムで被保険者証等記号の文字種を置換(変換)する処理が行われているわけだが、その仕様にも差異があったということである。資料4ページ「NDBシステムの概念図」では真ん中辺りに掲載されている処理だな。

2015-09-08 16:44:20
sk @sk_exe

引用:『匿名化・提供システムも、特定健診等データとレセプトデータとで被保険者の個人情報の入力形式等(置換処理が行われた後のものを含む。以下同じ。)が異なっている場合に、(続く

2015-09-08 16:56:58
sk @sk_exe

承前)匿名化処理の過程で「被保険者の生年月日のうち和暦のものは西暦に置き換える」など一定の置換処理を行う機能を有している。』

2015-09-08 16:57:14
sk @sk_exe

引用:『しかし、この置換処理機能は、「被保険者証等記号」等の入力形式等が異なっている場合には置換処理を行うことになっていないなど、限定的な機能となっていて、(続く

2015-09-08 16:58:10
sk @sk_exe

両データで被保険者の個人情報の入力形式等が異なる全ての場合に置換処理を行うものとなっていなかった(表3参照)。』

2015-09-08 16:58:26
sk @sk_exe

引用:『以上のように、同一の被保険者であっても、特定健診等データとレセプトデータとでは被保険者の個人情報の入力形式等が異なっている場合があり、その場合には、それぞれの匿名化処理の過程で異なるハッシュ値が生成され、NDBシステムには異なる第2次ハッシュ値が保存されることになる。(続

2015-09-08 17:00:09
sk @sk_exe

そして、このことがNDBシステムにおいて、多数の保険者について両データを突合できない事態を生じさせている重要な要因となっていると認められた。jbaudit.go.jp/pr/kensa/resul…

2015-09-08 17:00:39
sk @sk_exe

ここまでの内容は資料9ページの表3「レセプトデータと特定健診等データの入力形式等の相違及び置換処理の内容等」に要約されている。

2015-09-08 17:07:06
sk @sk_exe

1)レセプトデータと特定健診等データとの間でファイル仕様に差異があり、 2)また被保険者証等記号や氏名の表記揺れを許容する仕様が含まれており、 3)それらの不一致を修正する処理の仕様にも差異があり、 4)ハッシュ値生成前の時点で大半のデータに不一致が生じた というわけか。

2015-09-08 17:23:23
sk @sk_exe

プロジェクトを統括する立場の人らはさぞ重大な責任を負わせられて大変でしょうな(小並感

2015-09-08 17:30:10