10周年のSPコンテンツ!

日経コンピュータ誌が取り上げた厚労省メタボ検診データベースシステムの不具合と改修をめぐって

あまりに面白いお話でしたので、思わずまとめてしまいました。 日経コンピュータDigital 2014年2月20日号記事「約1600万人のメタボ健診データを生かせず 入力時に全角/半角が混在し、突合不能に」 http://itpro.nikkeibp.co.jp/article/NCD/20140212/536175/ スラッシュドットジャパンIT記事「厚労省の診療データベース、データの不備によってつき合わせできず」(2013年11月6日付け) 続きを読む
プログラミング データベース メタボ健診 全角 厚労省 データ変換 入力規則 半角 突き合わせ 診療報酬
76

発端

とーふや @toofuya
文字コード変換すればよろし RT megazal_rock: 愚かすぎる / “約1600万人のメタボ健診データを生かせず 入力時に全角/半角が混在し、突合不能に:日経コンピュータDigital” http://t.co/uW11QRo7xa
Haruhiko Okumura @h_okumura
日経コンピュータ:厚労省1600万人の健診データに全角半角が混在し突合不能。ハッシュ化前に正規化すべきことは設計時点で気づくはずだし,今からでも簡単に修正可能。修正に5千万円!私に発注してほしい

早速反響続々

Joji Maeno @joji
私に! RT @h_okumura 日経コンピュータ:厚労省1600万人の健診データに全角半角が混在し突合不能。ハッシュ化前に正規化すべきことは設計時点で気づくはずだし,今からでも簡単に修正可能。修正に5千万円!私に発注してほしい
Yuzo Matsuzawa @yuzomatsuzawa
@h_okumura http://t.co/o62B55j19I この記事の指す問題(カナ氏名と漢字氏名の名寄せ)と同じだとすると、ちょっと見出しがミスリードなのでは?明日本誌読んで確認してみたいです。

(この記事は2013年11月6日付け、この日付を見れば最近発覚した問題というわけではないことがわかります↓)

リンク t.co 厚労省の診療データベース、データの不備によって突き合わせできず | スラッシュドット・ジャパン IT Hamo73 曰く、厚生労働省では特定健診と診療報酬明細書のデータを比較分析するため、4年前に約5億円をかけてデータベースを構築している。しかし、明細書約58億件のうち約80%が突き合わせできないことがわかった(NHKニュース)。このデータベースは、メタボと診断された人がその後どのような病気にかかり、どれだけの医...
Haruhiko Okumura @h_okumura
なるほど RT @yuzomatsuzawa @h_okumura http://t.co/iKyOThvxOB この記事の指す問題(カナ氏名と漢字氏名の名寄せ)と同じだとすると、ちょっと見出しがミスリードなのでは?明日本誌読んで確認してみたいです。
ぐりこ・F・ぐりお @grecoffgreo
@h_okumura: 日経コンピュータ:厚労省1600万人の健診データに全角半角が混在し突合不能。ハッシュ化前に正規化すべきことは設計時点で気づくはずだし,今からでも簡単に修正可能。修正に5千万円!私に発注してほしい” 受注したい気もするが、変な罠がありそうw

何でこんなことに・・・

Haruhiko Okumura @h_okumura
さっきの厚労省のデータベースの記事,「データを全角で入力し直す」とか「全角入力しか受け付けないようにシステムを改修」といったトンデモ案が並んでいる。全角半角変換なんて簡単なのに
Nyancordia @concentusmn
@h_okumura また天下り先に丸投げという構図でないことを祈ります。
akanets-3.11 @akanets311
@h_okumura  民間から 事務処理のエキスパートを 事務方のトップに 招へいするべきです

話はどんどん前へ

みほちゃん(理事じゃない♡) @Mihoko_Nojiri
奥村先生が100万円でやってくれるってw RT @h_okumura: 日経コンピュータ:厚労省1600万人の健診データに全角半角が混在し突合不能。ハッシュ化前に正規化すべきことは設計時点で気づくはずだし,今からでも簡単に修正可能。修正に5千万円!私に発注してほしい
Haruhiko Okumura @h_okumura
やります! RT @Mihoko_Nojiri 奥村先生が100万円でやってくれるってw RT @h_okumura: 日経コンピュータ:厚労省1600万人の健診データに全角半角が混在し突合不能。ハッシュ化前に正規化…修正に5千万円!私に発注してほしい
上海II @shanghai_ii
ほれ>@MHLWitter RT @h_okumura やります! RT @Mihoko_Nojiri 奥村先生が100万円でやってくれるってw >厚労省1600万人の健診データに全角半角が混在し突合不能。ハッシュ化前に正規化…修正に5千万円!私に発注してほしい
このツイートは権利者によって削除されています。
Haruhiko Okumura @h_okumura
^^ RT @SF_yomi 99万8千500円で俺がやる。@Mihoko_Nojiri 奥村先生が100万円でやってくれるってw RT @h_okumura: 日経コンピュータ:厚労省1600万人の健診データに全角半角が混在し突合不能。修正に5千万円!私に発注してほしい
IzNoMa @i3works
@h_okumura @SF_yomi @Mihoko_Nojiri 貧乏な学生たちのアルバイトに譲ってあげてください。^^
sobaudon @sobaudon55
@SF_yomi 99万8千500円で俺が@Mihoko_Nojiri 奥村先生が100万でってw RT @h_okumura: 厚労省1600万人健診データ全角半角混在し修正に5千万円 ワロタ MacProとsedで直ぐできないかな
Haruhiko Okumura @h_okumura
入力フォームの全角・半角を勝手に変換してくれるJavaScript http://t.co/TIBKydYTPk (もちろんサーバサイドで変換してもいい)
Haruhiko Okumura @h_okumura
いやその前に英数字はDBに収める前に半角に変換だろう。全角で統一ってセンスがわからん
nao @parasite2006
@h_okumura たぶん事務系の人は数字とアルファベットは半角でと言われたら、漢字仮名を全角で入力中に切り替えるのが面倒だという頭なのでしょう。私は私有一号機(Power Mac 7200)を持った時からキーボードのCapsキー押し下げで半角に切り替わるよう設定しています。
残りを読む(87)

コメント

堀石 廉 (石華工匠) @Holyithylene 2014年2月20日
これ、問題が判明するまでにどうしてそんなに時間かかったの、っていうのが一番のツッコミ所な気がする。
nao @parasite2006 2014年2月20日
ツイート主のご意向によりツイートを1件削除しました。
SAKURA87@多摩丙丁督 @Sakura87_net 2014年2月20日
富士通はなんかソフトウェアに弱い気がする。スマホの方だってたいていの不具合がソフトの暴走だし。
nao @parasite2006 2014年2月20日
ツイート主のご意向によりツイートを1件削除しました。
neologcutter @neologcuter 2014年2月20日
そうそろそろデータ入力方式を全官庁で統一化すべきだと思うんだが…
Masahiro Hayashi @mhayashi1120 2014年2月22日
おれは開発中に誰も気づかなかった or 気づいても誰も言わなかったのが一番怖い。
ピコメン @picopicomen 2014年2月22日
これ、富士通側は途中から気がついていたんじゃないかな。問題を指摘すると受注金額内で修正させられて納期も守らされるから黙っておいて、 査収後に問題が発覚すれば、クライアント側の仕様指示ミスということになった上で、修正案件を受注できますし。それか双方判ってた上で別案件にしたと。税金ですし、それでお金が回るので誰も損してませ・・・んよ・・・ね
Tsuyoshi CHO @tsuyoshi_cho 2014年3月2日
まあ、そんな簡単な話でもない気はするけど...
nao @parasite2006 2015年9月4日
2015年9月4日、メタボ健診データベースの設計ミスが未改修のままになっており、会計検査院から改修を求められたことがNHKのニュースhttp://bit.ly/1i0Dch9 でとりあげられました。厚労省は今年度中に改修を進めたいとのこと。
なちゃ @nachakey 2015年9月5日
誰も気づかなかったとかちょっと考えられないんだけれども…
なちゃ @nachakey 2015年9月5日
入力済みデータの再生成って何かしらの元ネタがないと無理ぽいような気がするけど。氏名とかも入ってるっぽいから。番号とかだけならルールに照らして総当たりできるかもしれんけど。
NAKAMURA Takashi ∃ 自民大敗 @yokyun68k 2015年9月5日
富士通に限らず大手ベンダーは下請けに丸投げってのは常識だと思っていましたが
いかんともしがたいmakOTo @makOTo0804 2015年9月5日
もう全角の英数字なんて禁止しようぜ
しょーた @shota243 2015年9月6日
この話で一番暗くなったのは、これが「全角・半角」の問題として広められていることだな。 基本的には広くデータの正規化の話で、もちろん生年月日の記法とかも正規化されているかどうか考えなきゃならないし、氏名を含むハッシュ値2の方だとユニコード正規化だけじゃなくて誤字・誤入力とか異体字とか果ては漢字と読み仮名の突合とか、名寄せの面倒くさい部分をハッシュ化で蓋しちゃってどうする気なのか。
nao @parasite2006 2019年4月27日
当時こんな記事で叩かれていたhttps://www.nikkei.com/article/DGXLASDG04H5V_U5A900C1CR8000/ メタボ検診データベース、その後改修に成功してデータベースとして公開https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/iryouhoken/reseputo/index.html (続く)
nao @parasite2006 2019年4月27日
現在データベースの情報を研究目的で使用したい人は、第三者提供の申し出を窓口のNTTデータに提出することになっていますhttps://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/iryouhoken/reseputo/index.html (窓口は2018年4月2日より変更とあります)
ログインして広告を非表示にする
ログインして広告を非表示にする