「外れ値」て何だ?

外れ値 outlier  他の測定値から飛離れた観察値。外れ値は,常に異常値であるとは限らない。飛離れた観測値は,転記ミスや入力ミスによる場合もあるが,そうでない場合には外れ値が発生した原因をよく考察する必要がある。単に他とかけ離れた値だからといって,分析から除外するのは正しいデータ解析とはいえない。 http://www.weblio.jp/content/%E5%A4%96%E3%82%8C%E5%80%A4
9
@COCOMAMA__

@HayakawaYukio 今年の3月30日に勝川さんと魚の汚染データの扱い方についてツイートしました。高い値は異常値だから無視すればいい、としているようだったので噛み付いたけど、的確な答えはなかった。食の安全を考えてまじめに統計取ってるとは思えなかった。データは水産庁のもの。

2012-05-14 13:58:39

という話を聞いたので、3月30日に戻って調べてみた。

勝川 俊雄🐬 @katukawa

年を越してから、セシウムが100Bq/kgを超えた海産の水産物は35例。ほとんどがカレイやタラなどの底モノ。いくつかある中層魚はすべてスズキ。エリアとしては日立から金華山沖まで。 http://t.co/wNInxVGb

2012-03-29 17:34:28
勝川 俊雄🐬 @katukawa

宮城県のスズキのセシウム(Bq/Kg)はこんな感じ。データが少ないけど、上がっているように見える。捕食魚は半年から1年ぐらいおくれてピークになるという、過去の知見とも合致する。 http://t.co/36dYLcZn

2012-03-29 17:53:05
勝川 俊雄🐬 @katukawa

チェルノブイリの時は、ピークに達してから、1~2年でほぼ元の水準まで値が下がったのだけど、今回はどうなるだろうか。これからも、継続的にフォローをしないといかんね。

2012-03-29 18:07:18
勝川 俊雄🐬 @katukawa

地表に落ちたセシウムが、雪解け水で流されてくるのが心配。春に流出したら、夏に値が上がってもおかしくない。いろんな可能性があるから、検査結果を見るのが確実。 RT @tanuki_ojisan: いまだに漏れている可能性が否定できないですからね。注意深く観察でしょうか。

2012-03-29 18:14:19
勝川 俊雄🐬 @katukawa

海の生態系のことって、わからないことだらけ。ものすごく断片的な知識しか無い。回遊や食性についての情報が無い魚種も多い。今の知見で、将来を正確に予測するのは無理なので、気になる人は、検査データをマメに見るしかないですね。

2012-03-29 18:31:55
勝川 俊雄🐬 @katukawa

検査データを眺めることは安心にもつながる。メディアは高い値を取り上げて「出たー!」というけど、そういう値は滅多にない外れ値。福島周辺を中心に計っていても、今年になってから100Bq/kgを超えたのは全体の4%にも満たない。俺が当初恐れていたよりもだいぶん低い値で推移している。

2012-03-29 18:37:51
勝川 俊雄🐬 @katukawa

ただ、その4%を確実に止める仕組みを作るのが、なかなか難しいのですよ。頭が痛い問題です。

2012-03-29 18:43:59
@COCOMAMA__

@katukawa 人の生死に係わるデータに外れ値はない

2012-03-30 09:50:49
勝川 俊雄🐬 @katukawa

外れ値は、人間の都合とは無関係なのですけど・・・ RT @COCOMAMA__: @katukawa 人の生死に係わるデータに外れ値はない

2012-03-30 11:38:45
勝川 俊雄🐬 @katukawa

食品由来のリスクをゼロにしようと思ったら、「何も食べない」以外の選択肢は無いだろう。

2012-03-30 11:43:58
勝川 俊雄🐬 @katukawa

放射能関連のツイートをするとRTがすぐに増えるけど、漁業関係のツイートをするとフォロワーが減る。魚を食べることに関心があるなら、生産の現場にも関心を持って欲しい。

2012-03-30 12:03:01
勝川 俊雄🐬 @katukawa

水産業が産業として成り立っていない現状が続けば、我々の未来の食卓は、どんどん寂しいものになるだろう。

2012-03-30 12:04:04
@COCOMAMA__

@katukawa 貴方は人が食べるものを扱う学問をしているのだと思っていますが、違いますか?もしそうならば無関係ではすまされません。

2012-03-30 12:59:22
@COCOMAMA__

@katukawa (連続失礼します)例えば人間のレントゲン写真はデジタル化されていますが、画像圧縮しません。削除していいデータは1ピクセルもないからです。同じことをして欲しい。

2012-03-30 13:02:08
勝川 俊雄🐬 @katukawa

@COCOMAMA__ それと外れ値がどのように関係するのか、私には理解できないです。比喩ではなくて、どうやれば外れ値が無くなるかを具体的に示していただけませんか。

2012-03-30 13:06:14
@COCOMAMA__

@katukawa 画像データの話は比喩ではありません。たとえ全体の4%であっても検出されたデータは無視できない、無視しないでください、ということを言いたかったのです。対象が人間の生死に関わるかどうかで、無視できるかできないかを判断するのがまっとうなデータの読み方だと思っています

2012-03-30 13:16:00
@COCOMAMA__

@katukawa そうなんですか?いつ日本の魚が食べれるようになるかが私の一番の関心ごとです。できれば予測して欲しい。

2012-03-30 13:21:13
@COCOMAMA__

@katukawa 外れ値が「無くなる」というのはおかしい。無視するかしないかの選択になる。データに異常値はつきもの。

2012-03-30 13:26:12
勝川 俊雄🐬 @katukawa

では、なぜ最初に「人の生死に係わるデータに外れ値はない」とメンションしてきたのでしょうか。 RT @COCOMAMA__: @katukawa 外れ値が「無くなる」というのはおかしい。無視するかしないかの選択になる。データに異常値はつきもの。

2012-03-30 13:29:16
@COCOMAMA__

@katukawa 外れ値=異常値、とは理解してません。異常値のうち無視できるもの=外れ値、と理解しています。理解が違っていますか?

2012-03-30 13:30:50
勝川 俊雄🐬 @katukawa

批判は自由ですが、言葉の意味ぐらいは調べてからにしてください。 RT @COCOMAMA__: @katukawa 外れ値=異常値、とは理解してません。異常値のうち無視できるもの=外れ値、と理解しています。理解が違っていますか?

2012-03-30 13:32:16
@COCOMAMA__

@katukawa 理解した上で発言しています。

2012-03-30 13:33:27
@COCOMAMA__

@katukawa このツイートを見る限り、100ベクレルを超えた値を無視しているとしか思えない。分析のデータセットに含めないつもりだから安心していると読める。だから批判しました。

2012-03-30 13:39:30