「外れ値」て何だ?

外れ値 outlier  他の測定値から飛離れた観察値。外れ値は,常に異常値であるとは限らない。飛離れた観測値は,転記ミスや入力ミスによる場合もあるが,そうでない場合には外れ値が発生した原因をよく考察する必要がある。単に他とかけ離れた値だからといって,分析から除外するのは正しいデータ解析とはいえない。 http://www.weblio.jp/content/%E5%A4%96%E3%82%8C%E5%80%A4
HayakawaYukio 7427view 12コメント
9
ログインして広告を非表示にする
  • @COCOMAMA__ 2012-05-14 13:58:39
    @HayakawaYukio 今年の3月30日に勝川さんと魚の汚染データの扱い方についてツイートしました。高い値は異常値だから無視すればいい、としているようだったので噛み付いたけど、的確な答えはなかった。食の安全を考えてまじめに統計取ってるとは思えなかった。データは水産庁のもの。
  • という話を聞いたので、3月30日に戻って調べてみた。
  • 勝川 俊雄 @katukawa 2012-03-29 17:34:28
    年を越してから、セシウムが100Bq/kgを超えた海産の水産物は35例。ほとんどがカレイやタラなどの底モノ。いくつかある中層魚はすべてスズキ。エリアとしては日立から金華山沖まで。 http://t.co/wNInxVGb
     拡大
  • 勝川 俊雄 @katukawa 2012-03-29 17:53:05
    宮城県のスズキのセシウム(Bq/Kg)はこんな感じ。データが少ないけど、上がっているように見える。捕食魚は半年から1年ぐらいおくれてピークになるという、過去の知見とも合致する。 http://t.co/36dYLcZn
     拡大
  • 勝川 俊雄 @katukawa 2012-03-29 18:07:18
    チェルノブイリの時は、ピークに達してから、1~2年でほぼ元の水準まで値が下がったのだけど、今回はどうなるだろうか。これからも、継続的にフォローをしないといかんね。
  • 勝川 俊雄 @katukawa 2012-03-29 18:14:19
    地表に落ちたセシウムが、雪解け水で流されてくるのが心配。春に流出したら、夏に値が上がってもおかしくない。いろんな可能性があるから、検査結果を見るのが確実。 RT @tanuki_ojisan: いまだに漏れている可能性が否定できないですからね。注意深く観察でしょうか。
  • 勝川 俊雄 @katukawa 2012-03-29 18:31:55
    海の生態系のことって、わからないことだらけ。ものすごく断片的な知識しか無い。回遊や食性についての情報が無い魚種も多い。今の知見で、将来を正確に予測するのは無理なので、気になる人は、検査データをマメに見るしかないですね。
  • 勝川 俊雄 @katukawa 2012-03-29 18:37:51
    検査データを眺めることは安心にもつながる。メディアは高い値を取り上げて「出たー!」というけど、そういう値は滅多にない外れ値。福島周辺を中心に計っていても、今年になってから100Bq/kgを超えたのは全体の4%にも満たない。俺が当初恐れていたよりもだいぶん低い値で推移している。
  • 勝川 俊雄 @katukawa 2012-03-29 18:43:59
    ただ、その4%を確実に止める仕組みを作るのが、なかなか難しいのですよ。頭が痛い問題です。
  • @COCOMAMA__ 2012-03-30 09:50:49
    @katukawa 人の生死に係わるデータに外れ値はない
  • 勝川 俊雄 @katukawa 2012-03-30 11:38:45
    外れ値は、人間の都合とは無関係なのですけど・・・ RT @COCOMAMA__: @katukawa 人の生死に係わるデータに外れ値はない
  • 勝川 俊雄 @katukawa 2012-03-30 11:43:58
    食品由来のリスクをゼロにしようと思ったら、「何も食べない」以外の選択肢は無いだろう。
  • 勝川 俊雄 @katukawa 2012-03-30 12:03:01
    放射能関連のツイートをするとRTがすぐに増えるけど、漁業関係のツイートをするとフォロワーが減る。魚を食べることに関心があるなら、生産の現場にも関心を持って欲しい。
  • 勝川 俊雄 @katukawa 2012-03-30 12:04:04
    水産業が産業として成り立っていない現状が続けば、我々の未来の食卓は、どんどん寂しいものになるだろう。
  • @COCOMAMA__ 2012-03-30 12:59:22
    @katukawa 貴方は人が食べるものを扱う学問をしているのだと思っていますが、違いますか?もしそうならば無関係ではすまされません。
  • @COCOMAMA__ 2012-03-30 13:02:08
    @katukawa (連続失礼します)例えば人間のレントゲン写真はデジタル化されていますが、画像圧縮しません。削除していいデータは1ピクセルもないからです。同じことをして欲しい。
  • 勝川 俊雄 @katukawa 2012-03-30 13:06:14
    @COCOMAMA__ それと外れ値がどのように関係するのか、私には理解できないです。比喩ではなくて、どうやれば外れ値が無くなるかを具体的に示していただけませんか。
  • @COCOMAMA__ 2012-03-30 13:16:00
    @katukawa 画像データの話は比喩ではありません。たとえ全体の4%であっても検出されたデータは無視できない、無視しないでください、ということを言いたかったのです。対象が人間の生死に関わるかどうかで、無視できるかできないかを判断するのがまっとうなデータの読み方だと思っています
  • @COCOMAMA__ 2012-03-30 13:21:13
    @katukawa そうなんですか?いつ日本の魚が食べれるようになるかが私の一番の関心ごとです。できれば予測して欲しい。
  • @COCOMAMA__ 2012-03-30 13:26:12
    @katukawa 外れ値が「無くなる」というのはおかしい。無視するかしないかの選択になる。データに異常値はつきもの。
  • 勝川 俊雄 @katukawa 2012-03-30 13:29:16
    では、なぜ最初に「人の生死に係わるデータに外れ値はない」とメンションしてきたのでしょうか。 RT @COCOMAMA__: @katukawa 外れ値が「無くなる」というのはおかしい。無視するかしないかの選択になる。データに異常値はつきもの。
  • @COCOMAMA__ 2012-03-30 13:30:50
    @katukawa 外れ値=異常値、とは理解してません。異常値のうち無視できるもの=外れ値、と理解しています。理解が違っていますか?
  • 勝川 俊雄 @katukawa 2012-03-30 13:32:16
    批判は自由ですが、言葉の意味ぐらいは調べてからにしてください。 RT @COCOMAMA__: @katukawa 外れ値=異常値、とは理解してません。異常値のうち無視できるもの=外れ値、と理解しています。理解が違っていますか?
  • @COCOMAMA__ 2012-03-30 13:33:27
    @katukawa 理解した上で発言しています。
  • @COCOMAMA__ 2012-03-30 13:39:30
    @katukawa このツイートを見る限り、100ベクレルを超えた値を無視しているとしか思えない。分析のデータセットに含めないつもりだから安心していると読める。だから批判しました。

コメント

  • 早川由紀夫 @HayakawaYukio 2012-05-14 14:59:32
    「去年の夏以降、海の汚染が収まった」と解釈できる発言の裏付けは依然不明のまま。情報提供求む。
  • 民間人 @minkanjinno 2012-05-14 18:52:08
    生死の問題がどうとか言ってますが、日常的な摂取量が低いところに単発で放射性セシウム500Bq/kg程度が入ってきた所で生死の問題にはほぼ影響はないでしょう。チェルノブイリ周辺やサーミ人だと、単発でなくて日常食がこのくらいのレベルだったみたいですし。このレベルなら、むしろ食中毒のほうを気にしたほうが健康上有意義でしょう。
  • 日本[嘘]翼 @ty_kagemoto 2012-05-14 20:05:40
    勝川さんは、少なくともまとめられたツイートの中では「外れ値だから除外する」とか「外れ値だから除外した」だなんて一言も言ってない、というか、「外れ値を無視している」という言いがかりを明確に否定していると思うけどな。合わせて勝川さんは「海の汚染が収まった」とも言ってないと思う。コウナゴなど捕食される魚種の測定値が去年後半にピークを迎えたってグラフは、勝川さんのtwilogを探せばあると思う。酔っ払ってるから私は探さない、早川先生ご自身でどうぞ。
  • 3号(本業きっこbot) @kikko_not_bot_R 2012-05-15 01:47:15
    外れ値が出たら、データ量を増やして統計検定するのは自然科学者の基本です。ソレ位勉強してくださいよ。
  • kato takeaki @katot1970 2012-05-17 01:12:09
    外れ値なんて出るに決まってるし、勝川さんが統計処理する時に外すわけもないし。一体何がしたいんだ?
  • やっつん@uraent/2/3に移転中 @yahttsun 2012-05-17 01:22:09
    なんだ、気違いCOCOMAMA__ が妄想前提で噛み付いて馬鹿を晒しただけか。放射脳にありがちな気違いの類例でしかないな。気違いの頭では、500Bq/Kgの食品が1mmグラムでも摂取したら死ぬという論理なんだろうな。
  • 青谷三郎 @aotanisaburo 2012-05-17 20:39:33
    この外れ値の話は興味深い。もし原発由来の放射線物質で健康被害を発症するとしたら、それは「外れ値」の人だろう。大多数の人は何ともないのに自分だけ当りくじを引いちゃった人。当然その場合有意な観光被害は無かったとされるんだろうが。
  • 青谷三郎 @aotanisaburo 2012-05-17 20:41:00
    「観光被害」ではなく「健康被害」です。訂正w
  • 白黒ダジャレうさぎ @DonnieTheDutch 2012-05-17 20:43:53
    (週刊金曜日861号より引用)権力者のうそを暴いた武谷三男と星野芳郎(佐高信)  (略)それは平均値主義の愚劣さについてである。ある密室に人間を入れ、外から平均量を確保して毎日酸素を送っていたとする。
  • 白黒ダジャレうさぎ @DonnieTheDutch 2012-05-17 20:44:06
    ところがある日、10分間だけ酸素を送るのを忘れ、後で平均量が同じになるように酸素を送ったが、人間が死んでしまった場合、平均値主義では、平均量を確保していたのだから死ぬわけがないということになる。
  • 白黒ダジャレうさぎ @DonnieTheDutch 2012-05-17 20:44:21
    しかし、生物というのは瞬間的に異常な状態にぶつかれば、それで死んでしまうのであり、だから公害については異常値が最大の問題になるというのだった。(引用終わり)
  • minkanjino @minkanjino 2012-05-18 18:09:42
    10分送風止めただけで死ぬなんて、よほど狭い部屋なんですね。普通の4畳半とかだと呼吸量を100リットル/分としても時間単位で保つから、10分止めたところで空気がちょっと悪い思いをするだけでしょう。今回の水産物の外れ値もたまに500Bq/kgが出る程度のようですから、同様に平均値で充分の範囲でしょう。

カテゴリーからまとめを探す