生態学的誤謬とシンプソンのパラドックス

統計学の話題です。シンプソンのパラドックスの例を紹介しました。
7
意訳たん @iyakutan

誤謬って言葉を覚えておくと便利ですよ、と言おうと思ったけど私も多分謬って字書けないや

2016-08-18 19:36:19
計量ちゃん❄️準備中 @Keiryo_tan

ecological fallacyは生態学的誤謬!(統計分野にありがちな)何のことか分かりにくい概念だけど、ざっくり解説すると、、

2016-08-20 07:59:26
計量ちゃん❄️準備中 @Keiryo_tan

生態学的誤謬とは、全体の傾向(相関など)といくつかに分割した各グループの傾向が食い違ってしまうこと。全体で見たときの相関と、各グループで見た相関は逆転してしまうことがあるんだ。 pic.twitter.com/PG8ktfnejF

2016-08-20 08:01:43
拡大
計量ちゃん❄️準備中 @Keiryo_tan

相関の逆転を発見するには、散布図を描いてみるといいよ。散布図はデータの構造を直観的につかむのに便利!

2016-08-20 08:05:38

まとめ編集中の時点でWikipedia日本語版に「生態学的誤謬」のページがありません…。誰か英語版から翻訳してください!

シンプソンのパラドックス

計量ちゃん❄️準備中 @Keiryo_tan

問題1。 「ある試験の結果について、A組男子の平均点はB組男子より高く、A組女子の平均点もB組女子より高かった。A組の平均点はB組より高かったと言えるか?」

2016-08-20 08:20:36
  • 確実に言える
  • 確実には言えない
計量ちゃん❄️準備中 @Keiryo_tan

問題2。 「ある会社では、正社員の平均給与は10年前の正社員より高く、非正社員の平均給与も10年前の非正社員より高い。この会社の平均給与は10年前より上がったと言えるか?」

2016-08-20 08:25:30
  • 確実に言える
  • 確実には言えない
計量ちゃん❄️準備中 @Keiryo_tan

答え合わせします!…その前に、問題1と問題2は論理構造がまったく同じです。(気づいた人も多いかな?)にもかかわらず、回答結果には違いが出ました。

2016-08-20 19:27:30
計量ちゃん❄️準備中 @Keiryo_tan

人間は論理的に推論するより、エピソードを手掛かりにして考える方が得意だそうです。裏を返せばエピソードに引きづられがちで、今回の回答結果もそんな特性の表れかもしれません。

2016-08-20 19:29:17
計量ちゃん❄️準備中 @Keiryo_tan

正解は「確実には言えない」でした。各クラスの男女の人数構成によっては、B組の方が平均点が高いということもありえます。

2016-08-20 19:31:58
計量ちゃん❄️準備中 @Keiryo_tan

数値例。 A組男子 60点  B組男子 50点 A組女子 80点  B組女子 70点 とすれば、A組の男子・女子はB組の男子・女子より10点平均点が高い。

2016-08-20 19:32:53
計量ちゃん❄️準備中 @Keiryo_tan

男女ともに高かったら、クラスの平均点も高そうな気がします。しかし、 A組男子 20人  B組男子  5人 A組女子  5人  B組女子 20人 の人数構成のとき、A組の平均点は64点、B組は66点となって、B組が上回ります。 pic.twitter.com/YGzAG7SnDS

2016-08-20 19:36:51
拡大
拡大
計量ちゃん❄️準備中 @Keiryo_tan

この現象をシンプソンのパラドックスといいます。グループ分けした各グループで平均が高くても、全体で平均が高いとは限りません!

2016-08-20 19:39:43
計量ちゃん❄️準備中 @Keiryo_tan

問題2はまったく同じなので、省略します。正社員・非正社員の人数構成をいろいろ変えながら計算してみるとおもしろいかも。

2016-08-20 20:05:00
計量ちゃん❄️準備中 @Keiryo_tan

ちなみにシンプソンのパラドックスは生態学的誤謬の一種です。さっきの数値例を図に描くと…。 pic.twitter.com/zGdS3YUXHP

2016-08-20 20:11:56
拡大
ろーそん(元労働相談くん) @foryoungworker

@keiryo_tan 例のおかげで非常にわかりやすいですね。現実にこんな話があったと思います。

2016-08-20 08:46:52
大天使蚊たそ @anopheles_

@keiryo_tan 反例「 正社員9人が10万、非正社員1人が6万 から 正社員1人12万、非正社員9人8万 に変化したとすると平均は 9.6万から8.4万 へ下がる」があるので偽ですかね?

2016-08-20 11:05:46
エレキたん【節電・ピークシフト】 @ElekiTan

@keiryo_tan 現実の学級編成で、そこまで極端な人数差は考えにくい、というヒッカケかもしれませんね。製品A、Bのサイズ計測値で、ライン1のAのサンプルとライン2のAのサンプルと~だとアンケート結果は変わってたかも。

2016-08-20 19:42:38
アライさんに紛れ込んだホンドタヌキ @kuma5th

択一で「確実に~」とか「絶対に~」とか断定的な選択肢はたいてい間違い、ってセンター対策で習ったヽ(・ω・)ノ twitter.com/keiryo_tan/sta…

2016-08-20 20:23:42
ロングロー @longlow1

@keiryo_tan 問2を先に見て、非正規社員が増えてれば総平均が高いとは言えないなというのは、ピンと来ました。 実際に、そういう状況になっているからかもしれません。 問1は、男女の数がクラスによって大きく異なるというイメージが湧きにくかったからかもしれません。

2016-08-20 23:03:38
計量ちゃん❄️準備中 @Keiryo_tan

ありがとうございます。正解率が56パーセントと74パーセントで、約20ポイントの差でした。社会的な見方が働くと考えやすいみたいです。 twitter.com/longlow1/statu…

2016-08-20 23:20:22