お昼休みに統計のお勉強をしましょう

ひとつの事象が別の事象と相関があるかどうか、前後関係だけでなくて評価するためには統計学の知識が必要です。 何度もいろいろな機会に習うのですが、人に上手に説明できません、ってことは要するにわかってないんですにゃ。 というわけで、とてもわかりやすく説明してくださっているのでまとめてみました。
16

お昼休みに、統計学のお勉強をしましょう。
というわけではないですが、いろいろなリスクやベネフィットを考えるときに基本となる大事な考え方なので、自分の復習もかねてまとめてみました。

Aprildiamond(坂山) @Poker_April

統計学の計算になるからちょっと勉強してみよう 通常の奇形の発生率を1%として、(ものすごいざっくりだけど)放射線の影響でそれが倍の2%になったとする。その差をDetectするためには症例を何例集める必要があるか

2011-11-14 10:54:55
Aprildiamond(坂山) @Poker_April

計算してみたところ曝露群・あり、なしとも1150例くらい必要という結果になった

2011-11-14 11:24:51
Aprildiamond(坂山) @Poker_April

1150人ずつ集めると 仮定の通りなら曝露群で23人、非曝露群で11~12人の奇形が存在する ただし、実際にはばらつきは存在するのでこの通りの数字にならない可能性もある 分散は1150×0.02×0.98(曝露群)=22.54

2011-11-14 11:27:29
Aprildiamond(坂山) @Poker_April

標準偏差は4.75なので 曝露群を1150人集めても、その群に見られる奇形の数は95%の可能性で 23±9.5人に入る 少なければ14人くらいだし、多ければ33人くらいかもしれない

2011-11-14 11:30:15
Aprildiamond(坂山) @Poker_April

奇形がたとえば一人見つけた 二人見つけたって騒いでみたとして、その裏にどれくらい正常な人がいたのか考えないと、統計学的には話はできない たとえばある病院で年間300人生まれたことを考えると(続く)

2011-11-14 11:32:15

↓ここ、計算ミスしてるそうです
どこが違うか、わかりますか?

Aprildiamond(坂山) @Poker_April

(続き)奇形の発生率が1%として 期待度数3人 二項分布に従うと仮定して標準偏差 300×0.01×0.99 まあ、ほぼ3(続く)

2011-11-14 11:33:34

*****計算ミスの修正*****

Aprildiamond(坂山) @Poker_April

ここ 標準偏差じゃなくて分散が3 したがって標準偏差1.73です RT (続き)奇形の発生率が1%として 期待度数3人 二項分布に従うと仮定して標準偏差 300×0.01×0.99 まあ、ほぼ3(続く)

2011-11-14 16:43:14

結果が違ってきちゃいますね

Aprildiamond(坂山) @Poker_April

(続き)そうすると、たまたま奇形が生まれなくても、それは決して不思議なことじゃないし、逆に9人生まれて「いつもの年の3倍だなぁ」とか思っても、これもまた不思議なことではない(+2SDなので) でもおかしなことのように「見える」 これがバイアス

2011-11-14 11:35:11

*****計算結果の修正*****

Aprildiamond(坂山) @Poker_April

0~6人くらいが不思議じゃない範囲@Poker_April (続き)そうすると、たまたま奇形が生まれなくても、それは決して不思議なことじゃないし、逆に9人生まれて「いつもの年の3倍だなぁ」とか思っても、これもまた不思議なことではない(+2SDなので) でもおかしなことのように

2011-11-14 16:43:49

では、気を取り直して……

Aprildiamond(坂山) @Poker_April

+2SDってのは有意水準を5%に取っているからこの数字なので、たとえば病院40個集めて300人の調査を「別々に」したら、1個くらい「有意に奇形率が高い」病院が出てくる これは多分危険を訴えたい人の目には止まるだろう (実は同じように1個くらい「有意に奇形率が低い」病院もでるけど)

2011-11-14 11:36:58

有意水準って、むずかしいですね。
ちょっと違う表現でツイートしてくれてますので、こちらも参考に。

山猫だぶ㌠ @fluor_doublet

因果関係があるかないかで考えたら、「無い」と言い切って間違っている可能性が約5%とか、そういう表現になります。それをもって「無い」とします。悪魔の証明を求めるのは筋違いで、それは、その主張を否定する立場の人がきちんとした統計を取って検定すればいい、という話です。

2011-11-14 10:24:33
山猫だぶ㌠ @fluor_doublet

もちろん、棄却域5%に入る可能性を考えることは大事なのです。リスクが大きいですから。でも、95%の可能性で「主張が間違っている」と認識するのは重要。機序は関係ないのです。数値から出来る判定で、最も信頼できる方法です。

2011-11-14 11:25:37
山猫だぶ㌠ @fluor_doublet

それでも、危険性を指摘するのなら、棄却率を下げた検定をやり直せばいいです。それには母集団数をまず増やす必要があります。

2011-11-14 11:30:36
山猫だぶ㌠ @fluor_doublet

およその検定のミスは、母集団数が足りないか、なんらかの原因で偏っているか、別の因子が入り込んでいるかです。母集団数の欠如は不確かさとして見えてきます。しかし、それ以外はわかりません。ここに落とし穴があります。だからといって、統計学的手法が間違っているわけではないのですが。

2011-11-14 11:41:32

ここからが、統計にだまされないためにも重要な点。

Aprildiamond(坂山) @Poker_April

実際には統計学ってのは 機序がなんであるかということにはまったく関係せず、それがどの程度の確率で起こるかということを言及する 解釈を誤ると、あるいは恣意的にいじるとどのような解釈も一見ひねり出せる(統計学の専門家は多くの場合気づくけど)(続く)

2011-11-14 12:20:00
Aprildiamond(坂山) @Poker_April

(続き)冷静にそこのところを見極めるために専門家はいるわけで、それを指摘した人に怒るとか、場合によっては悪魔の証明を求めるってのは ちょっと冷静じゃないよね

2011-11-14 12:20:56
Aprildiamond(坂山) @Poker_April

バイアスは何が作るか 今回の放射線関係でいえば「話題性」だと思う なんとなく放射線はよくわからないし、だから危険は底なしに見える 

2011-11-14 12:18:34