1000万人必要というのは、少なくとも二重に間違っている。マキノさん解説

豪州のCTを受診した子供68万人の癌リスクについて http://togetter.com/li/513053 サンプル数1000万人必要なら、普通はわからないのでは?
59

豪州のCTを受診した子供68万人の癌リスクについて http://togetter.com/li/513053

Jun Makino @jun_makino

6 月にまとめていただいた http://t.co/Y667v4S42w 豪州の CT を受診した子供 68 万人の癌リスクについて

2013-08-12 00:20:57
Jun Makino @jun_makino

まあ、このまとめに書いてある通りなんだけど、この調査では平均 4.5mSv の被曝である、 CT スキャンを一度だけ受けたグループで、対照に比べて有意 (16% 、 2 σ で 13-19%) にがんが増加している。 これは 10 σ レベル。

2013-08-12 00:21:00
Jun Makino @jun_makino

このサンプルは CT スキャン 1 度以上が 68 万、 0 回が 1000 万なんだけど、これはそういう統計があったので上のような確実な結果が得られた、ということで、 4.5mSv レベルの被曝で有意な結果を得るには 1000 万人レベルのサンプルがいる、というわけではない。

2013-08-12 00:28:01
Jun Makino @jun_makino

というか、 1000 万人必要、という主張は少なくとも 2 重に間違っている。

2013-08-12 00:21:07
Jun Makino @jun_makino

一つは、この研究の有意レベルは上に述べたように 10 σ 近く、通常有意というのに必要とされる 2-3 σ に比べて 5-3 倍高いことである。 3 σ レベルでも 1/10 程度のサンプルサイズで十分である。

2013-08-12 00:21:10
Jun Makino @jun_makino

もう一つは、 1000 万というのは被曝群と対照群のうち大きいほうだが、誤差分散は大雑把にいって (1/Ns + 1/Nc) ( ここで Ns, Nc はそれぞれ被曝群と対照群のサイズ ) に比例するので、誤差を決めるのはサイズが小さいほうであるということ。

2013-08-12 00:21:12
Jun Makino @jun_makino

つまり、 1000 万ではなく 68 万が精度を決めていて、その 68 万で素晴らしい精度が得られた、ということ。

2013-08-12 00:21:15
Jun Makino @jun_makino

例えば、子供なら、被曝群 10 万、対照群 10 万の調査でも、被爆群が 5mSv 程度で有意な結果になると予想される。

2013-08-12 00:21:18
Jun Makino @jun_makino

まあ現実問題としては、仮に福島の事故の影響について調査結果が有意になったとしても、被曝以外の要因の可能性を否定できないとかいう主張がわらわらでてきて決着がつくまで数十年かかるんだろうけど。

2013-08-12 00:21:20

間違っている具体例

Jun Makino @jun_makino

あ、間違ってる具体例があったほうがいいか。例えば http://t.co/tKN5WAnc7w これ

2013-08-12 09:52:22
Jun Makino @jun_makino

引用 : この研究から学ぶべき最大の教訓。それは、低線量の放射線被曝の健康影響を、 被曝した集団だけを対象にして調べても、分からないという点だ。

2013-08-12 09:52:25
Jun Makino @jun_makino

引用 : CT検査を受けた約70万人という大集団を、検査を受けなかった約1000万人という、さらに大きな集団と比べることで、検査群のがんリスク上昇の可能性を、はじめて検出できたわけだ。

2013-08-12 09:52:27
Jun Makino @jun_makino

引用 : 福島の原発事故による放射線被曝の影響を調べるさいにも、同じことが当てはまる。被曝した被災地の方々だけではなく、他地域の大集団も比較群として調べ、両者を比べることで、はじめて影響の程度が分かるものだ。日本でも同様の調査を行うべきだろう。

2013-08-12 09:52:30
Jun Makino @jun_makino

最初の、「低線量の放射線被曝の健康影響を、被曝した集団だけを対象にして調べても、分からない」というのはもちろん本当で、これは LSS 調査の問題点でもある ( 被曝 0 の対照群がない、あるいはあるが解析に含められていない )

2013-08-12 09:52:33
Jun Makino @jun_makino

が、 2 番目の、「70万人という大集団を、検査を受けなかった約1000万人という、さらに大きな集団と比べることで、……はじめて検出できた」というのは、この調査がそうだったというだけでこのサイズが必要だったわけではない、という意味で間違いである。

2013-08-12 09:52:36
Jun Makino @jun_makino

「他地域の大集団も比較群として調べ、両者を比べることで、はじめて影響の程度が分かるものだ。日本でも同様の調査を行うべきだろう。」は、まあ、これは別に甲状腺がん調査みたいなサーベイじゃなくて、既存のデータベースでできる話だから、まあいいかな?

2013-08-12 09:52:38

統計学や定量的な観点について、十分な教育を受けている生物学者 は非常に少ない

Jun Makino @jun_makino

http://t.co/TOv8Wsu19p 教科書くらいの知識を持ってから

2013-08-13 08:50:46
Jun Makino @jun_makino

読者の練習問題、でいい気もするが、標準偏差と標準誤差の話だけ。

2013-08-13 08:30:25
Jun Makino @jun_makino

後者は「サンプルの平均値の標準偏差」というのが定義であり、 要するにここでは 0.16 と書いてある量、つまりサンプルを統計処理して 得られる値の標準偏差である。

2013-08-13 08:30:27
Jun Makino @jun_makino

このような、統計処理後の値の標準偏差を標準偏差といってわざわざ誤差と 言わないのは少なくとも物理・天文の業界では普通のやりかただし、この時に σ を使うのも普通。

2013-08-13 08:30:31
Jun Makino @jun_makino

なので ヒッグス粒子の時にも http://t.co/HJBBviYRmj 5 σ がどうとかいう話をしたわけである。

2013-08-13 08:30:55
Jun Makino @jun_makino

まあ、とんきょさんにいわせれば物理学者はほとんどすべて統計学の教科書レベルの知識がない、ということであろう。

2013-08-13 08:30:59