教科書くらいの知識を持ってから批判はした方がよいと思う。
またやってる→ 「1000万人必要というのは、少なくとも二重に間違っている。マキノさん解説」 http://t.co/ROASS5nRRa 勿論、いろいろと典型的な誤りをしているという点において。
2013-08-13 00:27:38要するに、この「というか、 1000 万人必要、という主張は少なくとも 2 重に間違っている。」というツイートは2重に間違っている。https://t.co/8DA6nt4ed9
2013-08-13 00:27:57まず一つめ、例えばこれは、きわめて初歩的な間違いで、そもそも標準偏差と標準誤差の意味の違いも分かっていないということ。検定で扱われるバラつきは標準誤差であって、標準偏差ではない。https://t.co/GEJfxx7GQT
2013-08-13 00:28:14ここで牧野氏はσと書いているけど、それは標準誤差を標準偏差と取り違えている。標準誤差はサンプルサイズが大きければ標準偏差をサンプルサイズの平方根、つまりσ/√Nになるわけで、彼はこれをσと混同しているということ。
2013-08-13 00:28:34それでは、こういったコホート研究のサンプルサイズをどうやって求めるか、ということについては例えばこれが参考になる。⇒「循環器疾患のコホート研究と統計科学」統計数理(1998) Vol.46,p21- http://t.co/A8BG06mGHe
2013-08-13 00:30:36http://t.co/yeBcKVNFCH - 暴露群と被曝露群の人年が等しければ、ここのp24にある公式に当てはめれば必要なサンプルサイズは求まる。
2013-08-13 00:31:01で、議論になっている論文 http://t.co/lqD1NaruRmのTable3を見れば、大体どれくらいの頻度でがんが発生しているかがわかる。
2013-08-13 00:47:20最終的に採用している「CT照射後1年間のがん発生は除外する」という条件の場合、対照群のがん発生頻度は57524/177191342=0.000325になる。つまり、これがこの公式のp1に該当、α=0.95、β=0.2とすれば、Zα=1.96、Zβ=0.84、p=0.000357。
2013-08-13 00:32:38で、2点目の間違いは、もうお解りの方もいると思うが彼はこの公式のR、つまり検出すべき相対リスクの大きさについての考慮を全くしていない、ということ。この値が小さければ当然サンプルサイズは大きくなる。
2013-08-13 00:33:35実際にどの程度の相対リスクがあるかは、当然のことながら研究を開始する時点では自明ではない。「どれくらいの影響があるかわからない」以上、照射群の例数さえたくさんあるからOK等と言うことはできない。
2013-08-13 00:34:05ただ、何もわからないでは話は進まないし、実際何もわからないわけでもなくて、情報としては例えばLSS研究の知見を使うという様なことをすればそこそこ見積もることはできる。
2013-08-13 00:35:27で、「やり玉に挙げている」この坪野先生の記事 http://t.co/wa1uVLaTJg にもあるように、1mSvあたりの過剰相対リスクは本研究ではLSSのそれより10倍近く高かった、ということがあるわけだが、それはあくまで結果論。
2013-08-13 00:36:13もし、サンプルサイズを求めるならば、CT受診者の約8割が1回受診で1回の平均被曝量が4,5mSvということから、大体5mSvと考えると、LSSでERR=0.3%/mSvということから、大体1.5%、つまりR=1.015ということを予め見積もるくらいが妥当な線。
2013-08-13 00:36:51すると、公式に当てはめると必要な人年=1200万人年ということになる。つまり、60万人を20年くらい追跡しなければならないわけだが、20年たったら追跡開始時0歳でも成人してしまうから、当然そんなに人年は稼げない。
2013-08-13 00:37:12実際、Table3によれば、被曝群は650万人年で、必要なサンプルサイズの半分しかない。こういったときには、対照群の人年を増やして同等の有意水準を維持することができて、最大で1/2に漸近するまで被曝群の例数を小さくできる。
2013-08-13 00:37:48なので、サイズは、CT照射群で大体600万人年に減らせる。ただ、これでもTable3から見る限り結構微妙な線。従って、この研究は計画段階では「もしLSS研究の推定値よりもリスクが小さかったなら、それを有意に検出することは不可能かもしれない」ということであったことになる。
2013-08-13 00:41:40ところが、実際には当初の見積もりよりもCT受診によるリスク推定値が10倍くらい高かったから、結果として運よく有意になった、と見るのが正しいであろう。
2013-08-13 00:42:02結局、統計的検定ではどのような統計量を扱うのかがわかっていなかった(標準誤差と効果量)ことに起因する極めて初歩的な間違いだということ。まあ、まとめを作成した方ももう少し検証能力を高めた方が良いのではないかと思われ。
2013-08-13 00:42:39いずれにしろ、この論文は除外期間を10年まで大きくしても、先行研究の知見に基づき「極めて小さいであろうと予測されるリスクをどうやって統計的に有意に検出できるか」について綿密に例数設計したものであると考えられる。
2013-08-13 09:17:11そもそも疫学研究は試験計画が生命線で、そんな適当に例数決めているわけではない。「この調査がそうだったというだけでこのサイズが必要だったわけではない、という意味で間違いである」なんてことはないわけ。
2013-08-13 09:17:33