2013年8月13日

教科書くらいの知識を持ってから批判はした方がよいと思う。

オーストラリアの小児を対象に、CTを受診すると小児のがん発生リスクが「有意に」高くなるという論文がパブリッシュされています。http://www.bmj.com/content/346/bmj.f2360 この論文に関してTwitter上でよく見かける間違いは、「CT受診者を60万人集めればリスクを有意に検出できる」というものです。一方、疫学者の坪野先生(前東北大教授)の記事http://apital.asahi.com/article/tsubono/2013060300009.html では、このように書かれています。 「この研究から学ぶべき最大の教訓。それは、低線量の放射線被曝の健康影響を、被曝した集団だけを対象にして調べても、分からないという点だ。CT検査を受けた約70万人という大集団を、検査を受けなかった約1000万人という、さらに大きな集団と比べることで、検査群のがんリスク上昇の可能性を、はじめて検出できたわけだ。」 これに対して真っ向からこれを否定する意見が出てきました。 続きを読む
47
リンク www.bmj.com Cancer risk in 680 000 people exposed to computed tomography scans in childhood or adolescence: data linkage study of 11 million AbstractObjective To assess the cancer risk in children and adolescents following exposure to low dose ionising radiation from diagnostic computed tomography (CT) scans.Design Population based, cohort, data linkage study in Australia.Cohort members 10.9 m 3 users 926
温風式チェロ弾き @tonkyo_Vc

またやってる→ 「1000万人必要というのは、少なくとも二重に間違っている。マキノさん解説」 http://t.co/ROASS5nRRa 勿論、いろいろと典型的な誤りをしているという点において。

2013-08-13 00:27:38
まとめ 1000万人必要というのは、少なくとも二重に間違っている。マキノさん解説 豪州のCTを受診した子供68万人の癌リスクについて http://togetter.com/li/513053 サンプル数1000万人必要なら、普通はわからないのでは? 5862 pv 101 7 users 12
温風式チェロ弾き @tonkyo_Vc

要するに、この「というか、 1000 万人必要、という主張は少なくとも 2 重に間違っている。」というツイートは2重に間違っている。https://t.co/8DA6nt4ed9

2013-08-13 00:27:57
温風式チェロ弾き @tonkyo_Vc

まず一つめ、例えばこれは、きわめて初歩的な間違いで、そもそも標準偏差と標準誤差の意味の違いも分かっていないということ。検定で扱われるバラつきは標準誤差であって、標準偏差ではない。https://t.co/GEJfxx7GQT

2013-08-13 00:28:14
温風式チェロ弾き @tonkyo_Vc

ここで牧野氏はσと書いているけど、それは標準誤差を標準偏差と取り違えている。標準誤差はサンプルサイズが大きければ標準偏差をサンプルサイズの平方根、つまりσ/√Nになるわけで、彼はこれをσと混同しているということ。

2013-08-13 00:28:34
温風式チェロ弾き @tonkyo_Vc

標準偏差と標準誤差の意味の違いというのは、統計の初歩の初歩なんだがなぁ。

2013-08-13 00:30:10
温風式チェロ弾き @tonkyo_Vc

それでは、こういったコホート研究のサンプルサイズをどうやって求めるか、ということについては例えばこれが参考になる。⇒「循環器疾患のコホート研究と統計科学」統計数理(1998) Vol.46,p21- http://t.co/A8BG06mGHe

2013-08-13 00:30:36
温風式チェロ弾き @tonkyo_Vc

http://t.co/yeBcKVNFCH - 暴露群と被曝露群の人年が等しければ、ここのp24にある公式に当てはめれば必要なサンプルサイズは求まる。

2013-08-13 00:31:01
温風式チェロ弾き @tonkyo_Vc

で、議論になっている論文 http://t.co/lqD1NaruRmのTable3を見れば、大体どれくらいの頻度でがんが発生しているかがわかる。

2013-08-13 00:47:20
温風式チェロ弾き @tonkyo_Vc

最終的に採用している「CT照射後1年間のがん発生は除外する」という条件の場合、対照群のがん発生頻度は57524/177191342=0.000325になる。つまり、これがこの公式のp1に該当、α=0.95、β=0.2とすれば、Zα=1.96、Zβ=0.84、p=0.000357。

2013-08-13 00:32:38
温風式チェロ弾き @tonkyo_Vc

勿論、このp1は得られたデータから導かれた値だが、国のがん統計からでも大体同じくらいの数値は推定できていたであろう。

2013-08-13 00:33:07
温風式チェロ弾き @tonkyo_Vc

で、2点目の間違いは、もうお解りの方もいると思うが彼はこの公式のR、つまり検出すべき相対リスクの大きさについての考慮を全くしていない、ということ。この値が小さければ当然サンプルサイズは大きくなる。

2013-08-13 00:33:35
温風式チェロ弾き @tonkyo_Vc

実際にどの程度の相対リスクがあるかは、当然のことながら研究を開始する時点では自明ではない。「どれくらいの影響があるかわからない」以上、照射群の例数さえたくさんあるからOK等と言うことはできない。

2013-08-13 00:34:05
温風式チェロ弾き @tonkyo_Vc

ただ、何もわからないでは話は進まないし、実際何もわからないわけでもなくて、情報としては例えばLSS研究の知見を使うという様なことをすればそこそこ見積もることはできる。

2013-08-13 00:35:27
温風式チェロ弾き @tonkyo_Vc

で、「やり玉に挙げている」この坪野先生の記事 http://t.co/wa1uVLaTJg にもあるように、1mSvあたりの過剰相対リスクは本研究ではLSSのそれより10倍近く高かった、ということがあるわけだが、それはあくまで結果論。

2013-08-13 00:36:13
温風式チェロ弾き @tonkyo_Vc

もし、サンプルサイズを求めるならば、CT受診者の約8割が1回受診で1回の平均被曝量が4,5mSvということから、大体5mSvと考えると、LSSでERR=0.3%/mSvということから、大体1.5%、つまりR=1.015ということを予め見積もるくらいが妥当な線。

2013-08-13 00:36:51
温風式チェロ弾き @tonkyo_Vc

すると、公式に当てはめると必要な人年=1200万人年ということになる。つまり、60万人を20年くらい追跡しなければならないわけだが、20年たったら追跡開始時0歳でも成人してしまうから、当然そんなに人年は稼げない。

2013-08-13 00:37:12
温風式チェロ弾き @tonkyo_Vc

実際、Table3によれば、被曝群は650万人年で、必要なサンプルサイズの半分しかない。こういったときには、対照群の人年を増やして同等の有意水準を維持することができて、最大で1/2に漸近するまで被曝群の例数を小さくできる。

2013-08-13 00:37:48
温風式チェロ弾き @tonkyo_Vc

なので、サイズは、CT照射群で大体600万人年に減らせる。ただ、これでもTable3から見る限り結構微妙な線。従って、この研究は計画段階では「もしLSS研究の推定値よりもリスクが小さかったなら、それを有意に検出することは不可能かもしれない」ということであったことになる。

2013-08-13 00:41:40
温風式チェロ弾き @tonkyo_Vc

ところが、実際には当初の見積もりよりもCT受診によるリスク推定値が10倍くらい高かったから、結果として運よく有意になった、と見るのが正しいであろう。

2013-08-13 00:42:02
温風式チェロ弾き @tonkyo_Vc

結局、統計的検定ではどのような統計量を扱うのかがわかっていなかった(標準誤差と効果量)ことに起因する極めて初歩的な間違いだということ。まあ、まとめを作成した方ももう少し検証能力を高めた方が良いのではないかと思われ。

2013-08-13 00:42:39
温風式チェロ弾き @tonkyo_Vc

いずれにしろ、この論文は除外期間を10年まで大きくしても、先行研究の知見に基づき「極めて小さいであろうと予測されるリスクをどうやって統計的に有意に検出できるか」について綿密に例数設計したものであると考えられる。

2013-08-13 09:17:11
温風式チェロ弾き @tonkyo_Vc

そもそも疫学研究は試験計画が生命線で、そんな適当に例数決めているわけではない。「この調査がそうだったというだけでこのサイズが必要だったわけではない、という意味で間違いである」なんてことはないわけ。

2013-08-13 09:17:33
残りを読む(2)

コメント

ひまわり @powerpc970 2013年8月13日
うーん、マキノさんの残念感に拍車がかかってるなぁ…
13
🌸🍀眞葛原雪🍀🌸 @pririn_ 2013年8月13日
標準誤差は標本統計量(sample statics)の標準偏差の事。標準誤差という言葉を使う際の含意してるのは「標準誤差はサンプルサイズが大きければ標準偏差をサンプルサイズの平方根、つまりσ/√Nになるわけで彼はこれをσと混同しているということ。」
0
🌸🍀眞葛原雪🍀🌸 @pririn_ 2013年8月13日
承前)標本統計量(sample statics)の標準偏差が大きいと母数(parameter)と乖離した結果を抽出したサンプルから推計してしまうと言えるから。その意味において、
0
🌸🍀眞葛原雪🍀🌸 @pririn_ 2013年8月13日
承前)標本統計量(sample statics)の標準偏差を統計量(statisc)の標準誤差と呼ぶ場合があるだべさ
0
🌸🍀眞葛原雪🍀🌸 @pririn_ 2013年8月13日
全く無関係な調査のLSSの値でサンプルサイズ出すって変。この研究の標本統計量で標準誤差つまり標準偏差をいくつまでに収めたいか決めたら計算できるはずだよ
0
🌸🍀眞葛原雪🍀🌸 @pririn_ 2013年8月13日
標準偏差と標準誤差の語感が似ているから同じにしてるわけではないのよ http://p.tl/_vb2
1
🌸🍀眞葛原雪🍀🌸 @pririn_ 2013年8月13日
ツイッターでは説明難しいので「(3) 標準誤差」を参照ください http://p.tl/v2Bu
1
mlnkknjinno @mlnkknjinno 2013年8月13日
文系の人に今更高校以上の数学の教科書を読め、というのは辛いんじゃないかな?
5
白黒ダジャレうさぎ @DonnieTheDutch 2013年8月17日
なんか閲覧数とコメント欄が寂しいので記念カキコしておきますね https://twitter.com/hindu_kush420/status/368334472300597249
1
温風式チェロ弾き @tonkyo_Vc 2013年8月17日
↑自分が無芸であることをわざわざアピールしなくても構わないと思いますが。
4
mar @elleelle55mar 2013年8月18日
うんち(?)アイコンの人がドラえもん好きなのは分かりましたが、記念カキコって意味が分からない。何かの揶揄ですか?具体的指摘はないのですね?なので、同じように私が今年食べた桃がNDでしかも美味しかった記念にうんちの人の為に貼ってあげますねhttp://www.youtube.com/watch?v=CGsY8qSjNks
6