LNT仮説?検定に関わる諸問題

詳しくは統計の本、数IIIでも習う話。 ポアソン回帰については、下の方にある書籍参照。 ただし、個人レベルでの推定=ロジット、ハザード などをお薦めする。
震災 原発 低線量 lnt 統計 放射線
20
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
ついでに、「100mSvがLSSの限界という理由」 http://t.co/DalaeqFw 地頭のよい @jun_makino さんはサンプル数の見積もりをゼロから導出された。凡人は、先ほどの http://t.co/3pxfmksZ 2集団における割合の差の検定を使う
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
@ytkhamaoka これは2集団で測定した割合の有意差を検定する公式だが、測定前のサンプル数の見積もりにも使える。単純にn1=n2=nとして、nについて解いてやる。 一般にガンで30%が亡くなり、 1Svあびると1.5倍になるとすれば100mSvだと1.05倍の31.5%。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
95%の確率でこれを検出したければz=1.96。代入すればnが求まる(p1=0.3とすることに注意)。これだと単に0と100mGyの2点だけの測定。これで線形を主張するのは無理。せめて間の50mGyでも測定したい。→p1=0.3,p2=0.3075とするだけ。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
nについて解いた式をみるとわかるように、p1-p2を半分にするには4倍のサンプルが必要になる。LNTをこのような方法で検定しようとすればいくらサンプルがあっても足りない。 
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
2群平均p(1-p)の分だけ違いがでるが、この議論は高線量でも同様。1Svと1.1Svの間に有意差があるかをみるには、p1=30*1.5=45%、p2これの1.05倍とする。2群平均p(1-p)はp=1/2で最大になるので、こちらの方がより多くのサンプルが必要になる。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
余談)一昔前の「トリビアの泉」で「全国の老人が嘘だと思っていることわざNo1」を調べるには何人に調査すればいいか?を青学の美添先生に質問に行くと、まあ2000サンプル調べればokといっておられたのはこのような計算に基づく(2集団の差ではなく1集団の割合の95%信頼区間の公式だが)
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
さらに余談で、あの番組では、サンプル数については、統計学的に検討した公式を用いたのでまあよいが、実際にはどこかの街頭で2000人にインタビューしていたような記憶がある。 →ランダムサンプリングの前提を満たしていない。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
さらに1位は300人のことわざAで、2位は250人のことわざBなので「全国の老人が嘘だと思っていることわざNo1」はAであるのような発表。→これも300/2000と280/2000の割合の差を検定すべき。 といった授業の話も学生が若返ったせいでなかなか通じない。。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
実際には年齢、性別など様々な要因が作用するので、このような2集団での分析は、乱暴。ついでにこの検定では、線量が連続量であるという情報も使っていない。ということで(LSSなどのデータ分析で)実際に使われることが多いのが(ポアソン)回帰分析。 
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
しかし被爆量は連続量で少なくとも足し算引き算ができるので、直線の傾きを云々する「回帰分析」が適用可能。例えばLNTだと、死亡(率)=a+b*被爆量のように定式化。調査対象者層ごとのこれらのデータを用いてa、bを推定する。参考)  http://t.co/XlIbokgs
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
b>0ならば被爆量が多くなると(線形に)死亡率も増加。b<0ならばその逆。b=0ならば関係ないということになる。推定されるb^も統計量なので、これが0という仮説を検定する必要がある。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
そのための検定統計量など、下記資料の下の方参照。 http://t.co/Qe6Hq7o3 t=の式。サンプル数が多ければ、これの絶対値が1.96よりも大きければ95%の確率で推定されたb=0という仮説を棄却できる。 詳しくは統計学の勉強を。 
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
tが大きいほど、bが0でない確率が高くなるということ。tの式とその上の式をみると、tは√Σ(xi-x)^2に比例する。xは私達の例では線量の平均値。xiが個々の線量。大雑把に考えると、サンプル数が多いほど、xも散らばっているほどこの値は大きくなる。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
なので、LSS13などでしているような、100mSv以下のサンプルを取り出して推定する、ということは、サンプル数の減少、線量の分散の減少をもたらす。なので、全サンプルを用いて推定すべき。  実際にはポアソン回帰なのでVar (b^)は複雑になるが、Σ部分は共通。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
その他、性別、被曝時年齢、被爆地なども導入して、それらの影響も考慮できる。線量について非線形が好きならばx^2とか、1/(1+exp(-x))とか、x<100mSvのときは0で、x>=100mSvのときにb*xといったいろんな定式化をして比較できる。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
ついでに、LSSなどの分析では個人レベルでのデータがあるにも係わらず、年齢は5才区切り、線量も10mSv毎とかにわざわざ集計。例 1,2,3,4,5,6→~3が3名(平均2)、~6が3名(同5)。   その中で何人亡くなられたかというポアソン回帰を適用。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
これも先ほどのΣの式を小さくしてしまう。なので、個人レベルのデータを匿名化して公開してもらいたいところ。 集計してしまうのは、計算機環境が貧弱で、ややこしい推定ができなかったころの名残だろう。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
カウントデータの回帰分析 2nd edがそのうち出るらしい)  Regression Analysis of Count Data, 2nd Edition, Cambridge University Press.  http://t.co/sPCpa9aZ ベイズの章追加
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
参考) 被爆者データ13報について、私が再分析した例 http://t.co/JMvB0v5Z 
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka
有料記事で無料公開の前半部分しかみていないが、統計、疫学の考え方(その背景)を知るにはよいのでは。本にもなっているよう。  統計学が最強の学問である|西内啓|cakes(ケイクス) https://t.co/fBrey2bc

コメント

じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月20日
「LNT仮説」があくまで大まかな解釈をする上で政治的に防護を含む意味合いを都合がいいと理由で採用されているだけであって、「LNT仮説」が証明されている物では無い。更に100mSv以下の「非信頼区間」については「閾値」の有無についても議論されている中、「非信頼区間」の「誤差の大きな部分」だけ取り出して計算する意味はいずこに?
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月21日
少なくとも被曝者データではLNTが支持されています。→参照 http://togetter.com/li/441276 放影研の各種論文も読まれるとよいでしょう。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月21日
ytkhamaoka 「支持されていること」と「非信頼区間」が存在し「非信頼区間」の部分は「便宜上」のものであってなんら信頼性を担保しているものではないことは理解されていますか?
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月21日
ytkhamaoka 「LNT仮説」を支持している人達は同時に「非信頼区間」が未だ実測出来ない事はちゃんと理解していますよ。ちなみに100mSv以下の「非信頼区間」の意味合いは「実測出来ない程の影響しか見られない」が「防護を含め便宜上えいやっと直線と見なしておく」です。実測出来ない程の影響を数値化して計算しても全く意味をなしません。よってマキノ氏の真意が理解出来ません。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月22日
「非信頼区間」という言葉は初耳。できれば出所を明示してもらえますか、ないと思いますが。 LSS分析などでは、死亡数=f(被爆量)で推定するので、信頼区間は100mSvなどの被爆量線量そのものについてではなく、ERRの推定値、もしくは死亡数(の推定値)のについて算出されるものです。(線量の測定にも誤差があって云々という話であればまあ別ですが、一連の研究ではそこはあまり重視されていない)。 二つ上のtogetter先で私が再推定した手順をよくご覧下さい。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月22日
ytkhamaoka 誤解されているようですが「LNT仮説」は純粋に学術的に基づいた学説ではありません。その証拠に現在100mSv以下の線量に対する影響については「分からない」と言うのが大方の見方です。影響が分かっているのなら「仮定」により「直線と見なす」では無く「実測値」を用いるはずです。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月22日
ytkhamaoka 学会等で認められている100mSV以下の「実測値」をご存じでしたらご提示ください。つまり「分からない」部分の「仮定」に基づいた「数値や計算式」は「仮定」の域を出る事は無くその評価を行う程の「材料」が無いと言う事です。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月23日
実測値=データ、観測値のことだと解します。それでは、データを使って仮説(LNT,閾値,その他,,)を検証、検定するにはどうすればよい?  例えば(同じ条件の)ネズミ1には何もせず、ネズミ2には200mGyを照射。数ヶ月後に腫瘍の大きさを測定。2の方が腫瘍の大きさが3mm大きかった。 グラフに現すと右上がりの直線。これでLNTが確認されたことになる?
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月23日
 ネズミ3を追加して100mGyを照射したが腫瘍の大きさは1とかわらなかった。グラフに表すと0、100mGyでは0、200mGyで増加。これならば、閾値モデルが支持されたことになる?
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 趣旨を誤読されているようなので改めて提示し直します。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 1.私自身「LNT仮説」を放射線防御の指針として用いる事には賛同している。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 2.「LNT仮説」は学術的にまとめた物では無く、学術的なデーターを基にして「政治的配慮」が加えられて出来ている。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 3.政治的配慮の部分については「過剰評価」、「過小評価」の両論がある。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 4.100mSv以下の線量についての評価は「定まっていない」ため「仮定の直線値」と「見なしている」。(影響の度合いとしてはあまり大きくないと見積もられている。また動物実験等での論文等の発表も盛んではあるが、現在のところ総意と見なされる発表は無い)(閾値の有無についても同様)
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 個人的には閾値はあると思います。100mSv以下の部分についてはS字カーブを描くのでは無いか? と思っていますが、感覚的なもので現状で証明できる様な論文は見つけていません。また今回の争点もここではありません。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 争点:100mSv以下の領域において「実際の影響」(誤差、個体差を含む)が「見えてこない」中で「直線と見なした値」を元にした計算が「実際の影響」に反映できるのでしょうか? と言う事です。理由は「数字」だけが「一人歩き」してしまう事を危惧しているからです。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月23日
ytkhamaoka 説明が不十分であった様に思いますので改めて説明しましたが、当方の誤読・誤解等ありましたらご指摘願います。およびご回答おねがいします。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
直感的に、1サンプルづつだとサンプル数が少なすぎで、結論は出せない(だすべきではない)ような気がするだろう。では、100サンプルづつにするとどうか。するとたいていはばらつくので、かえって目では傾向が見えにくくなってしまうかもしれない。 →その場合、平均値を算出して有意差があるかを検定すべき。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
 データのみでは何の結論もいえない(いうべきではない)。ということ 仮説があるならば、それを数式で表現して、データにあてはめてみる。複数モデルを想定して、あてはまりのよさを比較(疫学、実験でもそうだが)様々な要因が作用するので、それらも考慮する。あてはまり最良の仮説(モデル)を採択する、というのが標準的な手順。このまとめはそれについての補足説明とか私による再推定へのリンク。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
ここにまとめたように、線量を低いところに限定すると、サンプル数の減少、パラメータの分散減少、2重に統計的検定力が低下する。そもそも100mSvで閾値があるかないかを議論するのに0-100mSvだけで測定していたら、100から上で増加するということがわかるわけがない。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
まとめにある私の再推定の例や、コメ欄2つめのをみてもらえば、複数の仮説を設定して、データにあてはめ、どのモデルが最良かを選択する方法が述べられている。Rのコードも公開してあるので疑うならば、自分で推定し直したり、S字を想定したモデルを推定(私のでもしてあるが)してみればよい。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
 親切にも再度 ここから直リンク http://nonuke2011.blogspot.jp/2012/05/lsslife-span-study-13-preston-dl-y.html (たいへんみづらいが)みてもらえばわかるように、放影研の人たちが結論づけたように、線形閾値なしモデルのあてはまりが最良。モデル間の比較の指標としてAIC(赤池情報量基準)を用いた。それが最小になる。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
→上記ページの真ん中にモデルの説明。 そこからリンクしている https://docs.google.com/document/d/1Sf70EcjW1p0boK5jhct2rw3WXB7QE5WM8F27EfDka5k/ にそれぞれのAICが記載→小さい方がデータへのあてはまりがよい。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
私は古いデータの13報を再推定したが、昨年14報が公開された。放影研 RR番号 4-11 原爆被爆者の死亡率に関する研究 第14報 http://www.rerf.jp/library/archives/index.html  要約、参考資料→日本語。「固形がん に関する付加的な放射線リスクは、線形の線 量反応関係を示し、生涯を通して増加を続けていることである。」「ゼロ線量が最良の閾値推定値であった。」 13報と同じ結論。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
具体的に論文をみると(無料、英語) http://www.rerf.jp/library/rr_e/rr1104.pdf  TABLE 6→線量dと表記。 L: 線形モデルd。 Q 2乗項のみのモデル d^2 LQ 1次、2次混合モデル d+d^2 (閾値モデルの簡易版=パラメータによってはあるところから影響>0になる。データに対してこれらのモデルのあてはまりを比較。太字になっているL=線形モデルが最良ということ。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
同 Fig 4これらをプロットしたもの。LでもLQでもまあそんなに差はない。参考までに関数形を規定しない線量カテゴリダミー変数で推定した結果も併記(エラーバーのやつ)。 ちなみにこのデータの被曝量平均は117mGy(結腸線量)。ただし中央値は10mGy。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
別の論文 日本の原発労働者のデータ 全新生物(悪性など)についてはトレンド(線形モデルの簡易版)が支持された。  http://nonuke2011.blogspot.jp/2011/08/blog-post.html  平均累積線量は13.3mSv
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
チェルノブイリのデータ(ケースコントロール法だが) 英文無料  http://jnci.oxfordjournals.org/content/97/10/724.long  こちらのまとめに解説あり (論文には比較の指標が明示されていないのは不備) これについてのまとめ→ http://togetter.com/li/304266
いくた♥️なお/レイフレ21 E40 @ikutana 2013年4月24日
放射能が低いものの放射能測定も統計が重要。1ベクレルの資料を1秒測定したら、放射線は0か1かそれ以上か、分布する。1秒の測定ではその程度の値しかでない。時間が長くなれば中心極限定理で真の値に近づく。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
BEIR VII ph 2 report http://www.nap.edu/catalog.php?record_id=11340 ユーザー登録すれば無料dl可能 ざっとみると様々な反応グラフあり Tab2-2 分子レベルでの実験結果の一覧まとめ Linearが多い。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
後の方にはホルメシスについて主張するものもまとめてはあるが、同 p323 CONCLUSION The committee concludes that the current scientific evidence is consistent with the hypothesis that there is a linear, no-threshold dose-response relationship 略
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
UNSCEAR レポート類 http://www.unscear.org/unscear/en/publications.html 2010 Report parag. 25 癌による死亡。これも被爆者データを利用。FigIIにあるように閾値無しを採用。被爆者データだけだと100-200mSv以上までデータを使わないと有意にならない。ただし、他のデータも含めると、不確実性はあるが、10mGy以上でリスクが上昇と記述。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
同 parag. 41 非ガン影響のうち、胎児への影響については100mSvの閾値がありそう。 詳しくは 同ページの2006report Annex A 参照。結論はparag. 593 (中国、日本、UK,プエルトリコ、米国)のデータを利用。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
低線量WG児玉氏放影研のプレゼンpdf http://www.cas.go.jp/jp/genpatsujiko/info/twg/dai1/gaiyou1.pdf 14枚目のグラフ UNSCEAR 2010 の100-200mSvにのみ触れ、その直後の、10mGy以上でリスクが上昇。には触れず。(100mSv以下に限定すると云々のようにサンプルを限定することの不適切さは述べたとおり)。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
最近出た 英国 自然γ線による小児白血病リスクについての論文 まとめ。  http://togetter.com/li/449198 下の方のグラフ横軸0-15mGyでほぼ線形。
いいな @iina_kobe 2013年4月24日
y軸って、ガン死亡率の上乗せの数字じゃなかったの??なんで腫瘍の大きさとか関係あるのん?
s_matashiro @glasscatfish 2013年4月24日
ばらついて効果が見えない低線量域でも、高線量からのデータと一緒にすれば直線に乗るとして矛盾がない、というのがLNT仮設のモデルかと。それを「低線量域でも影響がある」とする解釈は直接的ではないので、LNTモデルの正しさとは別の観点の導入(防護上、とか安全側とか)が必要なのだと思います。
s_matashiro @glasscatfish 2013年4月24日
モデルの作り方や正しさには納得できても、その意味する範囲の解釈は数理的なものだけでは追っつかないのではないでしょうか。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
腫瘍の大きさは、あくまで例えの話。直接観測できるし、わかりやすいので。→疫学だと(切ったりできないので)直接観測できない、さらに時間的にも大分あとになる、個人差などのばらつきも大きくなる。 ただし、甲状腺嚢胞、結節のように直接、サイズが測定されているものもあります。→その場合には、死亡率などの0/1データよりも少ないサンプルで影響を検出する可能性は高くなります。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
あえて平均、中央値を記したように極低線量でも線形での影響を見いだすものは上記のようにいくつもあります。 高線量からの外挿論については、このまとめや私の再推定ページで述べたように、線量区間を限定するとサンプル数の減少、説明変数側の分散の減少、2重に検出力を低下させます。 あくまですべてのデータを用いて、ある値から効果が異なるというのならば、そのように定式化、推定(してあります)して結論づけるべきというのが、このまとめの趣旨です。
🌸🍀眞葛原雪🍀🌸 @pririn_ 2013年4月24日
glasscatfish それを述べているのがこれだと思います「放射線関連がんリスクの低線量への外​挿」ICRP Publication 99 http://www.amazon.co.jp/dp/4890732055
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月24日
ytkhamaoka ご回答ありがとうございました。まず私が100mSv以下の領域について拘るのは、現在の国内の多くがその範囲に収まる事で国民の多くが興味を持っていると思われるからです。それから私の主張が「数値が一人歩きする」事への危惧である事をあまり意識されていない事が残念です。
じげん (目には目を埴輪には埴輪を) @jigen_the3 2013年4月24日
ytkhamaoka また「計算手法」そのものを否定しているのでは無く、アプローチとしては有効であると思いますが100mSv以下での影響の大きさについての現在の知見ではまだ議論の余地があると思えます。いずれにせよ意見が平行線を辿ると思われますので、ここで議論を打ち切らせて頂きます。ありがとうございました。
いいな @iina_kobe 2013年4月24日
ytkhamaoka で、y軸はなんなのですか?ガン死亡率?影響全般?
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月24日
上の仮想例では上述のように腫瘍のサイズ。死亡率でもよいが、死亡率を計算するには複数サンプルを測定す必要がある+分かりにくいかもしれない。ここでの意図は2, 3サンプルでもグラフにして、様々な形状を観測できるが、それだけでは結論づけられない→データ、仮説、統計的検定の重要性をより明確に示すための仮想例。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月26日
Lessons we SHOULD learn (1) 分析手法を理解する。できればその限界も。 (2) オリジナルデータにあたる。自分も情報源を示す。 (3) 相手が示した文献程度は目を通す。 (4) 論拠を示す。 思うでは話にならない。 (5) 議論したいならば相手と同じレベルの知識を持つ。 (6) 自分が何をわかっていて、わかっていないのかを理解する。 (7) 自分がわかっていない領域について批判しない、批判しても相手にされない。→プロからみるとすぐバレル。 (8) 向上心をもつ。等かな。
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka 2013年4月26日
ついでに、放影研の日本語紀要のようなもの RERF update http://www.rerf.jp/library/update/index.html 英語論文の日本語概説掲載。 例えば最新の2012 vol2では Furukawa et al.(2012)の日本語概説 原爆被爆者における甲状腺がん:被爆後 60年の長期的傾向 など。 その前にはdose-responseのグラフのある白内障論文も。 

いまツイッターで話題の記事

ログインして広告を非表示にする
ログインして広告を非表示にする