8万人にひとりから統計を考え直す〜「どうせゆとりやし」とか「数III取ってないし」とか言わずに・・・

@yoshisatose さんが、福島県での甲状腺癌検診に関連して統計的な考え方について解説してくださいました。 (追記:佐藤さんは2012年10月の学位審査を経て、ヨーテボリ大学から経済学博士号を授与される運びとなりました。おめでとうございます。) 放射線に対する恐怖の98%は統計に対する無理解で出来ています。(当社調べ・統計的に有意かどうかは不明)
震災 原発 統計
179
Yoshihiro Sato @yoshisatose
一昨日の甲状腺ガンの話に関して、確率の計算をグラフにしてみました。【ある一定の羅患率を仮定した場合に「8万人に1人見つかる確率」がどれくらいあるのか?】 (計算ミス、見落としなどがあればご指摘を) http://t.co/hIpnb4O3
拡大
Yoshihiro Sato @yoshisatose
左上は、羅患率(対10万人比)=0.1、つまり、100万人に1人の時。0人見つかる確率は92.3%だが、1人見つかる確率も7.4%はある。ちなみに、2人見つかる確率は0.3%。他の5つのグラフは、羅患率を少しずつ増やしていった場合。0人の確率が減り、1人や2人の確率が増えていく。
Yoshihiro Sato @yoshisatose
6つ目のグラフ、つまり、羅患率(対10万人比)=10、つまり、1万人に1人の場合になると、確率分布はほぼ正規分布(ガウス分布)になることが分かる。
Yoshihiro Sato @yoshisatose
もう一つ、別の計算もしてみました。この方のグラフ(https://t.co/UVK1ifsG )の問題点は、点推計だけを示し、信頼区間がないこと点推計をしたら、信頼区間もしくは標準誤差を示さなくてはダメ。では、95%の信頼区間はどれくらいの幅になるのか?
リンク t.co Twitter / study2007: 地域がん登録全国推計によるがん罹患データ(1975年 ... Verbind meteen met wat belangrijk voor je is. Volg je vrienden, experts, favoriete beroemdheden en belangrijk nieuws.
Yoshihiro Sato @yoshisatose
信頼区間を求めるために、このグラフを作った。これは、羅患率(対10万人比)を0から10に徐々に動かしていったとき(X軸)に、80000万人中1人に症状が見つかる確率(Y軸)がどのように変化するか、を示したもの。 http://t.co/6uKJXrZZ
拡大

ここは80000万人ではなく80000人のタイポと思われます

Yoshihiro Sato @yoshisatose
まず、羅患率がゼロの時は確率もゼロだが、羅患率が0.066を超えた時点で、確率は既に5%を上回るようになる。そして、羅患率=1.26のところでピーク(36.8%)を迎え、その後、緩やかに減少を続ける。確率が5%を下回るのは羅患率が5.6を超えたとき。

罹患率:10万人あたりの罹患数

Yoshihiro Sato @yoshisatose
羅患率が大きくなると、なぜ確率が減少するのか? それは、ここに示しているのが「8万人中1人に見つかる確率」であるから。つまり、羅患率が大きくなると、2人とか3人に症状が見つかる確率のほうが大きくなっていく。
Yoshihiro Sato @yoshisatose
羅患率が10になると、8万人中1人の確率はほぼゼロ。これは一つ前のグラフの右下(6つ目)のグラフとも辻褄があう。つまり、この場合は、8万人中7人とか8人に症状が見つかる確率が最も大きくなる。
Yoshihiro Sato @yoshisatose
結局、このグラフ( https://t.co/UVK1ifsG )の95%信頼区間は、0.066から5.6と非常に幅広いことが分かる。つまり、真の羅患率は95%の確率でこの区間に存在することになる。とんでもなく大きな信頼区間だということが分かる。これでは、判断のしようがない。
Yoshihiro Sato @yoshisatose
以上です。。。(二項分布は私自身は普段あまり使う機会がないので、計算間違いや勘違いがなければ良いが・・・。私が普段使っているのは、正規分布が主です。)
tenten🐸👩‍⚕️☢ @tenten2r
@yoshisatose いつの間にか変なグラフが出てたんですねえ。わかりやすい解説ありがとうございます。
Yoshihiro Sato @yoshisatose
このまとめで、たまたま目にしました。→ http://t.co/H0LSXOsx こうやって、点だけ打てばいかに飛びぬけてるかが分かるけど、実際、信頼区間を求めると、大きな誤差がありうることが分かります@tenten22
Yoshihiro Sato @yoshisatose
先ほどの2つのグラフで示したかったのは、仮に平常時に「100万人に1人」であっても、8万人に1人含まれる確率は7%余りあるし、平常時が「20万人に1人」であれば、その確率はさらに増す、という統計の揺らぎでした。グラフに示すと、結構興味深いでしょ。
Haruhiko Okumura @h_okumura
問:8万人調べて1人見つかった。確率の95%信頼区間は? 答:千万人に3人〜10万人に7人 Rコード:binom.test(1,80000)
Yoshihiro Sato @yoshisatose
0.03~7、ということは、私のグラフで言うとY軸を5%ではなく2.5%で切ったときの2つの交点と一致するようです。95%信頼区間の両側が2.5%ずつになるので、そういうことなのかも。 @glasscatfish
tenten🐸👩‍⚕️☢ @tenten2r
@yoshisatose はあ〜。まとめ見ましたら、確率について皆さんいろいろ誤解してるんだな…と。(私も全然弱いんですけどね^^;)
Yoshihiro Sato @yoshisatose
今後も続けられる検査では、もしかしたら、発症がさらに見つかるかもしれませんが、平常時の羅患率によっては、確率の誤差内であるかもしれない、ということは常に念頭に置いていたほうが良いと思います。無論、現時点では影響がないとも断言できません。
birdtaka@3/15フル回避かも? @birdtaka
@yoshisatose 100万人に1人ということは、100万人を8万人のグループに分けるとそのどれか1グループに1人いるから8万÷100万=8%という説明が難しい話が不得意な人には分かりやすいかも。
Yoshihiro Sato @yoshisatose
概算では、大体それで良いですよね。(おそらく、その概算が成り立つのは、確率が非常に小さいときであり、確率が大きくなるにつれて誤差が大きくなると思いますよ) @birdtaka
mizu @m_enviro
@yoshisatose 今までの統計での罹患率は、症状があって病院に行って判明した数でしょうから、全員を検査する今回の方が甲状腺癌を多く見つけられると思います。確率についてもそうですが、その辺の説明が不足しているかと。
残りを読む(18)

コメント

ひのゆう @you_hino 2012年9月13日
罹患率 p (0<p<1) を仮定して「8万人に1人以上」が起きる確率、なんてのは 1- (1-p)^80000 で出る。これは高校の確率の基礎レベル("^80000" は「8万乗」ね。念のため)。「ちょうど1人」は場合の数が一応いるけど、これも高校でやる程度。
ko-zu @cause_less 2012年9月13日
@yoshisatose https://t.co/UVK1ifsG にはエラーが無いので、描いた人は標本=母集団を仮定してます。 患者数/受診者数・年からの人口あたり推定値と、患者数/人口・回を単純に比較すること自体印象操作でしかない
ひのゆう @you_hino 2012年9月13日
じゃあそれがどの程度になるかが簡単にわかるか、というと (1-p)^n=1-np+(p^2以上の項) なので、p がとっても小さければだいたい 1-np ぐらい。つまり 1-(1-p)^n はだいたい np ぐらい。
ひのゆう @you_hino 2012年9月13日
というわけで、おおざっぱな評価でよければ、手計算で出ます。例えばpが100万分の1でnが8万なら、近似値は np=8%. 2人以上とかちょうど1人とかだと、もうちょっと計算が必要ですが、まあだいたいのことはわかります。
ひのゆう @you_hino 2012年9月13日
って結論は上にも書いてますね。
ひのゆう @you_hino 2012年9月13日
数学でも(少なくとも大学のまともな講義では…)こういう「何かがとても小さい時にはこういう近似ができる」みたいなことはやっている筈です。というか微分して一次近似する、なんていうのはまさにそういうことです(数学嫌いな人御免なさい…)。
たろー @hanpa64 2012年9月13日
文系にもわかりやすい統計の参考書はないものか…
温風式チェロ弾き @tonkyo_Vc 2012年9月13日
you_hino さん、その近似をしたのがポアソン分布になります。なお、平均=np、分散=npになります。このくらいの発生率で2項分布で考えると計算が面倒になるので、上のまとめもそれで考えるのが一番適切です。
ひのゆう @you_hino 2012年9月13日
tonkyo_Vc ポアソンの極限定理ですね。二項分布の極限としてポアソン分布が現れる。ので p が小さい時はポアソン分布は二項分布の良い近似になる。確かに2人以上とか他の場合も考える時はそう言ってしまうと計算が楽ですね。
ひのゆう @you_hino 2012年9月13日
hanpa64 統計って、わたしはちゃんと勉強したことないので(…)参考書は残念ながら挙げられないのですが、理解するにはまずは実際に実験してみることだと思います。今回のような場合は要はサイコロをたくさん振る話なので、面が8万とか100万とかあるサイコロ(!)を8万回振ったら1の目が1回出ました。ということがどれぐらい起きそうか、という話です。
ひのゆう @you_hino 2012年9月13日
hanpa64 そんなサイコロを作るのは無理ですが、実際には、例えば8万面ダイスのかわりに、8面ダイス(0-7の目が出る)を1つと10面ダイス(0-9の目が出る)を4個振って並べてできた数字を考えれば00000-79999の値が得られるのでOKです。 (もちろん10面ダイスは色などで区別がつくようにしておきます。)
ひのゆう @you_hino 2012年9月13日
hanpa64 でも8万回振る方は現実的ではないので本当はコンピュータを使うべきなのですが、それはともかく、普通にサイコロをたくさん振って各々の目が出る確率や平均を計算してみたり、色々実験してみるとだんだん感覚がつかめてくると思います。たぶんそういうことを(思考実験でも良いので)色々やって感覚をつかまないと、本を読んでも結局何の意味があるのかよくわからないままになるのではないでしょうか。
かるちょ @calcio_11 2012年9月13日
俺にとってはとても理解、分かりやすい説明だった。(高校で「確立・統計」選択しててよかった。)
JUN TAKAI @J_Tphoto 2012年9月13日
羅漢律って北斗の拳に出てきた、鬼の哭く監獄カサンドラの中の規律、つまり、獄長の事ですか?それとも、修羅の国の規律ですか?(° (●●) 。)
s_matashiro @glasscatfish 2012年9月13日
J_Tphoto 羅漢率です。羅漢と地蔵菩薩は日本ではよく似た位置づけですが、本来、羅漢は菩薩に至る直前の修行者のこと。つまり、修行の末悟りを得ていても天界の何らかのルールにより、いまだ菩薩とされていない修行者の割合を示します。合掌。 http://www.sousou.co.jp/blog-images/blog_import_4cd7ec9714dcb.jpg
JUN TAKAI @J_Tphoto 2012年9月13日
有難うございます。よくわかりました!(◉ Ⅲ (○ ○) Ⅲ◉)
Yoshihiro Sato @yoshisatose 2012年9月13日
「ここは80000万人ではなく80000人のタイポと思われます」 ← タイポです。書いたときは全然気づきませんでした ^^; それから「罹患率」も正しい用語では無かったみたいですね。失礼しました。
Yoshihiro Sato @yoshisatose 2012年9月13日
.@tonkyo_hanage そうですね。nが大きく、pが小さいときにはポワソン分布で近似できます。ところで、二項分布の分散はnp(1-p)ですよね。
JUN TAKAI @J_Tphoto 2012年9月13日
yoshisatose 先生の罹患率は、何も間違っていないと思います。すいません、罹患という言葉を羅漢と読み間違えた自分が面白くて悪ノリしました。。お気を悪くされませんよう。。
つっしー @tsmer 2012年9月13日
すみません茶々を入れてしまいましたw 僕もうっかり罹患をらかんと読んでしまいます。罹患率自体は正しい用語かと(^^; とても分かり易い解説で多くの人の助けになると思います!
Yoshihiro Sato @yoshisatose 2012年9月13日
いえいえ、私も良く知らないままに使っていたので ^o^ じゃあ、とりあえず間違ってなかったということで。別に茶々だと思ってませんよ。J_Tphotoさんのコメントに最初に「お気に入り」したの、私ですから!
たろー @hanpa64 2012年9月13日
you_hino 解説ありがとうございます。面倒臭がりなのでついイメージだけで捉えてしまうんですが、やはり普段から計算する癖をつけないと厳しいんですよね。地道に勉強します。
笑い猫 @bokudentw 2012年9月13日
罹患率 p サンプル数nとした時、n人に一人発生する確率は1- (1-p)^800これをpを小さいとして近似するとnp, ここで上ではpを百万人に一人としていたが罹患率10万人一人とするとnp=80%となる
笑い猫 @bokudentw 2012年9月13日
しかしながら罹患率は http://p.twipple.jp/qGQP2 こちらによると15-19歳で0.85、10歳以下ならゼロ(百万人一人?)のレベル。今回の調査では0~18歳までの調査だからトータルの罹患率がどれくらいか?がわからないと
笑い猫 @bokudentw 2012年9月13日
したがって起き得る確率npの計算は8%~80%のうちでどのあたりに位置するのかは、0-18歳の罹患率に依存する。トータルでみると0.25あたりと見積もると80000*0.25/10000=0.2=20%となる。20%の確率が高いか低いかこれだけではわからない
neologcutter @neologcuter 2012年9月13日
ポアソン分布ですよね。デマリンが騒いでるけどコレってλ=0.8の場合だから患者が1人出る確率は35.9%(でない確率が44.9%)。つまり1人出てもおかしくない。
いくた♥️なお/伊奈緒たくみ /なまひめざんまい @ikutana 2012年9月13日
逆に、80000人で一人見つかった時、真の罹患率はどれ位の範囲になるかというのも(信頼性を決めれば)出る。その範囲に既知の罹患率が入っていれば増加したとは断言できない。
Yoshihiro Sato @yoshisatose 2012年9月13日
@bokudentwさんのように罹患率を0.25とすると、私の最初の図表の2つ目のグラフに近い分布になりますね(若干、1人が多くなる)。@neologcutterさんの計算では、1.00が仮定されているようですから、4つ目のグラフと同じです。ご覧のように、この場合だと2人とか3人になる確率も無視できないものです。
neologcutter @neologcuter 2012年9月13日
yoshisatose まあ、そうですよね。国立がんセンターの「10万人に1人」を(帰無)仮説として考えてますので。
笑い猫 @bokudentw 2012年9月13日
甲状腺ガンのデータは真の罹患率を確認しながら進めないといけない。また他県のデータとも比較する必要がある。全員のデータ36万人分を見てからある程度の事が言えるようになると思います。現状でははっきりしたことはいえないでしょう
温風式チェロ弾き @tonkyo_Vc 2012年9月14日
yoshisatose そうです。ちなみに平均はnpになります。ところで、この場合、8万人中少なくとも1人患者が発生する時のλ(=np)を考えた方が良いような気がします。この場合の確率は、1-Po(0,λ)を考えて、それをプロットするとこんな感じになるのではないでしょうかhttp://twitpic.com/au64o2
Yoshihiro Sato @yoshisatose 2012年9月14日
@tonkyo_hanage 私のコメント、ずいぶん中途半端でした。二項分布の分散はnp(1-p)なので、pが非常に小さいときは(1-p)→1になるので、ポワソン分布の平均=分散=λ=npとほぼ同じといえますね。はい、X>=1の確率を合計すれば、そうなりますね。ただ、標本集団から1/80000という点推計が得られた際の信頼区間の推定に、それが必要なのか分かりません。
Yoshihiro Sato @yoshisatose 2012年9月14日
@teconium 信頼区間の意味を別の角度から見たものなので、P(L≦θ≦R)=1-α におけるLとRの推計と同じことだと思います。このページ(http://www.ec.kagawa-u.ac.jp/~hori/delphistat/binom.html)の「力による計算」と同じことをしています。
Yoshihiro Sato @yoshisatose 2012年9月14日
@teconium [0.0316, 7.00]になったということは、私のグラフではY=0.025(つまり2.5%)のラインとの交点ですね。私の勘違いがあるかもしれません。少し考えて見ます。
游鯤 @yusparkersp 2012年9月14日
嘘には3つの嘘がある。①嘘、②真っ赤な嘘、③統計。文系で悪かったなw
s_matashiro @glasscatfish 2012年9月14日
yusparkersp ま、 @yoshisatose さんも文系なんですけどね。
s_matashiro @glasscatfish 2012年9月14日
@h_okumura 先生の95%信頼区間に関するツイート(8万人に1人なら 0.03〜7)を追加しました。
温風式チェロ弾き @tonkyo_Vc 2012年9月14日
えーと、http://www.lokad.jp/prob-stat/prob/PDF/stat4.pdfでは、ポアソン分布のパラメータの信頼区間は自由度2(k+1)のχ2乗の2.5%点~97.5%点ですね。これで計算する0.6~14くらい、一方、http://www5d.biglobe.ne.jp/~pomath/study/seimitsuhou.pdfでは自由度2kを採用で、これで求めると0.06~9くらい。どちらが良いのかは判断つきかねますが。
温風式チェロ弾き @tonkyo_Vc 2012年9月14日
まあ、いずれにしても母比率がどの程度か、というのは1オーダー~2オーダーくらいの幅があり、今の甲状腺癌の罹患率、有病率の推定値のいずれもその中に収まってしまうので、1例の発生を以てしては何とも言えない、という感じですね。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
引用)有意水準の決め方 - 薬業界や各種学会には、有意水準は5%が正式であると頑なに信じ込み、1%ならば「高度に有意」だといって鬼の首でも取ったように狂喜乱舞し、10%を「有意の傾向」があるなどと称して、未練がましく横目で見ている人が沢山います。 http://www.snap-tck.com/room04/c01/stat/stat01/stat0105.html 
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
引用)しかし有意水準5%というのは数字のキリが良いから昔から用いられているにすぎず、本当はどんな値を用いても間違いではありません。 いや、むしろ5%にこだわらず、状況に応じて適当に変更すべきものなのです。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
引用)こんなエピソードがあります(ただし、真偽のほどは定かではありません)。フィッシャーが推計学を開発した時、有意水準を決める段になってハタと考えた。 彼は当時30才だったが、50才までは現役で研究を続け、その後は釣りでもしながら悠々自適の余生を送ろうと常々考えていた。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
引用)「農作物が相手だから、これから毎年1回ずつ実験をするとして、20年間に20回できることになる。 まあ、一生に一度ぐらいは間違いを犯しても、神様はお許し下さるだろう」と考えて、20回に1回間違える確率として有意水準を5%にしたのである。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
引用)(略)…とまあ、有意水準5%というのは、これくらいいい加減なものなのです。有意水準は結論が間違っている確率ですから、本来はその結論が間違っていた時にどの程度の被害を被るのか、どれほど重要な実験なのかを十分に考慮して、適切に決めるべきです。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
引用)(略)例えば癌の薬の効果を検証する試験と風邪薬の効果を検証する試験では、本来は有意水準を適当に変えるべきでしょう。 また薬剤の有効性の検証試験と副作用の検証試験でも、やはり有意水準を適当に変えるべきでしょう。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
引用)しかし現在は、どんな場合でも画一的に有意水準を5%にすることが多いようです。 これも有意症症候群の代表的な症状のひとつであり、科学的または倫理的に大いに問題があります。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
以上引用終わり)(以下おまけ) 統計的に差が有意であるか否かはあるデータに対して一意に決まります。(tonkyo_hanage) http://t.co/ibkgHakt
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
(再掲)「有意水準の設定」は人為的なものであるということ,そして公害(の被害)の問題では「外れ値」が(被害者にとって)意味を持つということはいくら強調してもし足りない訳で
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
「有意かどうか」は,「加害者が(被害を少なく見積もるために)『統計のトリック』として使われる危険があること」を被害を受ける側は注意して見るべきだと思います.以上,連投失礼しました
ひのゆう @you_hino 2012年9月15日
被害を多く見積りたいんですね、わかります。有意水準について文句が言いたいなら、有意水準を変えたら実際にどう評価が変わるか計算して、それによって今回の主張が変わるかどうかぐらいチェックしてみてはいかがですか。やり方はここに書かれることをから出発してちゃんと勉強すればわかると思うのですが。
Yoshihiro Sato @yoshisatose 2012年9月15日
.@hindu_kush420 だからといって、統計的有意性の議論が意味を持たないわけではない。優位性を無視すれば、study2007のようなグラフを提示して、議論をいかようにも操作できる。それこそまさに『トリック』と呼ぶべきものだろう。
Yoshihiro Sato @yoshisatose 2012年9月15日
私がここで示したかったのは、点推計だけグラフに描いてもそれだけでは意味がなく、真の値はそれから遥か遠くにあるかもしれないということ。有意水準を5%に取るのが嫌なら、10%や20%を選べばよいが、それでも下限は通常の罹患率を上回らない。
ひのゆう @you_hino 2012年9月15日
実際に個々の事例が原発由来の放射線被害かどうかは判定できないんだから、検査して出たものは一律に救済されるんだろうと思うんだけど(調べてないから、そうあるべき、というべきか)。
Yoshihiro Sato @yoshisatose 2012年9月15日
訂正: 「優位性を無視すれば」 → 「有意性を無視すれば」
ひのゆう @you_hino 2012年9月15日
そもそもここの話は統計的に有意ですらないから、今後の動向に注目しようね、という話でしかないと思うのだが。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
.yoshisatose 「統計的有意性の議論が意味を持たない」のではなく「有意性(の乱用・御用)が誰にとって意味を持つのか」というのがポイントです.
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
↑上のコメント「誤用」の間違い(笑)
Yoshihiro Sato @yoshisatose 2012年9月15日
.@hindu_kush420 このまとめの議論と関係なし
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
「統計的に有意でないから無意味である」とか「有意差がないなら因果関係はない」みたいな誤解やゴマカシによって,誰が得をし誰が損をするのか,を考えると色々見えてくると思います.
セクサー℠ @sexxor 2012年9月15日
DonnieTheDutch おいおっさん、お前が勝手に誤解しているというか誤魔化しているだけだろ。はっきりいってお前は党派に何ら貢献しない役立たず。お前の発言で誰も踊らない。マジうっとうしいだけ。2chでもお前評判悪いよ「きもちわるいヤツ」だって。
son_in_law @son_in_law 2012年9月15日
「誰が得をし誰が損をするのか,を 考える」と、見えなくなるものが多いことは、この一年半で嫌になるほど見てきました。目の前のことを余談を持たずに見るのは難しいけど、そう心掛けようという意識すら捨てたらおしまいですね。
ひのゆう @you_hino 2012年9月15日
DonnieTheDutch うんだから統計を使って真摯に議論されると、あなたにとっては都合が悪いんでしょ?それはもうわかったから、ここで誰かが誤解を招こうとしたとか「ゴマカシ」をしたとか言うならもっと具体的にやってください。具体的に適用できない一般論には意味はありません。
son_in_law @son_in_law 2012年9月15日
数式が直感的に理解できなくても、少しパソコンを叩けば可視化してくれる良い時代ですね。数学苦手な人ほど利用すべし。
セクサー℠ @sexxor 2012年9月15日
【みなさまへ】@hindu_kush420 というひとは定期的に池田香代子氏や菊池誠先生に陰湿な絡み方をする輩です。まあ、このスレッドをみりゃご理解いただけますよね。一発罵倒してからブロックするのが丁度よい相手です。シカトでもよろしいかと。
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
[c721623] 工業製品の品質管理では(コスト・ベネフィットの観点から)「誰が得をするか」を考えることは自然だと思います.一方,公害による健康被害には「被害者」が存在します.
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
加害者と被害者の利害が対立するわけですし,人の生活や健康がかかっているにもかかわらず,「工業製品の品質管理」と同じ手法や思想でデータを「解析」する危うさを感じるわけです.
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
「非常に放射線に弱い体質を持つ人」などは恐らく「外れ値」として有意性に大きくは影響しないでしょうが,因果関係は確かにあるわけです.「そういう少数派は社会のために我慢しろ」みたいなことを,そのような被害者に強いても良いのか,みたいな話です.
温風式チェロ弾き @tonkyo_Vc 2012年9月15日
[c721039] 確かに、下側で自由度2k、上側で自由度2(k+1)をとっていますね。で、もう一回見直してみたら確かに分母を2で割るのを忘れていましたorz
温風式チェロ弾き @tonkyo_Vc 2012年9月15日
まあ、hindu_kush420さんにここで議論されているのが有意であるか否かと何の関係ない話であるということが理解できないのは、もう十分わかっている話で(笑)。なんだったら貴方の失笑ツイートまとめ、非公開を公開に切り替えましょうか?まあ、そもそも統計は例外を切り捨てるための手法ではないし、それが人の健康(人口)管理のために発達したという常識すらご存知でない時点で話にもならないわけですけどね。
戦国自衛隊 @minawarekukuku 2012年9月15日
↑これをみてば理解が深まる。。素養の有無というのも大事でしょう http://togetter.com/li/312706
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
素養も大事ですが,「8万人にひとりから統計を考え直す」場合に「8万人のうちのひとり」の立場と「8万人のうちの7万9999人」の立場のどっちから見るのか,ということを考えさえすればおのずと理解できるのではないかと思います.
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
さらに「8万人は全員同じ条件(耐性)を持ち,たまたま一人に影響が出た」という可能性と「8万人はそれぞれ耐性が異なり,耐性が特に弱いひとりに影響が出る放射線量だった」という可能性が考えられると思います.
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
後者の場合,「耐性が特に弱い人」にとっては確定的影響が出る放射線量は平均より低いわけで,「同じ条件を持つサンプルでランダムに影響が出る」という仮定が妥当かどうか,という疑問も生まれます.
白黒ダジャレうさぎ @DonnieTheDutch 2012年9月15日
統計量,推定量などは誰が計算しても同じ値になるわけですから,(他人の計算ミスを指摘する以外に)議論の余地はほぼないわけで.むしろ計算のベースになっている「仮定」や「設定」の妥当性を議論をする方がまあ実りあるものになるのではと.
温風式チェロ弾き @tonkyo_Vc 2012年9月15日
>「8万人のうちのひとり」の立場と「8万人のうちの7万9999人」の立場のどっちから見るのか→というものがそもそもナンセンスだし、>,「同じ条件を持つサンプルでランダムに影響が出る」という仮定→なども誰もおいていないんですけどねえ。 まあ、hindu_kush420さんの知的レベル(これは別に勉強のできるできないではないです)と倫理性の低さが外れ値であることは明白ですが(笑)
ひのゆう @you_hino 2012年9月15日
調査結果を統計的に処理することで、何らかの仮説の妥当性を議論するんじゃないの?「人の放射線耐性に大きなばらつきがある」とか「極端に弱い人がいる」とか主張したいなら、どういう調査をしてどのように統計処理したらそれが判断できるかを考えて調査したりデータを洗ったりすべき。しかもこの話って「これだけでは情報量が足りない」という話じゃないの?一体誰と戦ってるんだ?
温風式チェロ弾き @tonkyo_Vc 2012年9月15日
そもそもやるべきことは最も蓋然性がファクターから潰していくことで、それを「丸々である可能性は否定できない」などといった言辞を弄するのは単に問題解決を無限に先送りするための猿芸でしかありません。まずは自分の行っている行為が自分の期待する結果を阻害しているかも、くらいの想像力を持ってから出直したらいかがでしょうかね。
ひのゆう @you_hino 2012年9月15日
そんなに今回の原発事故による放射線被害が出て欲しいわけ?
ひのゆう @you_hino 2012年9月15日
妥当性に問題がある、と言いたいなら、自らの発言の妥当性をまず証明すべき。そうでないならただの言いがかり。それこそ自らの望む結論と反する結果に文句をつけるが為に詭弁を弄しているだけ。
ひのゆう @you_hino 2012年9月15日
というわけで、「耐性が特に弱い人」とやらが存在する可能性について、十分な論拠を示してください。
温風式チェロ弾き @tonkyo_Vc 2012年9月15日
で、そもそもまとめ冒頭のこのグラフhttps://twitter.com/study2007/status/245459704678072320/photo/1/large は、罹患率と有病率(これらも検査体制などによって変化します。このところは→http://togetter.com/li/372396 参照)を混同していますね。
s_matashiro @glasscatfish 2012年10月20日
まとめに追加しました→(追記:佐藤さんは2012年10月の学位審査を経て、ヨーテボリ大学から経済学博士号を授与される運びとなりました。おめでとうございます。)
um @nanasi0003 2013年9月12日
「甲状腺がんが新たに○人」という見出しが踊り始めた昨今、このまとめを再確認しとこ
ログインして広告を非表示にする
ログインして広告を非表示にする