なかなか良い練習問題である。

統計って、難しいです。
13
切り取り線 @kiri_tori

✄------------ 2/12(水) -----------✄

2014-02-12 00:00:00
Jun Makino @jun_makino

https://t.co/89o14CD1xv これ からの一連の tw について、間違い (1 つというわけではない ) を指摘 せよ、というのはなかなか良い練習問題になると思う。

2014-02-12 23:02:21
切り取り線 @kiri_tori

✄------------ 2/13(木) -----------✄

2014-02-13 00:00:01
Jun Makino @jun_makino

https://t.co/uhwQOW5hVF これ についてはとんきょさんのいうとおりで、私も「若干本来の値より高いかもしれない」と書いてる。

2014-02-13 23:18:25
Jun Makino @jun_makino

そもそも「高いめにでるので」ではなく「高いめにでるかもしれないので」であるべきで、そうでないとなぜ「高いかもしれない」になってるかわからない。

2014-02-13 23:18:28
Jun Makino @jun_makino

さて、解答の一部。とんきょさんは https://t.co/mtTS0UBvkm ここ で、次に引用するように書いている。

2014-02-13 23:18:30
Jun Makino @jun_makino

引用 : これは、一次検査受診者の全員が最後まで結果が確定したと仮定したときの悪性 or 悪性疑い者が 23 年度は 16 人、 24 年度は 60 人、 25 年度が 19 人になるだろう、ということ

2014-02-13 23:18:32
Jun Makino @jun_makino

で、数字から判断するとこれから 3x2 ( か 2x3) 表を作って、それを検定 プログラムにつっこんだようである。

2014-02-13 23:18:35
Jun Makino @jun_makino

そう私が判断するのは、これらの数字から https://t.co/bOQKutTLaR ここ でリンクされているサイトで計算するととんきょさが出した数字になるから。

2014-02-13 23:18:37
Jun Makino @jun_makino

これの何が間違いかというと、 25 年度分で実際に見つかった悪性 or 悪性 疑い者は 10 人なのに、「全部検査がおわったら見つかるであろう期待値」を 19 と推測して、その 19 を使って検定しているからである。

2014-02-13 23:18:39
Jun Makino @jun_makino

「サイコロ 1000 回ふって、 1 の数を数え、このサイコロがまとも なものかどうか判定しなさい」という課題を与えられたとしよう。

2014-02-13 23:18:41
Jun Makino @jun_makino

実際の数は 10 なのに全部調べたら 19 なのでそれを使う、というのは、 1000 回ふるのが面倒だから 500 回ふって、でてきた 1 の数を倍にして 1000 回ふった時の分布を使って検定する、というのと同じことをやっている。

2014-02-13 23:18:44
Jun Makino @jun_makino

もちろん、 500 回しかふってなければ 500 回ふった時の 1 の期待値で検定し なければいけない。

2014-02-13 23:18:46
Jun Makino @jun_makino

この場合に分散を計算してみると、 1000 回ふって 1 数えた時の分散に比べ て 500 回ふって 1 数えて 2 倍したものは分散は 2 倍、標準偏差はルート 2 倍である。

2014-02-13 23:18:48
Jun Makino @jun_makino

なので、 500 回ですますと期待値からのずれが大きくなる傾向がでる。つ まり、 p 値を過小評価する。

2014-02-13 23:18:51
Jun Makino @jun_makino

まあ、そういう間違った評価をしても p が大きいんだから帰無仮説で いいことには変わりはなかろう、という主張もできなくはない。 もちろん、他に間違いがなければそうもいえる、という話。

2014-02-13 23:18:53
内田 @uchida_kawasaki

@jun_makino ツイートを使わせていただきました。問題ありましたら対応しますのでご連絡ください。 http://t.co/IW5N1GCPNa

2014-02-13 23:29:04
Jun Makino @jun_makino

@uchida_kawasaki あ、いつもありがとうございます。問題ありません。

2014-02-13 23:37:33
内田 @uchida_kawasaki

@jun_makino まだ、他にもあるのですね。恥ずかしながら私には見抜けないですけど。

2014-02-13 23:44:13
切り取り線 @kiri_tori

✄------------ 2/14(金) -----------✄

2014-02-14 00:00:00
Jun Makino @jun_makino

@uchida_kawasaki 自信たっぷりに書かれるとこっちが間違ってるかとか思いますし、結構難しいです。

2014-02-14 01:20:11
切り取り線 @kiri_tori

✄------------ 2/15(土) -----------✄

2014-02-15 00:00:00
Jun Makino @jun_makino

https://t.co/HrydCogseV 最大の統計的パワーが得られたときにどの程度のものか、を見ているわけなのだけど

2014-02-15 12:35:59
Jun Makino @jun_makino

「一次検査受診者全員の結果が確定した場合」 19 人になるという保証はないというかならない可能性のほうが大きいわけで、意味がないいいわけである。

2014-02-15 12:36:01
Jun Makino @jun_makino

これは、私が昨日書いた「間違った評価をしても p が大きいんだから帰無仮説で いいことには変わりはなかろう、という主張」に近いが、より不可解なものになっているのがとんきょさんらしい。

2014-02-15 12:36:03