パトリさんと統計の話

まとめました。
1
yoka72 @yoka72

@iPatrioticmom それらの研究でも、5000位の母数で発見数が0の所をコントロールに選んでいるのですか?

2015-07-02 14:53:34
yoka72 @yoka72

@iPatrioticmom 例えば、福島市も伊達市も発見数が明らかいに多いという状況であれば、見方は変わってくるかもしれませんけど。そういうのは無視して【選んでいる】わけですから、恣意的であるという批判は免れないと思います。コントロールとしている地域の選び方は特にですが。

2015-07-02 14:58:01
NPPNO @NPPNO

@yoka72 複数地域あっても、差がもっとも開いた2地域の開き具合が大きければ、その2地域の値が、地域差あるかどうかについて、かなり支配的だと思われませんか。(各地域の人口がそろっているか、差の開いた地域の人口が大きい場合です。)自分はそう思います。

2015-07-03 00:12:50
NPPNO @NPPNO

@yoka72 そのことは理解しているつもりです。ただ、先ほどの計算は失敗するとわかりきった計算をわざわざしているだけという印象です。値の差の大きく開いた2地域がある場合、全体の散らばりが大きくなるので、複数地域の場合でも地域差ありとなる場合も多そうに思います。

2015-07-03 00:20:04
NPPNO @NPPNO

私の言葉で翻訳すると yoka72さんの主張:地域数が多ければ特定2地域の比率が有意差有でも地域全体でみれば有意差有とはいえないこともある。 正しいと思います。

2015-07-03 07:43:18
NPPNO @NPPNO

NPPNOの見解:地域差に関するyoka72さんとパトリさんの互いの主たる主張は矛盾しない。 NPPNOの提案:最小値5,最大値30の2地域がある場合に3地域から10地域くらいで地域全体で地域差がどうなるか考えてみる。

2015-07-03 07:54:50
yoka72 @yoka72

@NPPNO 例えば、5000人規模の母数でも、100人とか発見されればこれはおかしいという話になるでしょうね。この辺は数字の相場観の問題で、経験が無いとわからないのではないでしょうか?少なくとも、およそ0/5000と3/5000を比較して、

2015-07-03 16:10:17
yoka72 @yoka72

@NPPNO 10万人あたりにすれば57倍とかいうのは、あまり意味がないんじゃないですかね。地域が10もあれば、相当の確率でそういった事は起こると思われますし。

2015-07-03 16:12:25
NPPNO @NPPNO

@yoka72 私の主張は「地域差があるかどうかを考察する際に、あたりをつけるために、あえて最大、最小の地域を比べることにも意味はある。そして、それは時に地域数が2より大きくても有効である」です。これを統計学的に考えてどう思われますか?と伺ったつもりです。「相場観の問題」でなく。

2015-07-04 00:16:25
yoka72 @yoka72

@NPPNO ですから、【そういう部分はあるでしょうが、それを判断するには相場観が必要なのでは?】と申し上げたつもりなのですが。

2015-07-04 00:26:28
NPPNO @NPPNO

@yoka72 ?私のツイート引用つきで、「地域が2つしか無ければそういう考え方で良いのかもしれないけど、実際には複数地域があるからというのが昨日の話だったわけで。」と書かれていますが、どういう意味だったのでしょう。togetter.com/li/841913

2015-07-04 00:45:52
yoka72 @yoka72

@NPPNO twitter.com/yoka72/status/… これは一応肯定の意味で書いたのですが。引用させて頂いたのは話の発端で、その後のtwも収録してますよ。

2015-07-04 00:50:25
NPPNO @NPPNO

@yoka72 すみません、肯定と読めませんでした。直後のツイートみても「二群間の検定で有意差がある事と、複数群の中で有意差がある組み合わせがあるというのでは、意味合いにこれほど違いがある。」とあるので肯定とは読む人は少ないと思うのですが、どうでしょう。

2015-07-04 01:18:21
yoka72 @yoka72

@NPPNO mobile.twitter.com/NPPNO/status/6… これも収録してますし、5000の母数で100とか発見されれば〜というようなことも書いてます。複数群であっても特定の二群に極端な差があればというのはあるかもしれませんが、判断には相場観が必要だと思います。

2015-07-04 01:27:24
NPPNO @NPPNO

@yoka72 ようやくわかってきました。自分は統計素人で「相場観」がないのでとにかく雑な議論でもいいから様子をみることを大事だと思っている。yoka72 さんは最小値5と最大値30の2地域を含む10地域に関しては判断は保留し、最大値100なら10地域でも地域差有と判断。(続)

2015-07-04 01:42:21
NPPNO @NPPNO

@yoka72 まとめ頁の冒頭は、「特定2地域で大きな差ならそれだけである程度判断できることもあるけど、通常は慎重な態度をとるべきですよ」という意味。大筋あっていますでしょうか。他の方にも、最初から標準的な手法で検定した方がいいですよ、とアドバイスいただきました。(続)

2015-07-04 01:50:14
NPPNO @NPPNO

@yoka72 まとめの最初が肯定の意味に取れなかったので、何度も質問してしまってすみません。先ほどので大筋があっているなら、納得です。どうもありがとうございました。

2015-07-04 01:52:54
yoka72 @yoka72

@NPPNO 分母が無いとちょっと判断しかねる内容ですが、5000人程度の母数で、平均が2程度生じる事象が100発生すれば、さすがに確率的に相当に小さなものになりますので。1万程度の母数で平均17.5、最小5と最大30というのも発生確率としては結構低そうに思いますが、

2015-07-04 11:26:42
yoka72 @yoka72

@NPPNO そういう事例は福島では無かったと思います。もっとも、発生0の事象の母数をかさましするために、発生0の地域を【選んで】足しこむような事をすれば、発生確率の低い事象が起きたように見せられるかもしれませんが。

2015-07-04 11:28:40
yoka72 @yoka72

@NPPNO まとめの最初は仰る通り否定から入ってますが、まとめ全体としては全否定ではないということです。話の流れの中で、まぁ極端な例があれば複数地域の中での2地域の差に着目するのも問題無いかなと思ったので。

2015-07-04 11:31:28
yoka72 @yoka72

@NPPNO ただし、基本的には、複数群の検定には多重検定を使うべきだろうという考え自体はは変わりませんが。

2015-07-04 11:32:04