「統計」について

3
黒木玄 Gen Kuroki @genkuroki

#統計 2×2の分割表 A A' B a b m B' c d n t t' s でa+b+c+d=s, a+b=mだけではなく、a+c=tも固定することをどのように正当化しているかを Lehmann-Romano, Testing Statistical Hypotheses, 3rd ed. 2005 で確認してみました。ひどく強引で非論理的な議論をしていた。 pic.twitter.com/EdbEYdvX3N

2019-08-14 16:17:50
拡大
黒木玄 Gen Kuroki @genkuroki

#統計 続き。UMPはunifomly most powerfulの略です。そういうすごそうな形容詞を付けても、a+b+c+d=s=(サンプルサイズ)、a+b=m=(治療法Bを施した人数)だけではなく、a+c=t=(治療に成功した人数)まで固定するのは、治療成功数がランダムに揺らぐという現実に合わない仮定です。

2019-08-14 16:17:52
黒木玄 Gen Kuroki @genkuroki

#統計 続く。そういう仮定が「近似」として害がないのであれば問題ないのですが、コンピューター・シミュレーションで確認すると、治療成功数がランダムに揺らぐという現実的な状況でサンプルが生成される状況を、治療成功数が固定された状況で近似することは無理があることが明瞭になります。

2019-08-14 16:17:52
黒木玄 Gen Kuroki @genkuroki

#統計 続き。実際にやってみたコンピューター・シミュレーションについては以下のリンク先を参照。 個人的な意見では、Fisher検定を「正確だ」と評する人達は「帰無仮説」の概念を正しく理解しておらず、ゆえに専門家であっても仮説検定について間違った考え方をしている。 twitter.com/genkuroki/stat…

2019-08-14 16:17:53
黒木玄 Gen Kuroki @genkuroki

#統計 添付画像の解説続き p値がx以下になる確率yはxに一致して欲しいのですが、グラフを見れば分かるようにそのようにはなっていません! Fisher検定のp値もこの意味で決して正確ではありません。 twitter.com/genkuroki/stat… pic.twitter.com/xdAiNm9rUR

2019-07-23 11:26:56
黒木玄 Gen Kuroki @genkuroki

#統計 上で引用した次のページもこんな感じ。 (i),(ii),(iii)の3つのケースでは、独立性の帰無仮説を満たす確率分布にそれぞれ3個、2個、1個のパラメータが入って、一意に決まらないんですね。 カイ二乗検定なら一意に決まっていなくても適用可能。小サンプルサイズでも結構robustです。 pic.twitter.com/TSVIfSGF5B

2019-08-14 16:52:48
拡大
黒木玄 Gen Kuroki @genkuroki

#統計 「マニアック」な人は「Barnard's and Boschloo's exact tests はどうか?」と言うかもしれませんが、すでに試してあります。私の結論は「シンプルなカイ二乗検定で十分。その手の複雑なことをしても得られるメリットはない」です。 twitter.com/genkuroki/stat…

2019-08-14 17:01:12
黒木玄 Gen Kuroki @genkuroki

#Julia言語 2×2の分割表の独立性検定シリーズ4/4 nbviewer.jupyter.org/gist/genkuroki… 2×2の分割表の独立性に関する様々な検定法の比較 Barnard's and Boschloo's exact tests (double binomial case)を含むことがこのノートブックの売りです。 私の結論:(補正無しの)カイ二乗検定で十分。 pic.twitter.com/rkE6wnt1Um

2018-03-16 15:14:03
黒木玄 Gen Kuroki @genkuroki

#統計 Neyman-Pearson流の解釈だかなんだか知りませんが、サンプルが確率変数(確率的に変動するもの)であることに由来する確率をわざわざ「~の割合で的中する」と言い直す理由が不明。 そのように言い直しても、数学的モデル内部での確率に過ぎないので、底が抜けている。 twitter.com/katzkagaya/sta…

2019-08-14 18:50:40
Katsushi Kagaya @katzkagaya

信頼区間についてよく広まっている説明はネイマン・ピアソン流の解釈のようだ。添付の記述は「らくらく生物統計学」より。 pic.twitter.com/mRsJC8neLp

2019-08-14 18:02:20
黒木玄 Gen Kuroki @genkuroki

#統計 統計学に限らず、 「〇〇流の解釈では云々」 だとか 「〇〇主義では云々」 のような言い回しが出てきたら、 この解説者は論理的・科学的・合理的な説明を諦めている とみなすことが妥当な場合が多いと思う。

2019-08-14 18:58:23
黒木玄 Gen Kuroki @genkuroki

#統計 仮に「~の割合で的中する」を「~の確率で的中する」としたならば、「標本抽出・信頼区間作成を繰り返し~」のような「繰り返し」も余計。「繰り返し」が必須だと イカサマじゃないサイコロを__1回だけ__ふります。 このとき、偶数に目が出る確率は1/2です。 と言えなくなる。

2019-08-14 18:58:24
黒木玄 Gen Kuroki @genkuroki

#統計 あと、サイコロをついたてで隠してふった人が1の目が出たことを知っているときであっても、ついたてのせいでどの目が出たのか見えなかった人が「偶数の目が出た確率は1/2だ」と言っても全然問題ないよね。 人によって確率の合理的な見積もりで想定する確率測度は違っていても良い。

2019-08-14 19:03:44
黒木玄 Gen Kuroki @genkuroki

#統計 確率論はギャンブルで役に立つような道具でないと困るので、壺の中のサイコロの目が確定しているときに、「壺の中のサイコロの目は偶数か奇数か確定しているので、偶数である確率を考えても意味がない」のようなことを言われても、「はい、そうですか」と頷くのは無理な相談だと思う。

2019-08-14 19:24:35
黒木玄 Gen Kuroki @genkuroki

#統計 あと、何度でも繰り返しますが、数学的モデルの中で「~の割合で的中する」ことが正しくても、現実の母集団についても正しいとは限らないというようなことはクリアに説明して欲しいと思います。 数学的モデルと現実の区別を曖昧にする行為は致命的に非科学的。

2019-08-14 19:39:22
黒木玄 Gen Kuroki @genkuroki

@phasetrbot 英語の本でも気になる部分は日本語の本と同じです。たぶん、統計学入門書が抱えている問題は世界共通だと思われます。 #統計 数学面で困難がないなら最初から難しめの本を読む方が「安全」ということがあるかもしれません。日本語圏なら赤池弘次さんもしくはそれに近い人達が書いたものを読むとか。

2019-08-15 06:59:38
黒木玄 Gen Kuroki @genkuroki

#統計 資料:英語版の「信頼区間」のウィキペディアの「誤解」の節には 【厳密な頻度主義者によれば~もはや確率の問題ではない】 と書いてあって、その後にNeymanさんの言葉が引用されています。 肝腎の「数学的モデルと現実の区別」については記載無し。 ひどいね。 en.wikipedia.org/wiki/Confidenc… pic.twitter.com/kqtBbtxB8r

2019-08-15 07:42:43
拡大
黒木玄 Gen Kuroki @genkuroki

#統計 そのウィキペディア記事では「研究者達による信頼区間の誤解」について以下が紹介されています。 iase-web.org/documents/pape… pdfs.semanticscholar.org/1102/df06d8372… ejwagenmakers.com/inpress/Hoekst… sciencenews.org/blog/context/s… まだ読んでいない。

2019-08-15 08:29:32
黒木玄 Gen Kuroki @genkuroki

#統計 個人的には、「100(1-α)%信頼区間」の意味は「信頼区間を計算するために用いた数学的モデルが有意水準αの検定で棄却されないパラメーターの範囲」と解釈しておけばシンプルかつ安全だと思う。 データから信頼区間を計算することは、パラメータ付きの数学的モデルのデータによる評価の一種。 pic.twitter.com/wVDWfKwnwu

2019-08-15 08:40:44
拡大
黒木玄 Gen Kuroki @genkuroki

#統計 例えば、現実の母集団平均μ₀を 平均μの正規分布モデル(分散は不定)とt分布を使う方法 で区間推定したとき、100(1-α)%信頼区間は 平均μの正規分布モデル(分散は不定)が有意水準αで棄却されないμの範囲 を意味していると解釈すればよいわけです。

2019-08-15 08:52:02
黒木玄 Gen Kuroki @genkuroki

#統計 統計学入門書に書いてある「標本抽出と区間計算を繰り返すとき、真の値μ₀がその区間に含まれる頻度の割合は1-αに近付く」というような解釈は__誤り__。 「平均μの正規分布(分散は未知)だ」という仮説が有意水準αで棄却されないμの範囲であると解釈すればシンプルかつ安全。

2019-08-15 08:52:04
黒木玄 Gen Kuroki @genkuroki

#統計 統計学入門書に書いてある「標本抽出と区間計算を繰り返すとき、真の値μ₀がその区間に含まれる割合は1-αに近付く」のような説明は二重の意味でよろしくない。「確率」と言ってよいのに、「割合」と言い換えているのはよくない(軽い罪)。数学的モデルと現実の区別が曖昧なのは致命的。

2019-08-15 09:02:05
黒木玄 Gen Kuroki @genkuroki

#統計 シミュレーション例 twitter.com/genkuroki/stat…

2019-08-15 09:26:38
黒木玄 Gen Kuroki @genkuroki

#統計 例:α=0.1, θ=10のガンマ分布(平均1、分散10)で生成したサイズn=100のサンプルX_1,…,X_nについて M=X_1,…,X_nの平均 U=√(X_1,…,X_nの不偏分散) とき、平均μの95%信頼区間として M-1.96U/√n ≦ μ ≦ M+1.96U/√n を採用すると、真の平均1がこの区間に含まれる確率は88%程度になる。続く

2019-08-11 19:46:33
黒木玄 Gen Kuroki @genkuroki

#統計 上の例で、「標無作為本抽出と信頼区間の計算を繰り返すとき、真の値μ₀がその区間に含まれる割合(確率)は1-αに近付く」は、もしも母集団分布が正規分布になっていれば正しいです。 しかし、現実の母集団について無条件に正規分布性を仮定するのは苦しい。

2019-08-15 13:54:41
黒木玄 Gen Kuroki @genkuroki

#統計 上の例では、母集団分布が正規分布になっているかどうか不明であっても、信頼区間に含まれるμについては 「母集団分布が平均μの正規分布である」という仮説が有意水準αで棄却されない とは言える。こういう推論ならば論理的にクリアかつ安全。

2019-08-15 14:01:49
黒木玄 Gen Kuroki @genkuroki

#統計 (1) 無作為抽出と信頼区間の計算を繰り返すとき、真の値μ₀が信用区間に含まれる割合は1-αに近付く(誤り) (2) 信用区間に含まれるμについて「母集団分布が平均μの正規分布である」という仮説が有意水準αで棄却されない(正しい) 誤りである(1)が非常に強い結論になっていることに注意。続く

2019-08-15 14:14:07
黒木玄 Gen Kuroki @genkuroki

#統計 信頼区間ユーザー的には、強い結論が得られることにしておいた方がうれしいだろうし、統計学普及側にとっても、強い結論が得られることにしておいた方が宣伝し易い。 しかし、その強い結論は、数学的モデルと現実を混同することによって得られており、非科学的な内容になっている‼️

2019-08-15 14:14:09
黒木玄 Gen Kuroki @genkuroki

#統計 この手の例を出すときに悩むのは、無作為抽出がベルヌイ試行になっているシンプルだが特殊過ぎる場合の取り扱い。 例:政策Aに賛成の投票をするか否かを問うアンケートを母集団からの無作為抽出で行う場合。 母集団全体では政策Aへの賛成票を入れる人の割合が決まっていると仮定。続く

2019-08-15 15:14:20
1 ・・ 15 次へ