アメリカ統計学会 p値の見直し勧告 への感想

15
⅃ЯAƎ⊿せかんどらいふすたあと @DrMagicianEARL

承前)「p値はそのデータが特定の統計モデルとどの程度適合しないかを示すもので,その仮説が真である確率を与えないしランダムな偶然からそのデータが得られる確率も与えるものではなく,p値がある特定の閾値を下回ったかどうかで結論を導くべきではない。」

2016-03-09 10:18:52
TJO @TJO_datasci

各所の反応を見ているとやっぱり皆さん「p値が推奨されないなら他の何を使えば良いのか」というところに関心がおありのようで。それともそういう話を別に書いた方がいいんでしょうか tjo.hatenablog.com/entry/2016/03/…

2016-03-09 11:50:27
TJO @TJO_datasci

@johnsmisu 「母比率の検定」各種におけるサンプルサイズ決定の議論ですね。ひとまずこの辺のサイトをご覧になった上で、足りなければ各種文献を当たられてみてはいかがでしょうか。 weblio.jp/content/%E6%AF…

2016-03-09 13:00:12
TJO @TJO_datasci

「統計学的検定+p値」の組み合わせからの脱却が叫ばれているわけだけど、なら例えば「(一般化)線形モデル+パラメータ推定+p値」が良いかというとどうだろう。文中にも書いたけどベイジアンもしくは「機械学習+交差検証」は一つの方向性かなと tjo.hatenablog.com/entry/2016/03/…

2016-03-09 14:20:09
⅃ЯAƎ⊿せかんどらいふすたあと @DrMagicianEARL

EARLの医学ノート更新『【統計】p<0.05時代はついに終焉か?米国統計学学会による声明』 drmagician.exblog.jp/24205093/ p<0.05による弊害には同意,じゃあp<0.05主義から脱却した後はどうするのか?は課題が多いです。ガイドライン等は混乱するでしょうね

2016-03-09 18:14:17
⅃ЯAƎ⊿せかんどらいふすたあと @DrMagicianEARL

承前)ちなみに,じゃあp値から脱却したら代わりに何で判断したらいいの?って話なんだけど,米国統計学会では新たなアプローチの例として,予測値を重視するアプローチ,ベイジアンモデリング,決定理論的アプローチ,false discovery rateを・・・って専門的すぎて全然分からん

2016-03-09 18:25:28
⅃ЯAƎ⊿せかんどらいふすたあと @DrMagicianEARL

承前)そういやP値のカットオフ値を変えるBonferoni補正やTukey使ってる論文はあまり見ないな。

2016-03-09 18:47:45
⅃ЯAƎ⊿せかんどらいふすたあと @DrMagicianEARL

P値がその研究において何を示すかって定義は知ってても感覚はつかみにくい。

2016-03-09 18:55:32
TJO @TJO_datasci

業界ごとに事情が異なるので軽々しくは言いにくいんだけど、頻度主義的統計モデリングでもベイジアンモデリングでも機械学習でも何でもいいのでとにかく説明変数で目的変数を表現できるモデルを作り、その性能を交差検証で評価した上で採用し、そこから知見を得る、というのが迂遠だけど確実な方法かも

2016-03-09 18:57:46
TJO @TJO_datasci

例えばこの記事の追記2でやったみたいに、カイ二乗検定の問題設定を階層ベイズの枠組みに変換して、パラメータの事後分布を求めるという形で答えるという考え方もあるわけで tjo.hatenablog.com/entry/2016/02/…

2016-03-09 19:05:13
TJO @TJO_datasci

つまるところ「統計学的手法(別に機械学習でも何でもいいけど)の手数が少ないほどこの手の『ルール変更』があると詰みやすい」ってことなのかなと思う次第 tjo.hatenablog.com/entry/2016/03/…

2016-03-09 19:07:54
TJO @TJO_datasci

「p値が統計学的妥当性を示す絶対的な尺度ではなくなる」ぐらいでしょうね。僕も往年のp-value hackerとしてはそこへの拘りを捨て去るわけではないので

2016-03-09 19:18:12
TJO @TJO_datasci

通常のやり方では検定統計量が定義できないand/or通常の検定だとどういじくっても有意にならないという理由で奇妙奇天烈なブートストラップ検定のオレオレ枠組みを作ってp<0.05だよねと言い張って論文を通した邪悪な心の持ち主は名乗り出なさい

2016-03-09 19:23:13
TJO @TJO_datasci

アホらしいなぁと思いつつ普通のt検定やカイ二乗検定の問題をStanでMCMCサンプリングしたらちゃんと良い結果になった笑

2016-03-09 21:52:55
TJO @TJO_datasci

とりあえずt検定とカイ二乗検定を頑張ってStanでベイジアンモデリングして代替するというテーマでまとめてみた。明日夕方ブログ記事にして公開します

2016-03-09 23:57:36
TJO @TJO_datasci

でも言わせて欲しい。t検定やらカイ二乗検定やらをベイジアンモデルにしてMCMCでサンプリングするのは完全にただのオーバーキルである、と

2016-03-10 00:00:34
TJO @TJO_datasci

ブログ更新しました。ASA声明ネタの続き / p値を計算したくなる検定の数々を試しにStanによるベイジアンモデリングで代替してみた - 東京で働くデータサイエンティストのブログ tjo.hatenablog.com/entry/2016/03/…

2016-03-10 19:08:33
リンク http://tjo.hatenablog.com/ p値を計算したくなる検定の数々を試しにStanによるベイジアンモデリングで代替してみた - 東京で働くデータサイエンティストのブログ この記事は、やたらはてブを稼いでしまった前回の記事の続きです。ASAのプレスリリース及び声明の中には、確かに「p値に依拠しない新たなアプローチの例」として予測値を重視するアプローチ*5、ベイジアンモデリング、決定理論的アプローチ*6およびfalse discovery rate*7といったものを用いるべき、という趣旨のコメントが入っています。とは言え、重回帰分析とか機械学習のような多変量モデリング(なおかつサンプルサイズも大きい)を伴うテーマならともかく、統計学的仮説検定のようなサンプルサイズも小さい(デ