承前)「p値はそのデータが特定の統計モデルとどの程度適合しないかを示すもので,その仮説が真である確率を与えないしランダムな偶然からそのデータが得られる確率も与えるものではなく,p値がある特定の閾値を下回ったかどうかで結論を導くべきではない。」
2016-03-09 10:18:52各所の反応を見ているとやっぱり皆さん「p値が推奨されないなら他の何を使えば良いのか」というところに関心がおありのようで。それともそういう話を別に書いた方がいいんでしょうか tjo.hatenablog.com/entry/2016/03/…
2016-03-09 11:50:27@johnsmisu 「母比率の検定」各種におけるサンプルサイズ決定の議論ですね。ひとまずこの辺のサイトをご覧になった上で、足りなければ各種文献を当たられてみてはいかがでしょうか。 weblio.jp/content/%E6%AF…
2016-03-09 13:00:12「統計学的検定+p値」の組み合わせからの脱却が叫ばれているわけだけど、なら例えば「(一般化)線形モデル+パラメータ推定+p値」が良いかというとどうだろう。文中にも書いたけどベイジアンもしくは「機械学習+交差検証」は一つの方向性かなと tjo.hatenablog.com/entry/2016/03/…
2016-03-09 14:20:09EARLの医学ノート更新『【統計】p<0.05時代はついに終焉か?米国統計学学会による声明』 drmagician.exblog.jp/24205093/ p<0.05による弊害には同意,じゃあp<0.05主義から脱却した後はどうするのか?は課題が多いです。ガイドライン等は混乱するでしょうね
2016-03-09 18:14:17承前)ちなみに,じゃあp値から脱却したら代わりに何で判断したらいいの?って話なんだけど,米国統計学会では新たなアプローチの例として,予測値を重視するアプローチ,ベイジアンモデリング,決定理論的アプローチ,false discovery rateを・・・って専門的すぎて全然分からん
2016-03-09 18:25:28承前)そういやP値のカットオフ値を変えるBonferoni補正やTukey使ってる論文はあまり見ないな。
2016-03-09 18:47:45業界ごとに事情が異なるので軽々しくは言いにくいんだけど、頻度主義的統計モデリングでもベイジアンモデリングでも機械学習でも何でもいいのでとにかく説明変数で目的変数を表現できるモデルを作り、その性能を交差検証で評価した上で採用し、そこから知見を得る、というのが迂遠だけど確実な方法かも
2016-03-09 18:57:46例えばこの記事の追記2でやったみたいに、カイ二乗検定の問題設定を階層ベイズの枠組みに変換して、パラメータの事後分布を求めるという形で答えるという考え方もあるわけで tjo.hatenablog.com/entry/2016/02/…
2016-03-09 19:05:13つまるところ「統計学的手法(別に機械学習でも何でもいいけど)の手数が少ないほどこの手の『ルール変更』があると詰みやすい」ってことなのかなと思う次第 tjo.hatenablog.com/entry/2016/03/…
2016-03-09 19:07:54「p値が統計学的妥当性を示す絶対的な尺度ではなくなる」ぐらいでしょうね。僕も往年のp-value hackerとしてはそこへの拘りを捨て去るわけではないので
2016-03-09 19:18:12通常のやり方では検定統計量が定義できないand/or通常の検定だとどういじくっても有意にならないという理由で奇妙奇天烈なブートストラップ検定のオレオレ枠組みを作ってp<0.05だよねと言い張って論文を通した邪悪な心の持ち主は名乗り出なさい
2016-03-09 19:23:13とりあえずt検定とカイ二乗検定を頑張ってStanでベイジアンモデリングして代替するというテーマでまとめてみた。明日夕方ブログ記事にして公開します
2016-03-09 23:57:36でも言わせて欲しい。t検定やらカイ二乗検定やらをベイジアンモデルにしてMCMCでサンプリングするのは完全にただのオーバーキルである、と
2016-03-10 00:00:34ブログ更新しました。ASA声明ネタの続き / p値を計算したくなる検定の数々を試しにStanによるベイジアンモデリングで代替してみた - 東京で働くデータサイエンティストのブログ tjo.hatenablog.com/entry/2016/03/…
2016-03-10 19:08:33