モバマス・コンプガチャシミュレータで見る統計基礎

あおこめ(@blue_comment)氏の、モバマスを教材にした統計の話のまとめ。
4
あおこめ @blue_comment

実際にやってみる。そぉい! http://t.co/TcYQxZWj

2012-02-12 11:20:12
拡大
あおこめ @blue_comment

gdgdした理論の説明は省略。ググるなり、統計の本見るなりして欲しい。エクセルのt検定だと、注目するのは「P(T<=t) 両側」の部分。これが「2グループの本当の平均値が『実は同じ』である確率」。つまり、違うという事を言いたい時は逆を見なきゃならん訳ですね。

2012-02-12 11:24:17
あおこめ @blue_comment

今回は0.0533という結果なので、良く使われる5%(0.05)より大きい数字となってしまいました。よって、今回の19回シミュ回した結果だけでは差があるという事は理論的には言えません。俗にいう実験失敗。

2012-02-12 11:27:39
あおこめ @blue_comment

これを統計的に言うと「有意水準5%で帰無仮説は棄却できない。よって有意な差は認められない」という事になります。理系分野で見る「有意差」というのはこういう意味。

2012-02-12 11:29:29
あおこめ @blue_comment

「でもさっきの分布見たら目で見て違うじゃない!」というご意見はごもっとも。本当は確実に違う。でも、自分が19回回しただけだとそれは証明できなかったという事。

2012-02-12 11:35:22
あおこめ @blue_comment

これを証明するにはどーするか?一番簡単なのは「取る数を増やす事」。実は、さっきの標準誤差の部分は取ったサンプルの数が増えるとガンガン小さくなる。試しにサンプルを15ずつに増やすとこうなる。これなら0.008なので有意差があると言える http://t.co/Ruuk1l7U

2012-02-12 11:41:01
拡大
あおこめ @blue_comment

以上。t検定の個人的な復習おわり。ドライに移ってから全くだったから良いエクセルのトレーニングになった。

2012-02-12 11:44:20
あおこめ @blue_comment

この「まとめる統計」と「予測する統計」っての、結構大事だなぁ、と書いてて思った。混同すると結構大変な事になるし、わざと混ぜるとかなり悪意ある情報になる。「文系統計」「理系統計」としちゃうとちょっとステレオタイプか。

2012-02-12 11:49:15
あおこめ @blue_comment

「まとめる統計」と「予測する統計」と「使われてる用語の一般的なイメージ」にはかなり差があるからね。例えば、創想話の得点平均は2894±27(標準誤差)だけど、これは創想話の平均値が2900点あたりでほぼ確実というだけで、どの作品も2900点という訳じゃないし。

2012-02-12 11:54:23
あおこめ @blue_comment

さっきの話に戻るけど、サンプル増えると標準誤差は減る。創想話統計、最大値と最小値の差が7万弱あるけど、それでもサンプルが14000位あると誤差が2ケタになる。

2012-02-12 11:56:35