度数分布作ってみた。平均すると31500コイン。最安だと4500、最高だと135000。 #imas_cg #コンプガチャシミュレーター http://t.co/c4ZIK0DK http://t.co/yNvCauBW
2012-02-11 21:02:11確率変更後の度数分布を作ってみた。ピークが結構右にずれた感。平均がそんなに変わらなかったのは超課金の方が少なかったためかと。 #imas_cg #コンプガチャシミュレーター http://t.co/V15jP4rJ
2012-02-12 00:47:39度数分布2回目。だんだん山が見えてきました。 #imas_cg #コンプガチャシミュレーター http://t.co/upOsyDl5
2012-02-12 10:17:57そうそう。これで思い出したけど、統計って「まとめる統計」と「予測する統計」の2種類があるのよね。この区別が出来ない人は多い。
2012-02-12 10:36:39例えば昨日から今日に掛けてやってる統計だけど、これは結果のまとめとしての統計。自分が前からやってる創想話の統計もこれね。山のようにデータがあって、それだけだと数が多すぎて何なのか分からないって時の物。やってる事が近いのは「~白書」みたいな年次報告の類。
2012-02-12 10:39:13じゃあ「予測する統計」ってのは何かっていうと、こうやって出たデータが理論上はどういう分布にあるのか、とか少ないデータからさっき見たいな山のある分布を予測するとかする物。理系の人がする統計ってのはこっち。実は測定機械の誤差とかもこっち。
2012-02-12 10:41:51理系の人が統計使う場面って、結果の数は無限大(次に同じ事しても同じ事になる)だからね。それを何個かピックアップして「本当の値」を予測するのが理系の実験に使われる統計。
2012-02-12 10:44:50せっかく例があるんだから実際にやってみよう。さっきのモバマスシミュレーター、実は途中で確率が変更になってて。自分は改定前と後のデータを10個くらい持ってる。じゃあ、確率が変わったら実際に結果は変わったのか?これを予測するのがさっきで言う後者の「予測する統計」
2012-02-12 10:55:03細かーい計算は省くけど、統計を出すと12%版だと平均26700、15%版だと18833になる。パッと見差が出てそうだけど、これだけだと情報不十分。偶然低い方に寄っただけかもしれないし、超課金となった場合が平均を吊りあげたのかもしれない。
2012-02-12 10:58:47で、じゃあお手上げで、さっきみたいに数時間待ってデータが揃うまで待つしかないのか?そもそもシミュは現在も続いてる訳だから数字は一定しない。GiGiさんがサービス終了させるまで真相は闇の中か……。なんて事をやってたら日が暮れてしまう訳で。
2012-02-12 11:03:05標準偏差は偏差値で使われるからお馴染みと思うけど、データのバラつき具合。標準誤差はそれを抜き出して予測する時に応用するためにちょっと式を調整した物。
2012-02-12 11:06:38実際にエクセルにぶち込んで出した物がこちら。色々と大事な数字がたくさんあるけど、今回見るのは一番下。 http://t.co/79EvpIKk
2012-02-12 11:10:20信頼区間というのは「本当の平均値は~の確率で実験で出た平均値±この範囲にあるよ。残りはマグレ」という物。例えばこれだと、15%版の本当の平均値は95%の確率で18833±5192だよということ。
2012-02-12 11:17:46で、これだけだと15%/12%の差が見えてこないという事で、それの差を出す物が存在する。これが理系教養でお馴染みt検定という物。
2012-02-12 11:19:30