「血液型と性格の無関連性」についての心理学的な解説まとめ(前半) -第一種の過誤と第二種の過誤-
- kisopsy_kun
- 19686
- 260
- 4
- 3
さっきの35.3%というp値だけど… 慣例的には,あくまでも慣例的には,これが5%未満であるときに「滅多に起こらないことである」とみなすことになっているよ。あくまでも慣例的には(大事なことなので三回言いました)。
2014-07-19 23:49:07…と,いうことは,35.3%は十分起こり得ること。つまり,「男女間で平均身長に差がない」と考えても,おかしくはない,ということ。したがって,「男女間で平均身長に差がない」のである。…この推論は正しいと思う?事実として,男性の平均身長は女性の平均身長よりも高いはず。
2014-07-19 23:50:40ひょっとしたら,男女が二人ずつしかいない,ということが問題だったのかもしれない。そこで,新たに180cm,165cm,177cmの男性と,169cm,153cm,152cmの女性のデータを加えてみよう。平均身長は男性171.6cm,女性159.6cmになった。
2014-07-19 23:56:00結果はt = -2.6174, df = 8, p-value = 0.03078で,p値は約3%。つまり5%未満。よって,帰無仮説は棄却される。プログラムは次のような感じ。 pic.twitter.com/x8dZxSsLei
2014-07-19 23:57:46つまり,男女2人ずつのときは「男女間で平均身長に差がない」ことが否定できなかったけど,男女5人ずつに増やしたら,「男女間で平均身長に差がない」ことが否定できて「男女間に身長差が『ある』」という対立仮説を支持することができた。結局,身長差はあるの?ないの?
2014-07-19 23:59:50さっき僕は「身長差がない」という対立仮説のことを「主張したい」仮説だと呼んだ。裏を返せば,「身長差がない」という帰無仮説は,特に主張したいものではない。帰無仮説が棄却されたときには対立仮説(主張したいこと)は支持されるが,帰無仮説が棄却されないときについては,なんともいえない。
2014-07-20 00:04:24(訂正)帰無仮説が棄却できなかった (採択された) のにもかかわらず,実際には対立仮説のほうが正しかった,というのが,男女二人ずつのケースだったね。このような誤りを「第二種の過誤 (type II error) というよ。
2014-07-20 00:33:55第二種の過誤に陥る原因のひとつとして,二群の平均身長の間にある意味のある差 (有意差) を検出するための検出力 (power) が不足している,というものが考えられるよ。今回の例からも分かるように,データの数 (=サンプルサイズ) を増やすことで,検出力を上げることができるんだ。
2014-07-20 00:11:02すなわち,有意性検定では「有意差がある」ということは積極的に示せても,「有意差がない」ということは強く主張できない。だって,サンプルサイズを増やせば有意になるかもしれないでしょ?これが,血液型と性格が無関係であることをはっきり示すのが「不可能」である訳なんだ。
2014-07-20 00:15:03…一般に,「有意差が無かった」と報告している全ての研究に対して,「サンプルサイズを増やせば有意差が認められるのではないか」と反論することができる。これは結構,大事なことかも。ただし,たとえ有意差があっても,その差がごく僅かだったとしたら,果たして意味があると言って良いのだろうか…
2014-07-20 00:17:17そういうことを議論しようと思うと,今度は効果量 (effect size) という概念が出てくるんだけど,その話は次回に回すとして,最後に第一種の過誤の話をしよう。
2014-07-20 00:17:56男女間で平均身長に差が有意性検定から分かった。めでたしめでたし。…本当にそうかな?帰無仮説を仮定したら,5%未満の確率でしか起こらないことが起きた!こんなことあり得ない!だから帰無仮説は間違ってるんだ!って話だけど,5%て本当に起こりにくいことなのかな?
2014-07-20 00:22:30二群の間で明らかに有意差が出なさそうな変数について何度もt検定をしたら,単純計算では,100回に5回は「有意差」が検出されてしまうことになる。…これを第一種の過誤 (type I error) といって,有意差が検出されたからといって,本当に差があるとも限らないんだ。
2014-07-20 00:27:11(「二群の間で明らかに有意差が出なさそうな変数」の例を考えていたけれど,これがなかなか難しいんだよねえ… 「旅行が好きな人とそうでない人との間では視力に差がある」とか,もしかしたら本当にあるかもしれないし…)
2014-07-20 00:28:32この,第一種の過誤と第二種の過誤の問題は,血液型と性格の関連性 (または無関連性) を検討する上で,とても大切な概念になってくる。そういう訳で,今日はここまでにして,明日以降,いよいよ血液型と性格の話に踏み込んでいくつもりだよ。
2014-07-20 00:30:35@ELSI_bot おー!それは面白い覚え方だね♪頭では分かっているつもりでも,書くときに混乱しちゃうことがあるから,あわてずにぼんやり考え直す癖をつけるよ!
2014-07-20 00:35:13とりあえず,今日の話は以上だよ。即興で書いたので,予定していたよりかなり時間がかかってしまった(二時間も!)上に一番の本題に入れなかったし,いくつかミスもしてしまったよ… 今日は血液型と性格について考えるための武器を用意したので,また明日ぐらいに続きを話すよ!
2014-07-20 00:38:14話が難しかったかもしれないけれど,分からないことがあればなんでも気軽に質問してね!今日話したことは,統計学の基本的なテキストにもたぶん書かれているはずだから,興味があったら自分でも勉強してみてね!
2014-07-20 00:39:47ここまでご清聴,ありがとうございました!初めての連続ツイート(しかも即興)となってしまいましたが,いかがでしたか?話の内容や進め方などに不満・要望・質問などがあればなんでも教えてね♪
2014-07-20 00:43:17