【新機能】作り忘れたまとめはありませんか?31日前まで期間指定してまとめが作れる高度な検索ができました。有料APIだからツイートの漏れはありません!

「血液型と性格の無関連性」についての心理学的な解説まとめ(後半) -効果量と妥当性-

みんなにもっと心理学に馴染んでもらえるように,話題になっている「性格と血液型の無関係性」について考えながら,心理学の方法論について連続ツイートしたものをまとめたよ。統計学における第一種の過誤と第二種の過誤について解説した前半に引き続き,物議をかもしたFacebook実験を例に上げて効果量について解説したのち,縄田 (2014) の主張とその問題点を指摘したよ。 グレーで書かれている部分は脱線や補足なので読み飛ばしても大丈夫だよ! 前半:http://togetter.com/li/695159
心理学 統計学 学術たん 基礎心理学くん 血液型 性格
kisopsy_kun 12061view 21コメント
26
ログインして広告を非表示にする
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:01:26
    …さて,そろそろ「血液型と性格の無関連性」についての連続ツイートを始めようかな。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:04:01
    昨日は予備知識として,心理学で用いられる「有意性検定」という統計手法の限界について説明したよ。詳しくはTogetterにまとめたのでURLを参考にしてね。今日は,昨日の話の要点を簡単にまとめてから,もう少し具体的な話に入っていくよ。togetter.com/li/695159
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:04:49
    では,「血液型と性格の無関連性」について,心理学の方法論を通して説明するよ。元の縄田先生の論文「血液型と性格の無関連性――日本と米国の大規模社会調査を用いた実証的論拠――」は,こちらからpdfで読めるよ。twitter.com/jssp_pr/status…
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:05:39
    まずは昨日の話の結論を要約するね。(1) 有意性検定では,「差がない」ということを積極的に示すことはできない。…これは,サンプルサイズを大きくするなどして検出力を上げれば,有意差が認められる可能性が常にあるから。「第二種の過誤」と言ったね。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:11:01
    (2) 有意性検定で「差がある」ということが示せたとしても,本当のところは差なんて無い,という可能性がある。たまたま起こりにくいことが起こっただけで,という偶然の結果である可能性だね。これを「第一種の過誤」と言った。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:13:13
    この二点,すなわち「第一種の過誤」「第二種の過誤」について,昨日は男女の平均身長を例に紹介したよ。それに加えて,三つ目の武器である効果量 (effect size) について説明しておこう。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:15:54
    例えば,「男女間での平均視力の差」について有意性検定をしても有意差が認められないから,どんどんサンプルサイズを増やしていった。100人ではダメだったから1000人にした。1000人でもダメだったから…と増やしていき,100万人にまで増やしたら,ようやく有意差が認められた,とする。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:19:27
    (これはあくまでも例なので,本当に男女間で平均視力に差があるのかどうかは知らないけど,身長と比べたら,直観的には差がなさそうに感じられるね。加齢による視力の変化とかにはなんとなく差がありそうな気もするので,20代の日本人,ぐらいで考えよう。差が無さそうならどんな例でも良かった。)
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:19:45
    (どうやって視力を測定したか,とか,ジェンダー論的に男女という二分法はどうなの,とか,そういうことはあまり気にしないことにします。)
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:20:15
    さて,このとき,「男女間では視力に違いがある」と結論づけて良いか?例えば,平均値で見たときに女性のほうが男性よりも0.000000001だけ視力が高かったから,女性は男性よりも視力が良いのだ,ということを,有意性検定の結果から主張できるのか?
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:23:04
    (視力の単位に関しては,テキトーに補ってください。ここでは0.000000001という値を「直観的にとても小さい差」という意味で使っています。単位によっては大きい値かもしれませんが,あくまでもここでは直観的に分かりやすいことを目指すので,本質的でない細かい部分には目を瞑ります。)
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:23:27
    まず最初に考えられるのは,昨日の復習だけど,「第一種の過誤に陥っている」とういう可能性だね。有意水準 (確率がこれよりも低ければ偶然だろう,とみなす基準) を5%としたのであれば,「偶然5%を引いてしまったために,本来は差が無いのに有意であると判断された」という可能性だ。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:26:23
    そこでもう一つ,別の見方をしてみよう。「確かに有意差があることが分かった。だが,0.000000001という差に果たしてどんな意味があるのか?この差は大きいといえるのか?」と。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:32:37
    一般に,サンプルサイズを増やせばp値は小さくなりやすい。つまり,p値はサンプルサイズに依存した指標といえる。したがって,p値をいくら調べても「差の大きさ」を純粋に評価することはできない。そこで「差の大きさ」を評価する別の指標が必要になる。これが効果量(effect size)だ。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:34:40
    0.000000001という平均視力の差の値を直接指標として使えばいいんじゃないの?って思う人もいるかもしれないけど,この値はあくまでも測定値に基づいた差であって,測定単位に依存するから客観的な指標にはならない。長さの例が分かりやすいかも。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:36:20
    例えば,1kmと1000000mmは同じ長さだから,「1kmは小さくて,1000000mmは大きい」と判断してはまずいでしょ?そこで,測定単位に左右されない客観的な指標として効果量が必要になるんだ。効果量にもd,η,偏η二乗など種類があるけど,ここではあまり気にしなくていいよ。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:37:51
    効果量は,サンプルサイズにも測定単位にも依存しない「差の大きさ」 (より一般には「効果の大きさ」) の指標だから,この値で大きさを評価しよう。視力の例で,dという効果量の指標が0.001だったとしよう。このdについての慣例的な基準は次の通りだ。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:41:45
    mizumot.com/method/mizumot…によると,d = 0.2(効果量小),d = 0.5(効果量中),d = 0.8(効果量大)という基準がよく使われている。この基準で考えると,今回の d = 0.001という値は,効果量小の0.2を大きく下回っている。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:43:25
    …ということは,「男女間で視力の平均値に差がある」と言えたとしても,その差はごくごく僅かなもので,ほとんど無視しても良さそうなレベルの差に過ぎない,と判断して良さそうだ。これが,効果量の考え方だよ。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:46:18
    (僅かな差であれ本当にその差は存在するのか?と思う人もいるかもしれないけど,それには色々な原因が考えられる。例えば,統計学では多くの場合,データが正規分布と呼ばれる分布に従っていることを仮定するんだけど,実際にはぴったり正規分布に従っているケースはほとんどないだろう。)
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:46:31
    (他にもたくさんの仮定に基づいて統計的検定は行われるので,そういった仮定がデータと一致しないときには検定の結果に歪みが生じる可能性がある。ごくごく僅かな差は,そういった歪みの結果として生じたものなのかもしれないし,本当に差があるのかもしれない。それは何ともいえない。)
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:46:49
    効果量についての例として,以前倫理的な問題で話題になった,フェイスブックのニュースフィールドを操作した研究の論文を読んでみよう。pdfはこちら。pnas.org/content/early/…
  • ※これ以降「ニュースフィールド」と連呼していますが「ニュースフィード (News Feed)」の間違いです。訂正します。

  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:47:48
    この論文では2ページ目で「ニュースフィールドを操作してポジティブな単語を減らされた人は,減らされなかった人に比べて,ネガティブな単語を使う割合が0.04%増えた」という結果が報告されている。検定結果は「t = 2.71, p = 0.007, d = 0.001」だった。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-20 20:50:32
    p = 0.007」すなわち「p値は0.7%」という結果から,とりあえず5%という慣例的な有意水準は下回っていることが分かるので,「有意差」は認められたと言えるだろう。ところが,その後に書いてある効果量の指標であるdは,0.001と,d = 0.2(効果量小)よりかなり小さい。
残りを読む(78)

コメント

  • ひろ@猫もふ欠乏症 @hiro_h 2014-07-21 15:49:09
    実はココが結構引っ掛かり続けている>選好パラメータアンケート調査によって測定されたものが性格の指標として使えると仮定したときに いつか機会があれば、そこまで踏み込んでみたい。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-21 22:17:20
    まとめを更新しました(補足を追加しました)。
  • きそしんくん@bot内容整理中 @kisopsy_kun 2014-07-21 22:20:43
    hiro_h 筆者いわく,これだけ大規模な調査なら性格の情報も拾えるだろう,とのことだけど,じゃあ「中程度のサンプルサイズで妥当性の高い測度を使う」のと「大サンプルで妥当性の低い測度を使う」のではどちらが信用できるか?という話でもあるね。もともとこの調査が別の目的で行われたもので,二次的に血液型の効果を見たに過ぎないという意味では仕方がないのかもね…。血液型のためだけにこれほど大規模の調査をするのは難しいだろうね。
  • Ishida Brain Dam'd @tbs_i 2014-07-22 15:08:38
    変数変換は、結果の解釈がしにくくなると言うデメリットがあると言われるね。例えば推定されたパラメータは、何かしらの変換かけないと実データとの比較ができないし、その変換の正当性の問題も出てくる。あと今思いついたのは、効果量って変数変換に対してどれくらいロバストなんのかも気になる。
  • ABO FAN @ABOFAN 2016-01-31 08:41:24
    基礎心理学くん@受験生応援さんは、統計は大丈夫なんでしょうか? 不安になってきました。遅まきながら気が付いた点をいくつか…。
  • ABO FAN @ABOFAN 2016-01-31 08:42:24
    縄田氏の論文中の参考文献にありますが、坂元章氏は3万人のデータ(縄田氏は1万人)で有意差を示し、山岡重行氏も2000年代の6,660人のデータで有意差を示しています。
  • ABO FAN @ABOFAN 2016-01-31 08:42:44
    20問のクイズで15問正解した場合は、普通は「2項分布」で計算すると思うんですか? ポアソン分布だとすると正解数の「上限」が決まらない…。
  • ABO FAN @ABOFAN 2016-01-31 08:43:27
    縄田氏のQ19は、日米ともに効果量小(d=0.2)、アメリカ人のQ2も効果量小(d=0.2)です。少数派のAB型の差が目立つので、η2(サンプル全体で計算)は見かけ上小さく出ます。
  • ABO FAN @ABOFAN 2016-01-31 08:44:13
    有意水準を5%と考えた場合に,68項目中3項目で「差が無いのに有意」となる確率は66.7%ではありません! 検定力を計算してみてください。失礼ながら、本当に大丈夫ですか?
  • ABO FAN @ABOFAN 2016-01-31 08:47:36
    補足です。68項目中3項目で「差が無いのに有意」となる確率が66.7%でOKなら、多重比較(ボンフェローニの補正etc.)は不要ということですか?
  • Dcdcxr @Dcdcxr 2016-01-31 09:20:45
    血液型と性格なんて関連ないってのは誰でも知ってる話だけど、まぁちゃんと学術的に否定する事も必要だね。
  • gryphon(まとめ用RT多) @gryphonjapan 2016-01-31 09:42:38
    かなり前のまとめだが、偶然見た。わかりやすいし重要なのに、はてブも閲覧数もそれに見合った数ではない。要は読め。
  • gryphon(まとめ用RT多) @gryphonjapan 2016-01-31 09:42:57
    かなり前のまとめだが、偶然見た。読むべし。
  • ABO FAN @ABOFAN 2016-02-06 18:23:16
    科学的には「血液型と性格に関係がない」とは言えません。「悪魔の証明」ですからアウトです。せいぜい「関係があるとは認められない」ですよ。
  • ABO FAN @ABOFAN 2016-02-06 18:28:08
    統計的には「血液型と性格に関係がある」ことは明らかです。縄田氏のこの論文にも、「3万人」のデータで関係があるという坂元章氏の論文が紹介されていますよ。多くの心理学が知っている事実ですが、なぜか無視されています。
  • recyclebin5385 @recyclebin5385 2016-04-16 14:48:55
    (お?場外乱闘か?)どの論文か知らんが坂本章でぐぐったら「血液型と性格は関係あるで!でもそれは自己成就現象やで!」って言ってる人か。その人の研究で有意差が出たという事実でもって血液型と性格に関係あることが明らかになるという悪魔の論理
  • ABO FAN @ABOFAN 2016-05-01 00:59:59
    ここでの問題は,当然ながら,「果たして本当に性格と血液型との間に関係はあるのか」ということだね(by 基礎心理学くん@受験生応援)。縄田氏の論文中の参考文献にありますが、坂元章氏は3万人のデータ(縄田氏は1万人)で有意差を示し、山岡重行氏も2000年代の6,660人のデータで有意差を示しています。
  • ABO FAN @ABOFAN 2016-05-01 01:04:59
    坂元章氏のように、「血液型と性格は関係あるで!でもそれは自己成就現象やで!」というのがOKなら、そもそも有意性検定で差がない縄田氏の論文は無意味。なぜなら、仮に差があってたとしても自己成就現象で説明ができるから。ことさら縄田氏の論文を取り上げるのは、「差がないこと」強調したいからだろう。
  • ABO FAN @ABOFAN 2016-05-01 01:10:11
    データに差があってもそれは「自己成就現象」だから、血液型と性格に関係がない。逆にデータに差がなくなら、それこそ血液型と性格は関係がない。データに差があってもなくとも「血液型と性格に関係がない」なら、反証可能性はないので、統計的な解析は全く無意味になりますがいいのでしょうか?

カテゴリーからまとめを探す

「心理」に関連するカテゴリー

ログインして広告を非表示にする
ログインして広告を非表示にする