KSP397th「欠測値データ解析の意味と有効性」by狩野裕氏の個人的なまとめ

KSP397th(2013/1/12@四熊)「欠測値データ解析の意味と有効性」by狩野裕氏の個人的なまとめ.その多くをShaw(@tk_shmd)氏のツイートに負うていることを記して感謝します. https://sites.google.com/site/ksp397kano/ から配布資料ダウンロードなどが可能です.
1
oʞɐsɐ ɐɹnıɯ @asarin

【明日開催】KSP397th「欠測値データの解析の意味と有効性」(狩野裕 氏)は阪大豊中キャンパスにて15:30より.とくに調査系の社会科学者必聴かと.演者が心理系研究会で話をするのは久しぶり.もう次はないかも.https://t.co/yy6Vo7bg さあさあ!!!

2013-01-11 07:24:08
oʞɐsɐ ɐɹnıɯ @asarin

KSP397th「欠測値データの解析の意味と有効性」当日配布資料はこちらからダウンロード可能です.https://t.co/yy6Vo7bg

2013-01-13 19:38:52
oʞɐsɐ ɐɹnıɯ @asarin

四熊なう。 で、誰や、タレ込んだんはw http://t.co/zV4SWLX1

2013-01-12 14:44:54
拡大
oʞɐsɐ ɐɹnıɯ @asarin

missing dataのことを欠損値というか欠測値というか.狩野氏は元々欠測としていたが最近は欠損でも(ニュアンス的に)いいかなと思ってるとのこと.個人的には欠測は変換しにくいので欠損がいいですぅ.

2013-01-13 08:10:22
oʞɐsɐ ɐɹnıɯ @asarin

KSP397thはおかげさまで44名の方にご参加いただいております.情報拡散へのご協力ありがとうございます.懇親会参加意向を表明された方20名,懇親会は20名で予約していました.なんという最尤推定!

2013-01-12 16:37:17
Shaw @tk_shmd

#KSP 397th 欠測値データ解析 理論編。現行広く行われているリストワイズ・ペアワイズの削除は妥当ではない。欠損が完全にランダムには起きている(MCAR)とは限らないため。

2013-01-12 16:58:29
oʞɐsɐ ɐɹnıɯ @asarin

つまりunignorableな欠損の場合に何をどうするかってこと.

2013-01-12 16:52:08
Aya M. O @aloha_aya

リストワイズが正義だと思ってた私のバカバカ、ということを学べて大変有意義であった。穴があったら飛び込みたい( ;´Д`)途中で抜けて失礼してしまった。

2013-01-12 18:00:28
Shaw @tk_shmd

#KSP 397th 欠測値データ解析 理論編。実際は、欠損の出現がデータに依存するMAR(例:年収多い個人はアンケートに回答しない)、欠測確率が値に依存するNMAR(例:入試合格者の試験得点)である場合が多い。

2013-01-12 17:01:58
oʞɐsɐ ɐɹnıɯ @asarin

話の内容は今のところ知っている範囲を超えていない.知っているが理解しているとは限らない.典型的MARケース(いわゆる選抜効果)の解析方法のお話.

2013-01-12 16:39:47
Shaw @tk_shmd

#KSP 397th 欠測値データ解析 理論編。MARを仮定すると、完全情報の最尤推定(FIML)で計算可能。完全群と欠測群での多母集団同時分析。パス係数の等値制約だけではなく、平均にも制約を置く。欠測が少ない場合は、リストワイズ・ペアワイズ削除でも可。

2013-01-12 17:13:49
oʞɐsɐ ɐɹnıɯ @asarin

欠測をモデリングすることを何かの指標に使えないかという木下選手の質問.そう,それですよ.こないだ@kaihiraishiさんが教えてくれたやつもその流れに近いんだけどな.欠測があるデータをどう分析するかより,欠測が何を意味しているかを分析する方が面白い.

2013-01-12 16:50:49
Hiraishi Kai @kaihiraishi

「未回答」から認知能力および誠実性を測定する、と。「やられた!」って思いつつ「使える!」って人が多いんじゃないか。QT: Failure to respond as a measure of conscie… http://t.co/6MCAK1CS

2012-12-19 16:48:46
Shaw @tk_shmd

#KSP 397th 欠測値データ解析 実例1は、ネット調査での人物印象評定。全員回答の8変数+88変数か各回答者が4変数を選んで回答(→残り84変数は欠測)。こんな場合でもちゃんと因子分析できるのはスゴイが、こんな形式、実地の社会調査実務ではあまり見ないよな。

2013-01-12 17:29:25
oʞɐsɐ ɐɹnıɯ @asarin

ここからの話はちょっと面白いな.ちゃんと聞こう.

2013-01-12 16:56:20
oʞɐsɐ ɐɹnıɯ @asarin

事例の分析方法には納得できなかったけど,面白かった.

2013-01-12 17:24:05
oʞɐsɐ ɐɹnıɯ @asarin

欠測にはメカニズムがあるはずで,一括してリストワイズ/ペアワイズ削除するのは最悪,という一方であのデータはMARですよっと仮定されるとちょっとどうしたらいいかわかんないというのが正直なところ.

2013-01-12 17:26:51
oʞɐsɐ ɐɹnıɯ @asarin

私がぶつくさ言っていた研究はこれだった.去年のHCS@沖縄で発表されたやつじゃん. http://t.co/zBU2Pb8s

2013-01-12 17:33:51
Shaw @tk_shmd

#KSP 397th 欠測値データ解析 実例2は、身長・体重の相関分析での欠測。自己申告(女性に欠測あり)と健康調査(欠測なしとみなす)との比較。MARを仮定した分析でも相関係数は真値に近づかず。MARではなく、標準体重から遠ざかるほど欠測確率が増えるNMARではないかとの由。

2013-01-12 17:45:40
Shaw @tk_shmd

#KSP 397th 欠測値データ解析 一番聞きたかった、継時データの欠測は時間不足で取り上げられず残念!MARでない継時データでは、欠測メカニズムを組み込んだ分析をすればよいが、方法が難しく「できれば避けたい」とのこと。でも、不可避なんだよなーー。

2013-01-12 17:58:42
oʞɐsɐ ɐɹnıɯ @asarin

宿題。数学/統計教育におけるフレーミングの悪影響を解消する方法について考える。

2013-01-12 23:19:10
oʞɐsɐ ɐɹnıɯ @asarin

きたっくー。何とか面目は保てたと言えようか。

2013-01-12 23:04:25
oʞɐsɐ ɐɹnıɯ @asarin

今朝の夢の中で自分が話していたこと.「私ならそもそも欠測を含めないデータをとる調査をするか,大量データを頼みにLDかPDするか,敢えて「面白い欠測をしそうだ」と予想してそれをモデリングできるようなデータを取るか,どれかです」

2013-01-13 08:25:03
Shaw @tk_shmd

#KSP 397th 欠測値データ解析(感想)社会調査実務では、無回答や欠損値(私は欠測ではなく欠損だと思っている)は不可避。近年重みが増す郵送調査ではなおさら。今までは安直にリストワイズ、ペアワイズで削除していたが、欠損データを活かす方法があるのは有意義。

2013-01-13 08:44:10
Shaw @tk_shmd

#KSP 397th 欠測値データ解析(感想)MARならAMOSの多母集団同時分析で対処できそうだが、実際にはNMARが多く、その対処はエンドユーザにはまだ難しそう。演者のスライドにもあったが、エンドユーザの意識も決して高くない(査読で突っ込まれなければそれで良い)

2013-01-13 08:48:57