決定係数について

2
Shohei @shohei_07

R^2が0.1で係数もほとんど有意じゃないんだけど、こういうのってどこまで信頼できるの?>The effects of the garment industry on girls’ schooling|Development Impact http://t.co/igJaDDot

2011-12-13 00:32:44
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 クロスセクションやパネルならR^2が0.1以下というのはざらなのでそれ自体を気にする必要はないことが多いのでは。係数値の有意性や標準誤差はいろんな意見があるんだと思いますが、ある程度見る必要あるかと。RT R^2が0.1で係数もほとんど有意じゃないんだけど、

2011-12-13 02:32:37
Shohei @shohei_07

@dojin_tw たとえ経済学でざらだとしても、1割程度しか説明してないモデルが現実の政策決定に際してどれだけ役立つのでしょうか?

2011-12-13 02:40:07
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 マクロの時系列モデルなどで予測を重視する場合にはR二乗値の大きさを重視することはあると思いますが、そもそもデータのばらつきが大きいミクロデータなどでR二乗値にこだわる必要はそんなにない、ということだと思います。一番重要なのは関心ある推定値の一致性ですし。

2011-12-13 02:45:39
Shohei @shohei_07

@dojin_tw ふーむ、では決定係数が0.1しかないモデルによって有意に推定された係数でも信頼できるということですか?

2011-12-13 02:50:30
Akio Ino @inoakio

@shohei_07 推定まで出来ているということは、被説明変数に変動をもたらす要因は他にもあるだろうけど政策変数とは無相関であるということで、政策の影響はこのモデルで全て説明できている・・・というのはいかがでしょう?

2011-12-13 02:49:19
Akio Ino @inoakio

@shohei_07 現実にはそんなに綺麗に相関を切れているわけではないと思うのであくまでも理想的な状況を考えてみたにすぎませんが。

2011-12-13 02:50:37
Shohei @shohei_07

@inoakio なるほど。そうするとその「無相関」についてどれだけ説得力ある説明ができるかにかかっていますね。

2011-12-13 02:52:19
Akio Ino @inoakio

@shohei_07 ですね。あとはいかにうまく自分の操作変数が操作変数たりえているかを説明するかが研究者の力量ってことでしょうか。

2011-12-13 02:55:30
Shohei @shohei_07

@inoakio でも決定係数が0.1しかない場合にどれだけそれを説明できるのかがやっぱりよく分からないです…

2011-12-13 02:57:34
Akio Ino @inoakio

@shohei_07 さんの指摘は最もなものだと思いますが、基本的に係数の推定がうまくいっているかどうかは有意性・誤差項との相関・係数の大きさで測られるべきで誤差項との相関がないことをきちんと説明できているのであればR^2が小さくても問題ないのではないか、という立場です。

2011-12-13 03:17:17
Shohei @shohei_07

@inoakio なるほど、ありがとうございます。

2011-12-13 03:35:42
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07:決定係数と係数値の一致性や有意性は(とりあえず)別ものだと思います。クロスやパネルで決定係数にこだわるのはミスレィーディングなことが多いです。例えばランダム化実験でダミー使って単回帰で推定値だして決定係数がクソ小さくても(とりあえず)問題ないということです。

2011-12-13 02:58:23
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 もちろん決定係数が無意味ということではありません。決定係数が高いと標準誤差が小さくなるので。厳密なところはうろ覚えなので、なにかいい解説文献がネットに転がってないか探して見ますね。。。。しばしおまちを。

2011-12-13 03:01:26
Shohei @shohei_07

@dojin_tw ランダム化実験なら誤差項が説明変数と相関していないと想定できるからですよね?ただそれ以外で決定係数があまりに低い場合は、相関している要素をモデルに取り込めていない可能性が高いのでは?というのが自分が思ったことです。

2011-12-13 03:03:28
Shohei @shohei_07

@dojin_tw 「可能性が高い」でなく「可能性が高くなる」でした。

2011-12-13 03:07:55
Shohei @shohei_07

たしかに決定係数が重要というなら、社会科学は自然科学者からみたらありえんということになるわな。

2011-12-13 03:05:27
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 「決定係数が小さすぎる⇒欠落変数バイアスがある可能性が高いのではないか」というのがあり得るはおっしゃるとおりだと思います。ただし「決定係数があまりに低いので欠落変数バイアスあり」をばらつきが大きいミクロデータ等でシステマチックに判断することは難しいかと。

2011-12-13 03:12:15
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 ちなみにマクロもミクロもあてはまりのよさはR二乗値ではなくAICやBICを使ったりするでしょうが。このへん授業レベルの知識しかありませんがRT "@dojin_tw:  マクロの時系列モデルなどで予測を重視する場合にはR二乗値の大きさを重視することはあると思

2011-12-13 03:24:20
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 ちなみに手元のStcock&Watsonの定評ある計量経済学入門本(第二版)のコラムで、決定係数はdo NOT tell you whether:1.an included variable is statistically significant,

2011-12-13 03:27:42
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 2.The regresors are a true cause of the movements in the dependent variable, 3.There is omitted variabls, or

2011-12-13 03:28:28
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 4.You have chosen the most appropriate set of regressors と書かれています。

2011-12-13 03:29:19
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 本文のほうでも、「欠落変数バイアスは、低いR^2でも、真ん中くらいのR^2でも、高いR^2でも起こりうる。言い換えると、低いR^2は、欠落変数バイアスがあることを必ずしも含意しない」と書いてあります。続

2011-12-13 03:32:48
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 決定係数は、被説明変数が同一のモデルの「あてはまり」のよさを比較したり、(最もらしい)コントロール変数を追加したときにどの程度この「あてはまり」が改善するのかをチェックするのには使えても、単純に0.9だと良くて0.1だと悪い、みたいな比較はできないと思います

2011-12-13 03:36:51
安藤道人 (Michihito Ando) @michihito_ando

@shohei_07 3.There is omitted variabls bias でした。でも「低いR^2は"必ずしも"欠落変数バイアスがあることを含意しない」なので自然/社会実験を伴わない単純OLSであまりに低いR^2のときに、そもそもモデルどうなんって疑うのはありかと。

2011-12-13 03:43:33