好評発売中の岩波データサイエンス(DS)3巻のibaibabaibaiさんによるコラムの宣伝

岩波データサイエンスのページ(岩波書店) https://www.iwanami.co.jp/.BOOKS/02/8/029851+.html サポートページ(刊行委員会) https://sites.google.com/site/iwanamidatascience/ 刊行委員会twitter 続きを読む
1
baibai @ibaibabaibai

というわけで,岩波DS3の自分の書いたコラムの宣伝します.

2016-06-20 23:40:09
baibai @ibaibabaibai

3つのうち最初は,トップの立森さんの直後に入っている「時系列の因果と相関」です.

2016-06-20 23:41:22
baibai @ibaibabaibai

実は時系列の因果と相関についてはまとまった解説を専門家にお願いする直前まで行ったのですが,目当ての方がご多忙で断られてしまいました.しかし時系列の話が全くないというのは初心者向きとしてどうかというのがあり,余ったページを利用してコラムを挿入させて頂いた訳です.

2016-06-20 23:44:18
baibai @ibaibabaibai

そういう意味では,内容は普通なのですが,苦心したのは与えられた2ページを最大限に利用するということです.理解して頂いた方がいて嬉しいのですが,こういう説明だと「単に難しい」ということになりがちなのをぎりぎり手法の名前と文献まで入れたところに特徴があります.

2016-06-20 23:47:25
baibai @ibaibabaibai

時系列に限らず,一般に因果関係の同定が「難しい」とだけいうと「メカニズムの知識が重要」と受けとられる可能性があります.相手がデータ解析の専門家なら警鐘としてむしろそれでよいと思います.

2016-06-20 23:52:34
baibai @ibaibabaibai

しかしたとえば物理学科でそう講義したら「常に物理のようなレベルの法則を求めるのが正しい」と受け取られるかも.それはそれでちょっと困る気がする.DS3では「ドメインの知識は本質的だけど,その上でみんな手法をいろいろ考えている」という風に両方のメッセージを出すように心がけています.

2016-06-20 23:55:35
baibai @ibaibabaibai

実はそれだけではなくて「中断時系列デザイン」,VARモデル,共和分と3つ並べてみせることで「これら3つの扱う時系列の<因果><相関>というのは同じモノでしょうか,違うものでしょうか」と上級者に問いかけている面もあります.みなさんはキチンと整理して答えられるでしょうか?

2016-06-20 23:58:42
baibai @ibaibabaibai

それから「共和分」ですが,これも(計量経済の)部外者には難しい面もある.私が聞きに行った経済時系列の専門家はいまいちマニアックなものと考えているようでしたが,本当にそれでいいのか,沖本本には経済学的な意味のある例も出ていますが.計量経済以外の応用例があるのかもわかりません.

2016-06-21 00:03:05
baibai @ibaibabaibai

続巻でまた関連する話題を取り上げる機会があるなら,そのあたりも改めて専門家に聞いてみたいです.

2016-06-21 00:05:13
baibai @ibaibabaibai

次に「モンテカルロ法と傾向スコア」です.これは一番「他にない」話でもあり,同時に一番掲載してよいか迷った材料でもあります.

2016-06-21 00:07:35
baibai @ibaibabaibai

モンテカルロ法でインポータンスサンプリングをやるときの重みの付け替えと傾向スコアは同じモノだよ,といっているのですが,これが当たり前のことなのか,有用な指摘なのかはイマイチよくわかりません.平たくいえば,自分ではこう書き換えて傾向スコアが理解できた,ということなのですが.

2016-06-21 00:10:55
baibai @ibaibabaibai

そもそも傾向スコアの導出というのが岩波DS3に載っているかというと出ていません.実は赤本でも,一部は論文が引用してあったりして,self containedかというと微妙です.

2016-06-21 00:14:56
baibai @ibaibabaibai

これらはルービンの枠組み自体を解説することに重点を置いているので,それはそれでいいのですが,難解だから省略されているのか,当たり前だから詳しく書いていないのだか,悩むところです.

2016-06-21 00:18:31
baibai @ibaibabaibai

原論文を見なくても,たとえば岩崎学「統計的因果推論」の付録には導出の証明がありますが,難しいか易しいかというと微妙です.まず見た目(上の本に出てる範囲では)数学的に高度だとか煩雑ということはなさそうです.しかし直観的に何をやっているのかは,自分にはいまいちよくわかりません.

2016-06-21 00:23:08
baibai @ibaibabaibai

これは単に自分が慣れていないせいかもしれませんが,ルービン風の「潜在的結果変数と割り付けが共変量Xのもとで条件つき独立」という条件が「結果的にそうなっていれば」という話で,「データ生成機構とか順序」に沿った話ではないのが直観的でないのではないでしょうか.

2016-06-21 00:27:24
baibai @ibaibabaibai

そういうわけで,自分なりに考えたのがコラムの内容です.一応は「再導出」になっているのではないかと思います.そして直観的でとても易しいと思います.ただ「そこが問題じゃないんだ」と言われる心配もあるので,とりあえず遠慮して「モンテカルロ法との関係」というタイトルにしました.

2016-06-21 00:31:42
baibai @ibaibabaibai

この「導出」で気になるのは「因果関係の確率論では表現できない部分がどこに入っているのか」です.おそらく「求めた結果が因果効果をあらわす」ということを言う部分に「潜在的結果変数」なり「介入(do演算子)なりが暗黙に含まれているのではないかと.しかしあまりにもすらっと行ってしまって.

2016-06-21 00:37:06
baibai @ibaibabaibai

編集側の立場としては「岩波DSは(学会や研究会のような)オリジナルの研究発表の場ではない」ということを言っているので若干躊躇したのですが,あくまで説明の仕方の話だというのと,入っている場所も目立たない場所w だというので許してもらうことにしました.忌憚のないご指摘・ご感想歓迎です

2016-06-21 00:41:18
baibai @ibaibabaibai

さて3つのうち最後のコラム「グラフ表現超速習」ですが,これは実はどうしても何か入れないといけない事情がありました.

2016-06-21 00:43:59
baibai @ibaibabaibai

今回の小原・土谷の情報幾何の連載は,ガウシアングラフィカルモデルの情報幾何を扱っているのですが,これは偶然でなく,因果推論特集に合わせて,4巻の内容と順番を入れ替えてもらったのです.

2016-06-21 00:48:02
baibai @ibaibabaibai

そういう経緯があるので,連載の筆者は当然「因果推論で出てくるグラフィカルモデル」という風に書くのですが,これは無向グラフの話です.ところが3巻のほかの筆者は矢印が好きというか,もっぱら方向が入らずんば因果にあらず,という感じの書きぶりの方が多い.

2016-06-21 00:52:33
baibai @ibaibabaibai

どっちも間違いではないのですが,間をつなぐ説明が必要,と判断しました.

2016-06-21 00:53:23
baibai @ibaibabaibai

もうひとつ,1巻から有向グラフや無向グラフが出てきているのに説明をしていないのが気になっていました.PRMLから勉強しはじめる人も多い時代ですから「確率モデルの表現としての有向グラフや無向グラフ」は常識かもしれませんが,DS3の読者はそういう人ばかりではないと思います.

2016-06-21 00:56:22
baibai @ibaibabaibai

そもそも因果ダイアグラムといっても,因果だけを示すのに使われるよりも,確率モデルの分解に因果を上書きするような使い方で,理論的にも確率論プラスα(α=介入)みたい見方をすることが多いように思います.また,できるだけ広い視野で物事を見てほしいという気持ちもあります.

2016-06-21 01:00:28
baibai @ibaibabaibai

たとえば「因果ダイアグラムでは矢印の向きが本質」というので,逆に「確率モデルの条件つき確率への分解を示すDAGでは矢印の向きをどうやっても分布形での制約は同じ」とか思ってしまっている人はいないでしょうか.

2016-06-21 01:03:18