こんなグラフがあって「XX時には野生型と変異体で差があります」を言いたいときに使う検定
こんなグラフがあって「XX時には野生型と変異体で差があります」を言いたいときに使う検定がわからなくて時間が溶けてる。各時刻で野生型 vs 変異体のt-testをするのはよくなさそうなのはわかる。 pic.twitter.com/jqs4JNja6A
2016-02-16 20:03:032つの時系列をx(t),y(t)としたときx(t)-y(t)が平均ゼロのガウス分布かどうかをまずは検定すればよいのでは。 twitter.com/Kd_Gn/status/6…
2016-02-16 20:13:39@Yh_Taguchi コメントありがとうございます。僕の頭が追いついていません... この場合まず各時刻でそれを検定する、でいいのでしょうか。
2016-02-16 20:30:10@Kd_Gn 何を検定したいと思うかによります。帰無仮説としてx(t) +\delta とし、\deltaはガウス分布に従うノイズだ、と考えるならこれを否定する仮設検定は「各時刻で検定する」でいいと思います。おそらく「それじゃあだめだ」と感じるのは(続)
2016-02-16 20:35:17@Kd_Gn (承前)x(t)+\delta(t)みたいになっていて\delta(t)と\delta(t+1)が 明らかに相関しているのでそれじゃあモデルとしてだめだと感じるのでしょう。しかし、「差があるかどうか」に限るなら「x(t) +\deltaと仮定しても(続)
2016-02-16 20:38:12@Kd_Gn 説明できない」と言えればいいわけで。結局、 このデータから何を言いたいのかがはっきりしないと答えはでません。どんな帰無仮説を否定したいか、から考えないと。
2016-02-16 20:39:30@yh_taguchi ありがとうございます。それですと「帰無仮説:x(t)+\delta」です。単純に各時刻で検定かけると今回の場合24回反復になるので補正しないとなぁ、という悩みです。有意水準を24で割るとシンプルなのですが他にこれといった方法はないものかというご相談でした。
2016-02-16 20:47:05@Kd_Gn 時系列が一個しかないなら、24点で多重比較補正はいらないですよ。24個の観測値があるとおもって、ただその平均値がゼロから有意にはずれているかをt検定するだけでOKです。
2016-02-16 20:50:31@Yh_Taguchi @Kd_Gn 横槍失礼します。時系列データにおいて定常過程かどうかの検定にWT-mutantの値でまず拡張ディッキー–フラー検定を行うのがよいかと思います。私ならそこで帰無仮説が棄却された場合最も差の大きい時間を選ぶと思います。
2016-02-16 20:55:08@Kd_Gn 1/T × sum_t (x(t)-y(t)) です。
2016-02-16 20:57:07多分、こっちの方が検出力は高いと思います。僕はこういうのを詳しいわけじゃないです。 twitter.com/caripso/status…
2016-02-16 20:59:00@Yh_Taguchi @Kd_Gn その方法ですと時間変化があるのかベースラインが違うのかの区別ができないと思います。正しく正規化されていれば気にしなくてよいと思いますが。
2016-02-16 21:00:38もちろん、「差がある」ことしか言えないです。結局、解析で何が言いたいかによりますね。 twitter.com/caripso/status…
2016-02-16 21:01:42@caripso @yh_taguchi ...もしかしてサインカーブっぽく見えているのがことをめんどくさくしてますか...??
2016-02-16 21:02:48@Kd_Gn @Yh_Taguchi 差をとって考えているので波形そのものは影響しません。時系列データの時間依存性を検定する方法ということです。
2016-02-16 21:04:23@yh_taguchi 僕の言い方が間違っていました。全体の平均で差があることがわかった後に、では一体何時に差が出ているのか、を知りたいのです...(僕の勉強が足りないことはよくわかりました)
2016-02-16 21:04:24@Kd_Gn @caripso そういう問題じゃなくて平均して上下にずれているのか 平均は同じだけど変動の向きが違うのかが、僕が提案した方法じゃ区別できないよって私的です。
2016-02-16 21:05:56@Kd_Gn そういうことをしたいなら基本的には時刻Tまでをx(t) +\deltaで検定していつ破たんするか(帰無仮説が棄却できなくなるか)をみればいいんですけど、そうなると、今度こそ多重比較補正しないといけないですし、たった24点ではそれは難しいという気はします。
2016-02-16 21:10:07本気出してモデル化するならば、生物データだし周期性、三角関数に則っていそうだから野生型について各時刻のCI つき推定値を出して、変異型についてはt=t0 あたりで変化点が存在するとしてひたすらシミュレーションかませる?? twitter.com/Kd_Gn/status/6…
2016-02-16 21:12:36だがしかし、そんなモデルを立てると妥当性がうんたらこうたらになるのでt検定繰り返しに帰着せざるを得ないが、時系列周期データっぽいので真面目にやったら仮定が複雑だと思われ(適当
2016-02-16 21:13:36@Kd_Gn @Yh_Taguchi 私であればADF検定して時間依存性を示した後、change-point detectionでどこからどこまでが相が違うかを示すと思います。ただこの種の解析では24点では少ないだろうというのは田口先生と同意見です。
2016-02-16 21:14:05あとはまあ、2つの曲線は帰無仮説として「一緒」と仮定するならば、ずれている部分の面積がどれくらいになるかを計算したら「違う」ことは示せそう。だがしかし「いつずれる」かはわからないけど
2016-02-16 21:15:45@caripso @Kd_Gn もしRが使えるなら ja.wikipedia.org/wiki/%E6%8B%A1… にadf.testが紹介されているのでダメもとでやってみては。 でもこの点数では有意差はでなそうです。
2016-02-16 21:16:07