こんなグラフがあって「XX時には野生型と変異体で差があります」を言いたいときに使う検定

何らかの指標の時系列が複数あるときに、ある時点で2群が違うかどうかを言いたいときにはどんな統計手法を使えば良いか?という質問に対するいろいろなコメントや提案。複数のストリングが混ざってて読みにくい部分や、関連性の低いツイートも混ざってますが、なんとなく全体の話の流れが追えればいいなと思いまとめました。これからも関連ツイート増えると思うので、追加や漏れに気づいた方ぜひ追加してください。
19
Genki Kanda @Kd_Gn

こんなグラフがあって「XX時には野生型と変異体で差があります」を言いたいときに使う検定がわからなくて時間が溶けてる。各時刻で野生型 vs 変異体のt-testをするのはよくなさそうなのはわかる。 pic.twitter.com/jqs4JNja6A

2016-02-16 20:03:03
拡大
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

2つの時系列をx(t),y(t)としたときx(t)-y(t)が平均ゼロのガウス分布かどうかをまずは検定すればよいのでは。 twitter.com/Kd_Gn/status/6…

2016-02-16 20:13:39
Genki Kanda @Kd_Gn

@Yh_Taguchi コメントありがとうございます。僕の頭が追いついていません... この場合まず各時刻でそれを検定する、でいいのでしょうか。

2016-02-16 20:30:10
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

@Kd_Gn 何を検定したいと思うかによります。帰無仮説としてx(t) +\delta  とし、\deltaはガウス分布に従うノイズだ、と考えるならこれを否定する仮設検定は「各時刻で検定する」でいいと思います。おそらく「それじゃあだめだ」と感じるのは(続)

2016-02-16 20:35:17
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

@Kd_Gn (承前)x(t)+\delta(t)みたいになっていて\delta(t)と\delta(t+1)が 明らかに相関しているのでそれじゃあモデルとしてだめだと感じるのでしょう。しかし、「差があるかどうか」に限るなら「x(t) +\deltaと仮定しても(続)

2016-02-16 20:38:12
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

@Kd_Gn 説明できない」と言えればいいわけで。結局、 このデータから何を言いたいのかがはっきりしないと答えはでません。どんな帰無仮説を否定したいか、から考えないと。

2016-02-16 20:39:30
Genki Kanda @Kd_Gn

@yh_taguchi ありがとうございます。それですと「帰無仮説:x(t)+\delta」です。単純に各時刻で検定かけると今回の場合24回反復になるので補正しないとなぁ、という悩みです。有意水準を24で割るとシンプルなのですが他にこれといった方法はないものかというご相談でした。

2016-02-16 20:47:05
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

@Kd_Gn 時系列が一個しかないなら、24点で多重比較補正はいらないですよ。24個の観測値があるとおもって、ただその平均値がゼロから有意にはずれているかをt検定するだけでOKです。

2016-02-16 20:50:31
Endo, Takaho @caripso

@Yh_Taguchi @Kd_Gn 横槍失礼します。時系列データにおいて定常過程かどうかの検定にWT-mutantの値でまず拡張ディッキー–フラー検定を行うのがよいかと思います。私ならそこで帰無仮説が棄却された場合最も差の大きい時間を選ぶと思います。

2016-02-16 20:55:08
Genki Kanda @Kd_Gn

@yh_taguchi 「その平均値」がどの値を指すのかご教示いただけないでしょうか。

2016-02-16 20:55:09
Endo, Takaho @caripso

@Yh_Taguchi @Kd_Gn その方法ですと時間変化があるのかベースラインが違うのかの区別ができないと思います。正しく正規化されていれば気にしなくてよいと思いますが。

2016-02-16 21:00:38
Genki Kanda @Kd_Gn

@caripso @yh_taguchi ...もしかしてサインカーブっぽく見えているのがことをめんどくさくしてますか...??

2016-02-16 21:02:48
Endo, Takaho @caripso

@Kd_Gn @Yh_Taguchi 差をとって考えているので波形そのものは影響しません。時系列データの時間依存性を検定する方法ということです。

2016-02-16 21:04:23
Genki Kanda @Kd_Gn

@yh_taguchi 僕の言い方が間違っていました。全体の平均で差があることがわかった後に、では一体何時に差が出ているのか、を知りたいのです...(僕の勉強が足りないことはよくわかりました)

2016-02-16 21:04:24
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

@Kd_Gn @caripso そういう問題じゃなくて平均して上下にずれているのか 平均は同じだけど変動の向きが違うのかが、僕が提案した方法じゃ区別できないよって私的です。

2016-02-16 21:05:56
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

@Kd_Gn そういうことをしたいなら基本的には時刻Tまでをx(t) +\deltaで検定していつ破たんするか(帰無仮説が棄却できなくなるか)をみればいいんですけど、そうなると、今度こそ多重比較補正しないといけないですし、たった24点ではそれは難しいという気はします。

2016-02-16 21:10:07
🤔🤔🤔🤔🤔🤔 @Med_KU

本気出してモデル化するならば、生物データだし周期性、三角関数に則っていそうだから野生型について各時刻のCI つき推定値を出して、変異型についてはt=t0 あたりで変化点が存在するとしてひたすらシミュレーションかませる?? twitter.com/Kd_Gn/status/6…

2016-02-16 21:12:36
🤔🤔🤔🤔🤔🤔 @Med_KU

だがしかし、そんなモデルを立てると妥当性がうんたらこうたらになるのでt検定繰り返しに帰着せざるを得ないが、時系列周期データっぽいので真面目にやったら仮定が複雑だと思われ(適当

2016-02-16 21:13:36
Endo, Takaho @caripso

@Kd_Gn @Yh_Taguchi 私であればADF検定して時間依存性を示した後、change-point detectionでどこからどこまでが相が違うかを示すと思います。ただこの種の解析では24点では少ないだろうというのは田口先生と同意見です。

2016-02-16 21:14:05
🤔🤔🤔🤔🤔🤔 @Med_KU

あとはまあ、2つの曲線は帰無仮説として「一緒」と仮定するならば、ずれている部分の面積がどれくらいになるかを計算したら「違う」ことは示せそう。だがしかし「いつずれる」かはわからないけど

2016-02-16 21:15:45
田口善弘@発言は私の個人としての見解であり中央大学やその機関の意見を代表するものではありません @Yh_Taguchi

@caripso @Kd_Gn もしRが使えるなら ja.wikipedia.org/wiki/%E6%8B%A1… にadf.testが紹介されているのでダメもとでやってみては。 でもこの点数では有意差はでなそうです。

2016-02-16 21:16:07
1 ・・ 4 次へ