【新機能】作り忘れたまとめはありませんか?31日前まで期間指定してまとめが作れる高度な検索ができました。有料APIだからツイートの漏れはありません!

こんなグラフがあって「XX時には野生型と変異体で差があります」を言いたいときに使う検定

何らかの指標の時系列が複数あるときに、ある時点で2群が違うかどうかを言いたいときにはどんな統計手法を使えば良いか?という質問に対するいろいろなコメントや提案。複数のストリングが混ざってて読みにくい部分や、関連性の低いツイートも混ざってますが、なんとなく全体の話の流れが追えればいいなと思いまとめました。これからも関連ツイート増えると思うので、追加や漏れに気づいた方ぜひ追加してください。
時系列 統計
9544view 1コメント
19
ログインして広告を非表示にする
Genki Kanda @Kd_Gn 2016-02-16 20:03:03
こんなグラフがあって「XX時には野生型と変異体で差があります」を言いたいときに使う検定がわからなくて時間が溶けてる。各時刻で野生型 vs 変異体のt-testをするのはよくなさそうなのはわかる。 pic.twitter.com/jqs4JNja6A
 拡大
田口善弘 @Yh_Taguchi 2016-02-16 20:13:39
2つの時系列をx(t),y(t)としたときx(t)-y(t)が平均ゼロのガウス分布かどうかをまずは検定すればよいのでは。 twitter.com/Kd_Gn/status/6…
Genki Kanda @Kd_Gn 2016-02-16 20:30:10
@Yh_Taguchi コメントありがとうございます。僕の頭が追いついていません... この場合まず各時刻でそれを検定する、でいいのでしょうか。
田口善弘 @Yh_Taguchi 2016-02-16 20:35:17
@Kd_Gn 何を検定したいと思うかによります。帰無仮説としてx(t) +\delta  とし、\deltaはガウス分布に従うノイズだ、と考えるならこれを否定する仮設検定は「各時刻で検定する」でいいと思います。おそらく「それじゃあだめだ」と感じるのは(続)
田口善弘 @Yh_Taguchi 2016-02-16 20:38:12
@Kd_Gn (承前)x(t)+\delta(t)みたいになっていて\delta(t)と\delta(t+1)が 明らかに相関しているのでそれじゃあモデルとしてだめだと感じるのでしょう。しかし、「差があるかどうか」に限るなら「x(t) +\deltaと仮定しても(続)
田口善弘 @Yh_Taguchi 2016-02-16 20:39:30
@Kd_Gn 説明できない」と言えればいいわけで。結局、 このデータから何を言いたいのかがはっきりしないと答えはでません。どんな帰無仮説を否定したいか、から考えないと。
Genki Kanda @Kd_Gn 2016-02-16 20:47:05
@yh_taguchi ありがとうございます。それですと「帰無仮説:x(t)+\delta」です。単純に各時刻で検定かけると今回の場合24回反復になるので補正しないとなぁ、という悩みです。有意水準を24で割るとシンプルなのですが他にこれといった方法はないものかというご相談でした。
田口善弘 @Yh_Taguchi 2016-02-16 20:50:31
@Kd_Gn 時系列が一個しかないなら、24点で多重比較補正はいらないですよ。24個の観測値があるとおもって、ただその平均値がゼロから有意にはずれているかをt検定するだけでOKです。
Endo, Takaho @caripso 2016-02-16 20:55:08
@Yh_Taguchi @Kd_Gn 横槍失礼します。時系列データにおいて定常過程かどうかの検定にWT-mutantの値でまず拡張ディッキー–フラー検定を行うのがよいかと思います。私ならそこで帰無仮説が棄却された場合最も差の大きい時間を選ぶと思います。
Genki Kanda @Kd_Gn 2016-02-16 20:55:09
@yh_taguchi 「その平均値」がどの値を指すのかご教示いただけないでしょうか。
田口善弘 @Yh_Taguchi 2016-02-16 20:57:07
@Kd_Gn 1/T × sum_t  (x(t)-y(t)) です。
田口善弘 @Yh_Taguchi 2016-02-16 20:59:00
多分、こっちの方が検出力は高いと思います。僕はこういうのを詳しいわけじゃないです。 twitter.com/caripso/status…
Endo, Takaho @caripso 2016-02-16 21:00:38
@Yh_Taguchi @Kd_Gn その方法ですと時間変化があるのかベースラインが違うのかの区別ができないと思います。正しく正規化されていれば気にしなくてよいと思いますが。
田口善弘 @Yh_Taguchi 2016-02-16 21:01:42
もちろん、「差がある」ことしか言えないです。結局、解析で何が言いたいかによりますね。 twitter.com/caripso/status…
Genki Kanda @Kd_Gn 2016-02-16 21:02:48
@caripso @yh_taguchi ...もしかしてサインカーブっぽく見えているのがことをめんどくさくしてますか...??
Endo, Takaho @caripso 2016-02-16 21:04:23
@Kd_Gn @Yh_Taguchi 差をとって考えているので波形そのものは影響しません。時系列データの時間依存性を検定する方法ということです。
Genki Kanda @Kd_Gn 2016-02-16 21:04:24
@yh_taguchi 僕の言い方が間違っていました。全体の平均で差があることがわかった後に、では一体何時に差が出ているのか、を知りたいのです...(僕の勉強が足りないことはよくわかりました)
田口善弘 @Yh_Taguchi 2016-02-16 21:05:56
@Kd_Gn @caripso そういう問題じゃなくて平均して上下にずれているのか 平均は同じだけど変動の向きが違うのかが、僕が提案した方法じゃ区別できないよって私的です。
田口善弘 @Yh_Taguchi 2016-02-16 21:10:07
@Kd_Gn そういうことをしたいなら基本的には時刻Tまでをx(t) +\deltaで検定していつ破たんするか(帰無仮説が棄却できなくなるか)をみればいいんですけど、そうなると、今度こそ多重比較補正しないといけないですし、たった24点ではそれは難しいという気はします。
YF @Med_KU 2016-02-16 21:12:36
本気出してモデル化するならば、生物データだし周期性、三角関数に則っていそうだから野生型について各時刻のCI つき推定値を出して、変異型についてはt=t0 あたりで変化点が存在するとしてひたすらシミュレーションかませる?? twitter.com/Kd_Gn/status/6…
YF @Med_KU 2016-02-16 21:13:36
だがしかし、そんなモデルを立てると妥当性がうんたらこうたらになるのでt検定繰り返しに帰着せざるを得ないが、時系列周期データっぽいので真面目にやったら仮定が複雑だと思われ(適当
Endo, Takaho @caripso 2016-02-16 21:14:05
@Kd_Gn @Yh_Taguchi 私であればADF検定して時間依存性を示した後、change-point detectionでどこからどこまでが相が違うかを示すと思います。ただこの種の解析では24点では少ないだろうというのは田口先生と同意見です。
YF @Med_KU 2016-02-16 21:15:45
あとはまあ、2つの曲線は帰無仮説として「一緒」と仮定するならば、ずれている部分の面積がどれくらいになるかを計算したら「違う」ことは示せそう。だがしかし「いつずれる」かはわからないけど
田口善弘 @Yh_Taguchi 2016-02-16 21:16:07
@caripso @Kd_Gn もしRが使えるなら ja.wikipedia.org/wiki/%E6%8B%A1… にadf.testが紹介されているのでダメもとでやってみては。 でもこの点数では有意差はでなそうです。
残りを読む(56)
コンテンツや記事の反応をまとめよう。 話題をさらに加速させるパワーがあります。

ブックマークしたタグ

あなたの好きなタグをブックマークしておこう!話題のまとめを見逃さなくなります。
ログインして広告を非表示にする
ログインして広告を非表示にする