こんなグラフがあって「XX時には野生型と変異体で差があります」を言いたいときに使う検定
@caripso @yh_taguchi このデータ実は6日分(144時間分)をそれぞれの日の1-24時の分をそれぞれ平均したもの(をさらにn=100 or 10で平均したもの)なのですが、24時間ではなく144時間として計算した方が良い...ということ...ですか...??
2016-02-16 21:23:04@Kd_Gn @caripso いやいや、そんだけあるんだったらむしろ、望みはあるでしょう。24時間を6回サンプリングしたと思って統計とれるんだから。ただ、ADFで「6回繰り返した」という情報をどういれるのか僕にはわからないです。
2016-02-16 21:28:39@Kd_Gn @Yh_Taguchi モデルと実験系が分からないので何とも言えませんが時間依存性を見るなら平均化する前の方が良いと思います
2016-02-16 21:29:33@caripso @yh_taguchi ありがとうございます。勉強になります。ちなみに実験系は「ある処置したマウスは野生型に比べて行動量が増える気がする。特に特定の時間帯に。6日間1時間ビンで行動量を調べてみよう」でした。 pic.twitter.com/remYQGmzQP
2016-02-16 21:37:01@Kd_Gn @caripso こんだけきれいなデータなら6回を独立した解析だと思えば十分、検定できると思います。簡便にはx(t)+\deltaで帰無仮説が棄却できない時間帯を探せばいいし、本式にはADFとかいうのを使えばいいでしょう。頑張ってください。
2016-02-16 21:42:26@yh_taguchi @caripso 実際のデータはもっと汚い(はず)ですがこんな感じではあるので色々いじってみます!
2016-02-16 21:44:09@marimiya_clc エラーバーついていませんでしたが赤がn=10、青がn=100で実験した(つもりの)例でした。 pic.twitter.com/aq7OaX3A5S
2016-02-16 21:44:53@Kd_Gn @caripso QBiCにいるなら周囲に詳しい人が絶対いると思います。
2016-02-16 21:46:49@yh_taguchi @caripso 僕もそう思います!← (Dry系ラボの建物とは歩いて30分離れているのでTwitterの方が近かったのでした...)
2016-02-16 21:48:48各時刻で野生型と変異体と同じ状態空間モデルに従うベースラインを持つとする。変異体はそれに加えて定数の項(または指数関数で落ちる項)を付け加えて、変化点検出込みでモデリング。推定後、定数の高さのベイズ信頼区間から判定、でよさそう。 twitter.com/Kd_Gn/status/6…
2016-02-16 22:03:52@berobero11 コメントありがとうございます。Excelぽちぽちやるだけじゃ済まなそうな問題だったんだな、というのはわかりました... 勉強します。
2016-02-16 22:10:30@Kd_Gn 時系列データだといきなり問題が難しくなるので、世の中にある手法で検定できるのか謎です。ベイズモデリングでよろしければ、データもらえればやりますので困ったら連絡くださいませ。ただし、ブログに書いちゃうかもですが…。
2016-02-16 22:13:49@berobero11 データが(論文として)Publishされた際にはぜひお伺いしてみたいです。時間生物学者の共通の悩みなのではないかなと思います...
2016-02-16 22:17:55@Med_KU コメントありがとうございます。本気出してモデらなくても良いお手軽検定法がないかなと思ってましたがそうそう甘いものではないことが改めてわかりました...
2016-02-16 22:21:11モデル化できない時系列データに対して時刻ごとt検定で連続N時刻以上有意でOK みたいなやり方は見るし、眼球運動とかでやる。統計学的に本当に正しいのかどうかはよく分からないけど、直感的には問題ないはず。 twitter.com/kd_gn/status/6…
2016-02-16 22:37:44SPMとかのクラスタサイズがいくつ以上ならOK的な発想と同じで、ボクセルでの3次元空間が一次元時系列になっただけのはず。SPMが正しいかと言われればよくわかんないけど。
2016-02-16 22:39:44でもこのデータの場合、眼球運動とかに比べてもっと時間が飛び飛びなので、連続N点のカットオフはちょっと適用しづらいのかもしれない。独立じゃないけど、連続として扱いにくい、微妙なサンプリング周期の時、確かに悩ましいな。コンサバティブにやるなら各点t検定のボンフェローニか。
2016-02-16 22:43:13昼夜分けてとかは、意図しないとしても double dipping になる可能性がありそうだから、気を付けたほうがよさそう。まあ時系列データとか空間でもそうだけど、特に独立性が微妙なデータを取るときは、配牌前に最終形を描いといたほうがいい、というのは間違いないと思う。
2016-02-16 22:49:49この時系列は一個まえの時刻の値と相関が強くて全く独立でないから、連続N時刻以上有意を主張してもよく分からない。せめて検定するなら全時刻データから一つの統計量を出すようにしないといけないと思うんだけど、これがかなり難しい…。
2016-02-16 22:59:00こういう案件は圧倒的に久保さん向きに思いますので、メンションで召喚いたします。@KuboBook twitter.com/kohske/status/…
2016-02-16 23:01:05@berobero11 多分問題意識が微妙に違って、AとBのモデルとかパラメータが違うかどうかというより、どの時刻で差があるかということを知りたくて(実際そういう状況よくある)、ローカルな検定をrolling windowみたいにやっていくのは実践的にはありかも、といことです。
2016-02-16 23:04:35