多重検定についていろいろ聞いてみました。

トランスクリプトーム(マイクロアレイとかRNA-Seqとか)で遺伝子の発現変動を見つけてくるための有意差検定のことを考えていたら、何を見ているのか、何を見たいのか、わけわからなくなってしまったので、バイオインフォマティクスクラスタの皆さんに聞いてみました。 (鍵付きのかたにもリプいただいたのですが、ここには出しておりませんのでご了解ください)
11
:marimiya @marimiya_clc

@motthy 3万個の遺伝子で検定して、設定したp値の閾値に対して有意な遺伝子リストを集めようとすると暴露する物質の数や臓器に関わらず多重検定になります。それぞれの遺伝子を検定しているので最終的なリストが、目的の閾値よりもFalse Positiveを多く含むことになるからです

2013-01-09 22:06:00
:marimiya @marimiya_clc

@motthy FDRはp値を補正しているだけだから、まずは帰無仮説が何なのか、を考えると何を棄却して、何を証明しようとしているのかが分かると思うよ。

2013-01-09 22:09:25
もっち @motthy

@marimiya_clc ANOVAだろうがt検定だろうが、検定手法のいかんに関わらず、多重比較をしている…ということ?

2013-01-09 22:09:52
:marimiya @marimiya_clc

@motthy 厳密にいうとそうです。検定を3万回繰り返していることになるから。ただ通常は別の方法でかなり減らして検定するけれど、これがいいのかどうかがグレーゾーン。

2013-01-09 22:11:22

抽象的な議論でわからなくなったときは具体例で考える

もっち @motthy

薬品A(マウスのとある臓器に障害を与えることがわかっている)を投与したマウスに薬品Bを投与したときの薬品Bの効果を知りたい、というのがもともと。この場合、帰無仮説は「薬品Bに効果はない」あれ、これでは薬品Aの効果はどこにいった?

2013-01-09 22:13:47
なんかの博士 @nannosono

@motthy 薬剤傷害モデルなら勘案しなくてもよいのでは?

2013-01-09 22:15:18
:marimiya @marimiya_clc

@motthy 薬品Aと薬品Bの相乗効果による効果を知りたいのかどうかによるかと。薬品Aがすべてのサンプルに与えられていて、薬品Bが濃度別にさらに追加されているなら、帰無仮説は薬品Bの濃度差による違いはない、そして対立仮説が薬品Bの濃度差による効果がある、となる。

2013-01-09 22:16:49
もっち @motthy

@nannosono そうすると、そもそも2群あればいいのでしょうか?A+B投与群とAのみ投与群(後者がコントロール)

2013-01-09 22:17:50
もっち @motthy

それなら、非投与群とBのみ投与群は不要?実験自体のコントロールとしては必要だったけど、トランスクリプトームまでやらなくてもよかったのかなあ…←上からの指示があったので疑問も持たずやってしまいましたが

2013-01-09 22:21:09
:marimiya @marimiya_clc

@motthy うーん、何を検定で証明したいかによるよね。何も投与してない群とAとBを投与した群で比較すれば、2つの投与により効いた、と言えるし。Bのみと、A+Bを比較すれば、Aが必要かどうか検定できるし。

2013-01-09 22:24:46
なんかの博士 @nannosono

@motthy そうですよー。念のため4群でやりますが!

2013-01-09 22:26:51
もっち @motthy

@marimiya_clc 「Aで障害を起こしているよ、だから障害モデルとして役に立つよ」ということも同時に見たい…という目的もあったはず。

2013-01-09 22:28:59
:marimiya @marimiya_clc

@motthy なるほど。だとAのみとAなしでの比較ができるサンプルで検定かな。

2013-01-09 22:31:14