多重検定についていろいろ聞いてみました。
@motthy 3万個の遺伝子で検定して、設定したp値の閾値に対して有意な遺伝子リストを集めようとすると暴露する物質の数や臓器に関わらず多重検定になります。それぞれの遺伝子を検定しているので最終的なリストが、目的の閾値よりもFalse Positiveを多く含むことになるからです
2013-01-09 22:06:00@motthy FDRはp値を補正しているだけだから、まずは帰無仮説が何なのか、を考えると何を棄却して、何を証明しようとしているのかが分かると思うよ。
2013-01-09 22:09:25@motthy 厳密にいうとそうです。検定を3万回繰り返していることになるから。ただ通常は別の方法でかなり減らして検定するけれど、これがいいのかどうかがグレーゾーン。
2013-01-09 22:11:22抽象的な議論でわからなくなったときは具体例で考える
薬品A(マウスのとある臓器に障害を与えることがわかっている)を投与したマウスに薬品Bを投与したときの薬品Bの効果を知りたい、というのがもともと。この場合、帰無仮説は「薬品Bに効果はない」あれ、これでは薬品Aの効果はどこにいった?
2013-01-09 22:13:47@motthy 薬品Aと薬品Bの相乗効果による効果を知りたいのかどうかによるかと。薬品Aがすべてのサンプルに与えられていて、薬品Bが濃度別にさらに追加されているなら、帰無仮説は薬品Bの濃度差による違いはない、そして対立仮説が薬品Bの濃度差による効果がある、となる。
2013-01-09 22:16:49それなら、非投与群とBのみ投与群は不要?実験自体のコントロールとしては必要だったけど、トランスクリプトームまでやらなくてもよかったのかなあ…←上からの指示があったので疑問も持たずやってしまいましたが
2013-01-09 22:21:09@motthy うーん、何を検定で証明したいかによるよね。何も投与してない群とAとBを投与した群で比較すれば、2つの投与により効いた、と言えるし。Bのみと、A+Bを比較すれば、Aが必要かどうか検定できるし。
2013-01-09 22:24:46@marimiya_clc 「Aで障害を起こしているよ、だから障害モデルとして役に立つよ」ということも同時に見たい…という目的もあったはず。
2013-01-09 22:28:59