RNA-Seq

RNA-Seqを用いた解析手法について
1
Kazuharu Arakawa @gaou_ak

@dritoshi @sesejun この論文のイントロ、RNA-Seqの正規化的に勉強になりました。http://bit.ly/bC1D4Y

2010-05-21 20:40:49
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

RNA-seq はサンプル間を比較するときに、どちらかの発現量が 0 になることが多くて、同じランクになるものがあるため、Wilcoxon 検定が相応わしくないことが多いな。

2010-11-19 13:23:53
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

そもそも、なぜ発現量が 0 になる転写産物が多いか、というと構造予測がうまくいかなくて、ほかのサンプルでは構造が取れてなかったりする、というのが問題。RNA-seq は構造予測とサンプル間での転写産物の対応をどう付けるか、が解析の最も重要で困難なところだ。

2010-11-19 13:31:48
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

RNA-seq からの転写産物構造予測が難しい理由は、1. read数が足りない 2. direction の情報がない 3. pair-end のようなタグ間の距離情報がない 4. アルゴリズムがいけてない 5. サンプルがヘテロで様々な構造が混っている

2010-11-19 13:38:56
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

解決策としては、1. お金 2. illumina プロトコール待ち or SOLiD 3. 2と同じ 4. 俺らがかんばる 5. おまえらがかんばる

2010-11-19 13:40:20
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

配列の種類数がある程度飽和する lane 数からさらに、biological replication を別々にシーケンスしたときの再現性から linearity を見て、適切な lane 数を決める必要がある。RNA-seq の目的は発現量の「定量化」だから。

2010-11-19 13:49:26
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

うろ覚えだがその某社のやつは、3オーダーぐらいの linearity だったので、それならわざわざ RNA-seq じゃなくて GeneChip のほうが良くね? って感じだった気が

2010-11-19 13:55:05
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

その点、CAGE, SAGE の割り切りは良いかもなーと思う。構造予測はいらないし、種類数を増やせるし、リード数も増やせる。データみたことないので隣の芝かもしれないけど

2010-11-19 14:04:37
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

RNA-seq についてぐちぐち言っているときはたいていRNA-seq のデータをぐちぐち解析して、計算待ちになっているときです。こんにちは。

2010-11-19 14:07:45
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

単純な発現量の定量化なら 3' IVT GeneChip が最強だったと思うわ。CAGE GeneChip があればそれでよくね? どうやってつくるかわからんけど。1分子を検出できる microarray の開発などまだまだやれることがあるはずだよ、Affymetrix さん

2010-11-19 14:13:16
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

まあ配列によるハイブリの不均一性という欠点はいかんともしがたいが、sequencing だって、どんなバイアスがあるかよくわからないしなー

2010-11-19 14:17:55
ゲノムのほうの愛ちゃん🌙 🐧 @dritoshi

mRNA の決った構造がヒモのようにびしっと存在していると考えるのをやめてしまうのはどうか。確率分布として存在するだけ。観測しようとすると破壊せざるをえないし。シュレディンガーのmRNA. にゃー

2010-11-19 14:32:12