エキソームキットにまつわるあれこれ

次世代シークエンサーを効率よく運用する決め手の一つはゲノム中の重要な部分のみを読むエキソーム解析。エキソンをゲノムから選別してくるわけですが、その際にどうしてもムラが出てしまう。その辺の事情について論文紹介もちょっとだけ。
1
まこ @ma_ko

@38brain 結構違う数字が出ましたけど, 普段そんな細かいことを調べる機会はなく, 自分が気になった時にちょこちょこっとやるだけだったので, 他の人の感触を聞けたのはタメになりました. ありがとうございました. @jyasuda1

2012-02-25 01:12:58
38brain @38brain

@ma_ko 相当知らない使えるoptionが眠っているはずなのでこういうツール類のoptionと結果カラム説明一覧が欲しいですね。もちろん平易な日本語でw。 @jyasuda1

2012-02-25 01:16:19
まこ @ma_ko

@jyasuda1 @38brain 訂正: リードが張りついた領域が50%未満のものがおおよそ2000強ある => リードが張りついた領域が50%未満のものがおおよそ1600-1700ある

2012-02-25 01:21:18
38brain @38brain

@ma_ko もうちょっとでcoverageBed終わるはずなのでしばしお待ちをw。

2012-02-25 01:22:22
まこ @ma_ko

@jyasuda1 申し訳ないですが, 計算を修正したのでもう一度コンパクトにつぶやきます. @38brain

2012-02-25 01:33:41
まこ @ma_ko

@jyasuda1 @38brain 96億塩基対を読んだデータで "1st exon で covered が50%未満" => 1180 "1st exon で covered が50%以上" => 20242 covered は対象領域に1リードでもついた領域の割合です.

2012-02-25 01:36:08
まこ @ma_ko

@jyasuda1 @38brain 93億塩基対を読んだデータで "1st exon で covered が50%未満" => 1145 "1st exon で covered が50%以上" => 20277 covered は対象領域に1リードでもついた領域の割合です.

2012-02-25 01:37:57
まこ @ma_ko

@jyasuda1 @38brain ざっとの数字ですが, ファーストエキソンで, そのエキソン内でリードが張りついた領域が50%未満のものがおおよそ1200あるということになります. 2万2000程度の遺伝子数を考えると, 5%程度は十分には読めてないという感覚です.

2012-02-25 01:40:31
まこ @ma_ko

@38brain その数字は 1st exon で, っていうことですよね. @jyasuda1

2012-02-25 01:41:58
38brain @38brain

@ma_ko 再訂正。出たんですが意外にカバー率0が多いです。0が7.2%、0-50%未満が3.2%、50〜100%未満が7.0%、100%が82.6%でした。このtargetファイルがSOLiDのtarget領域も含んでいるために0が多いのかもしれません。 @jyasuda1

2012-02-25 01:42:28
38brain @38brain

いえ、たぶん全部です。なんかexonの番号が出力されてなかったので(泣)。 RT @ma_ko: @38brain その数字は 1st exon で, っていうことですよね. @jyasuda1

2012-02-25 01:44:29
38brain @38brain

ダブりはないですね。 RT @ma_ko: @38brain ちなみに uniq かけたら, こっそり紛れたダブりが減ったりしません?

2012-02-25 01:47:07
まこ @ma_ko

そろそろ寝ます… @38brain さん, @jyasuda1 さんありがとうございました (たくさんつぶやいてごめんなさい, まとめたいが大変, という場合は選り抜くのに協力しますのでお知らせください…).

2012-02-25 01:49:13
38brain @38brain

こちらこそありがとうございました。Mentionsカラムがma_koさんで埋まったのでそろそろ終わりにしますw。RT @ma_ko: そろそろ寝ます… @38brain さん, @jyasuda1 さんありがとうございました

2012-02-25 01:50:30