エキソームキットにまつわるあれこれ

次世代シークエンサーを効率よく運用する決め手の一つはゲノム中の重要な部分のみを読むエキソーム解析。エキソンをゲノムから選別してくるわけですが、その際にどうしてもムラが出てしまう。その辺の事情について論文紹介もちょっとだけ。
1
まこ @ma_ko

もう80%OFFとかいいから, シャキシャキとエキソンの端っこもきっちり読めるエキソームキット出そうぜ?

2012-02-22 19:56:51
Jun Yasuda @jyasuda1

@ma_ko あのう、やっぱり端っこは読めていないことが多いんですか?不勉強ですみません。

2012-02-22 20:02:33
まこ @ma_ko

@jyasuda1 あー, 主観的なつぶやきですw 厳密には比較したことがありません. 僕の考えだとイ◯◯ナ社のものは, exome capture 用のオリゴが他社より1桁少ないため, キャプチャーのムラは発生しやすいと思っています (きちんと比較したことはないです).

2012-02-22 20:05:18
Jun Yasuda @jyasuda1

@ma_ko キットごとに特性が違うというのがNature Protocolにでていたというのをtwitter経由で見た覚えがあるのですが、もしかして釈迦(=情報源)に説法?

2012-02-22 20:09:09
まこ @ma_ko

@jyasuda1 いや, 知らないかもです. Nature Biotech. のは去年末に見ました. http://t.co/BiSSwnap

2012-02-22 20:09:59
Jun Yasuda @jyasuda1

@ma_ko あ、そっちだと思います。結構i○○社はいまいちで、味××社のは世下げに見えたけど、論文自体は「目的に応じで選ぶべし」みたいな玉虫色の結論でした。

2012-02-22 20:11:47
まこ @ma_ko

@jyasuda1 正直, きちんと質のいいライブラリを作って, 15Gbp くらいの十分な量を読めば, どれを使ってもほぼ差はないと考えています. 1st exon はどれも読めないでしょうし.

2012-02-22 20:13:21
Jun Yasuda @jyasuda1

@ma_ko ありがとうございました。またいろいろ教えてください。

2012-02-22 20:14:07
まこ @ma_ko

@jyasuda1 論文の図にキャプチャー用のオリゴ (baits) が載っていますが, 雑に遺伝子を2.2万, エキソンを22万とするとi社の34万 baits はかなり少ない, 自然とエキソンの端が取りこぼしがち, という考えです. http://t.co/1JekqAT3

2012-02-22 20:16:16
38brain @38brain

@jyasuda1 @ma_ko 実際に最新版のI社とA社のexon captureを両方試した人でも噂通りA社の方が良かったそうです。ほとんど変わらないレベルまでは来ているようですが…。

2012-02-22 21:19:02
まこ @ma_ko

@38brain @jyasuda1 やっぱりみんな比べるんですね (資金があればw). ファーストエキソンは絶望的なほどハイブリでキャプチャーできてない箇所も見かけるので, もう劇的には変わらないかもしれませんね. 増幅の問題であれば酵素次第で改善が望めるかもしれません.

2012-02-22 21:23:49
38brain @38brain

5'UTRをtargetに含むcapture kitならどうですかね? RT @ma_ko: @38brain @jyasuda1 ファーストエキソンは絶望的なほどハイブリでキャプチャーできてない箇所も見かけるので, もう劇的には変わらないかもしれませんね. 増幅の問題であれ(略

2012-02-22 21:26:54
まこ @ma_ko

@38brain @jyasuda1 確かにライブラリ作成時に長めのフラグメントにして、長く読めるシーケンサーで回避できるかも。

2012-02-22 21:47:25
38brain @38brain

@jyasuda1 @ma_ko ちなみに一見あまり変わりないように見えますがA社曰く、I社のようにサンプルプールするプロトコルの場合rare variantが取れにくくなるという部分があるそうです。A社内でもプールプロトコルがありますがデータ検証後プールなしを推奨してるようです

2012-02-23 15:32:34
まこ @ma_ko

@38brain @jyasuda1 あら, そんな話があるんですね. 来年度早々(?)に pre-pooling 式を SureSelect v4/v5 で提供するって話どうなるんだろう…?

2012-02-23 15:34:03
38brain @38brain

@ma_ko @jyasuda1 コスト的な競争から出さざるを得ないという感じ何じゃないですかね。詳しくは知りませんが手法に関しては併用されていくんじゃないですかね。

2012-02-23 15:37:00
まこ @ma_ko

@38brain @jyasuda1 確かにコストのこと考えるとそうですね. がんばれ, A社!

2012-02-23 15:37:40
38brain @38brain

実績とか詳細な部分とかでアドバンテージがありますのでA社は大丈夫じゃないですかね。私もA社派ですw。もちろんシーケンサーはI社派w。 RT @ma_ko: @38brain @jyasuda1 確かにコストのこと考えるとそうですね. がんばれ, A社!

2012-02-23 15:39:28
Jun Yasuda @jyasuda1

@38brain @ma_ko でもどうしてfirst exonが落っこちやすいのかなあ?もしかしてfirst exonはGCリッチとか?もう一つはRTで伸ばしてとれるfirst exonは実際にはマイナーでメジャーなのはマッピングできていないとか?後者は無理筋だよね。

2012-02-23 16:08:47
まこ @ma_ko

@jyasuda1 @38brain GC rich が原因の1つでしょうね. ちゃんと bait が設計されている 1st exon における GC の比率と 1st exon の depth of coverage をプロットするとデータ出そうですが, やってません.

2012-02-23 16:37:49
まこ @ma_ko

@jyasuda1 @38brain あとは GC-rich なことがハイブリと PCR 増幅の両方で問題になってるのか, ということと, シーケンサーのランニングコストのせいで適切に条件ふるような豪勢なことがなかなかしづらかったというのもありますねw

2012-02-23 16:39:10
38brain @38brain

@ma_ko @jyasuda1 個人的には5'側って遺伝子発現(疾患関連という意味でも)に重要でぜひしっかり見たいので、両端のUTRを含んだv5よりも5'側だけ含んだv4.5みたいのが欲しいですね。3'UTRって余計に長かったりするしw。

2012-02-23 16:42:05
38brain @38brain

ちょっと計算したのでこの次のつぶやきから結果を書きますね。 RT @jyasuda1: @38brain @ma_ko いつも教えて君で恐縮ですが、遺伝子の何割が最初のエキソンがカバーできてないかんじですか?http://t.co/Fhjy9U92

2012-02-25 00:00:16
38brain @38brain

.@jyasuda1 @ma_ko とりあえず1000G exomeのIlluminaのデータから1サンプルチョイスして調べました。たしかIllumina 1000GのデータはA社のcaptureだったはず。 http://t.co/DgQrqFz7

2012-02-25 00:02:31
拡大
38brain @38brain

.@jyasuda1 @ma_ko まずdepthは確かにexon1でやや低い傾向にあります。しかし、depth=0の割合はexon1でも1.5%程度、むしろこのサンプルだけかもしれませんがexon2の方が0の割合が高いです。 http://t.co/FIOrWCAZ

2012-02-25 00:04:26
拡大