ハプロイドのリシークエンシングでヘテロな変異が見つかったときに考えること

@YoshiKawaharaさん,@n0rrさん,@ayaKTさん,@mkasaharaさんによる,ハプロイドのリシークエンシングでヘテロな変異が見つかる件についての議論.
1
Yoshihiro Kawahara @YoshiKawahara

普段イネを扱っているので、うっかりhaploidゲノムであることを忘れていた。なんだ、heteroって。。

2013-08-14 12:00:11
Yoshihiro Kawahara @YoshiKawahara

haploidの菌の胞子をもとにゲノムを読んでいるはずなのに、heteroっぽいサイトが結構ある。マッピングミス、もしくはリファレンスには無い重複領域のせいか??

2013-08-15 08:10:36
草💦30代障がい者教授(CEO) @n0rr

@YoshiKawahara あれなんなんですかねー?いまのところは除いて解析してるんですが… そういう部位周辺のカバレッジ見て見ますかね >重複領域

2013-08-15 08:33:14
Yoshihiro Kawahara @YoshiKawahara

@n0rr そちらでもそんな傾向見えてますか。初めてのhaploidゲノムなので最初は簡単なのかなぁと思ったのですが。。リファレンスとも結構違う系統なので意外と面倒そうです。また情報交換させて下さい。

2013-08-15 08:50:31
ayaKT @ayaKT

@YoshiKawahara @n0rr 微生物のリシーケンスでもよくあります。大抵サンプル調製の段階でヘテロな集団を取ってきちゃってるのが原因かも。植物とかだとどうなんでしょうね。でもリファレンスが大分違うと判断が難しいかもですね。

2013-08-15 09:10:18
草💦30代障がい者教授(CEO) @n0rr

@ayaKT @YoshiKawahara 何回かシングル化(単細胞で取って、そこから増やす)しててもヘテロ出るんですよ。しかも、ヘテロになってる奴のヘテロザイゴーシティの平均が0.5だったり... シングル化のあとにバリエーションが生まれたならもっと小さい値になると思うんですが

2013-08-15 09:34:58
草💦30代障がい者教授(CEO) @n0rr

@YoshiKawahara 僕もhaploidゲノムは簡単だろうとナメてかかったらまさかのヘテロで大爆発しているところですw リファレンスと近い系統なのですが、ばっちりヘテロ...

2013-08-15 09:36:22
草💦30代障がい者教授(CEO) @n0rr

Circumventing heterozygosity: sequencing the amplified genome of a single haploid Drosophila melanogaster embryo. http://t.co/2yjiL4PdzP

2013-08-15 09:42:40
Yoshihiro Kawahara @YoshiKawahara

@n0rr @ayaKT 今回の対象は子嚢菌なのですが、プレートで増殖、胞子形成までさせて、かき集めているので、確かにヘテロな集団なのかもしれないのです。ただ、アリル頻度が0.5ぐらいも多く、うーん、となっています。シングル化してもそんな感じなんですね。

2013-08-15 09:49:13
Yoshihiro Kawahara @YoshiKawahara

@ayaKT @n0rr ただ、リード全体のkmerの頻度分布を見ると、heterozygosityが高い時に観察される二峰性は見られないので、エラーか重複領域?と思っていました。

2013-08-15 09:54:25
Yoshihiro Kawahara @YoshiKawahara

あっ、まあそこまで頻度が高くないので二峰性にならないのは当たり前か。

2013-08-15 09:56:14
草💦30代障がい者教授(CEO) @n0rr

@YoshiKawahara @ayaKT こちらでも二峰性は見られていませんね。リファレンスと近い、複数の株を読んでいるのですが、SNP毎のヘテロザイゴーシティを株間で比較すると相関あったので、エラーよりかはリファレンスの問題かな、と考えています。

2013-08-15 09:56:48
草💦30代障がい者教授(CEO) @n0rr

"Because haploid genomes contain only one allele of each gene, heterozygosity is impossible."

2013-08-15 10:39:38
草💦30代障がい者教授(CEO) @n0rr

"but I found a lot of heterozygous snp in bacteria (50%)in my result of vcf file. What is wrong?" http://t.co/2midqD2cSl

2013-08-15 10:45:59
草💦30代障がい者教授(CEO) @n0rr

”Previously I would have discarded this since the heterozygous call indicates mis-mapping as the bam file confirms.” http://t.co/jPQuTsaK5k

2013-08-15 11:03:06
草💦30代障がい者教授(CEO) @n0rr

清酒酵母K7のヘテロザイゴシティーは染色体上に不均一に分布している. http://t.co/jMiN4aAyRc

2013-08-15 11:07:35
草💦30代障がい者教授(CEO) @n0rr

清酒酵母は2倍体だからアレだけど、ゲノム中のヘテロザイゴーシティの分布みるのは役に立つかも

2013-08-15 11:14:14
草💦30代障がい者教授(CEO) @n0rr

ヘテロザイゴーシティが分布してるっていうと変な気もする

2013-08-15 11:14:46
草💦30代障がい者教授(CEO) @n0rr

これ以上haploid genome のheterozygosity 調べても出てこない気がするから自分で調べる

2013-08-15 11:33:20
草💦30代障がい者教授(CEO) @n0rr

cov>5で集計 homo: hetZ>0.95, hetero: 0<hetZ<0.9 cov(hetero)/cov(homo) 1.47917 1.66667 1.29545 1.13636 1.45833

2013-08-15 15:16:12
草💦30代障がい者教授(CEO) @n0rr

@YoshiKawahara ヘテロになってる多型部位の方が、ホモになってる多型部位よりもカバレッジ厚いっすね。x2は全然行かないんですが

2013-08-15 15:18:02
Yoshihiro Kawahara @YoshiKawahara

@n0rr ほうほう、確かに。やっぱりRefと違う重複領域の可能性大ですかね。homoが>0.95と厳しい割に、heteroの基準がゆるめな気がするのですが、0.4<hetZ<0.6とかにしたらx2に近づいたりして?

2013-08-15 15:21:26
Yoshihiro Kawahara @YoshiKawahara

@n0rr 作業振っちゃってすみません!

2013-08-15 15:24:07