@YoshiKawahara 2っぽくなりました 1.645833333 1.777777778 1.590909091 1.181818182 1.708333333
2013-08-15 15:40:29@YoshiKawahara そんなん(数にもよるけど)よくあるよ!ちゃんとシングルコロニーからDNA取ってますか?取っていて更に量が <10カ所/Mbp ぐらいだとたいていは培養中に入った変異。
2013-08-15 16:01:31@YoshiKawahara @n0rr @ayaKT ストランドの偏ってないか見ておいた方が良いですよ。片側から主に出ていたら系統的シークエンシングエラー
2013-08-15 16:10:51@YoshiKawahara そのエリアのマップ率が低いのであれば、リファレンスが間違ってる辺りはマップ率がさがる↓というのは納得できます。が、いまは1塩基で数えてるので...
2013-08-15 16:11:27@mkasahara シングルコロニーからじゃないので、すでにバラついている集団を読んでいる可能性もあるんですが、アリル頻度が0.5ぐらいのが多かったので気になったんですよね。あと、自分のデータでは数百〜千bpぐらいの領域に数十個固まってあったりするので重複の可能性が高いかなと。
2013-08-15 16:12:45@mkasahara @ayaKT @YoshiKawahara たまに偏ってるやついますね。系統的シークエンシングエラーってどういうことでしょうか?
2013-08-15 16:15:33@YoshiKawahara それ、カバー率(depth)が高くなっていなければ第一感はシークエンシングエラーの可能性高いですね。ストランドが偏っていないか、(変異している鎖の)上流に1~2塩基の繰り返し配列がないかチェックしてみてください。
2013-08-15 16:24:36@n0rr @ayaKT @YoshiKawahara ION torrent, 454, Illumina は宜しくない配列を読むとリードの後半でいつも決まって同じエラーが出ることです。
2013-08-15 16:25:50@mkasahara @ayaKT @YoshiKawahara ありがとうございます。不得意な配列があって、片側はいつも読めない&読める側もエラーが同じところで起きる、ということでしょうか
2013-08-15 16:27:44@n0rr @ayaKT @YoshiKawahara んー、基本的には片側は正しく読める&もう片側は高確率で同じエラーになる、って感じです。どちらから読んでもいつも読めない配列はあんまり無いです。
2013-08-15 16:32:32@mkasahara @ayaKT @YoshiKawahara なるほど。高確率で片側だけエラーがでるから、ヘテロな変異になるんですね
2013-08-15 16:41:13@mkasahara ざっくり見た感じはそういう領域はカバー率も山のように盛り上がっているので重複かなと。でもストランドバイアスも要チェックですね。繰り返し配列もみてます。さすが達人!!
2013-08-15 16:44:55@YoshiKawahara カバー率も高いなら重複でしょうね。Mapping Quality とか見て(具体的なスレッショルドはツールにも寄るんですが) 低いリードを除いてから計算すると片方に決まることも多いです。
2013-08-15 16:47:11ヘテロな集団を読んじゃったときには1:1になることは少ない。でもストランドspecificな系統的シークエンシングエラーは最大で丁度1:1になるので、1:1に近ければ近いほどセグメント重複やら系統的シークエンシングエラーの可能性が高い。
2013-08-15 16:48:48@mkasahara SHRiMP2でミスマッチやIndelをかなり許してマップしていたせいで、重複領域由来のリードを重ねて貼り付けてしまっていたようです。BWAでの結果を見るとそういったヘテロの山が綺麗に無くなっていました。ツールやパラメータも気をつけないとですね。
2013-08-15 16:51:22リファレンスに貼り付けて、重複領域は切り分けて、アンマップリードをアセンブルして、とかやるんだったら最初っからdenovoアセンブルしたほうが楽な気がしてきた。数十Mのゲノムだし。すでに4000 scaffolds、N50 30kbにまでなったデータはあるのだし。
2013-08-15 16:59:36