@n0rr 自分はRefとそこそこ違う系統を読んでいるので、SHRiMP2でスコアが低いアラインメントまで出力すると、進化距離が遠い重複領域由来のリードまでもが重なってマップされている感じです。BWAでも最近重複して少し置換が入っている程度であれば見えるんじゃないでしょうか?
2013-08-16 11:21:01@YoshiKawahara 複数株あるんですけど、そもそも多型部位のヘテロザイゴーシティの値に株間で相関があるんですよね... もっとも、謎のデータトリミングを受けてるデータなので、色々あやしいところあるんですがw
2013-08-16 11:26:57@n0rr @mkasahara ヘテロサイトが固まってある領域を目で見ていたら、変異入りのリードは全部片側から読まれていたりしてギョッとしました。ヘテロの原因の全てでは全然ないんですけど、ストランドバイアス怖いですね。
2013-08-16 11:28:05@mkasahara @n0rr MiSeq250bpのリード50本ぐらい張り付いている領域で、半分ぐらいのリードが10個以上共通したミスマッチを持っていて、ヘテロサイトが固まった領域になっていたのですが、変異持ちのリードは全部片側ストランド由来でした。。
2013-08-16 11:30:36@YoshiKawahara @mkasahara @n0rr Illumina特有の配列特異的エラーだと思います。一致して変化してる塩基がリードの一つ上流と同じになってませんか?
2013-08-16 12:25:46@n0rr @mkasahara @YoshiKawahara Google Scholar で Illumina SSE で一番目に出て来ます ご参考までに
2013-08-16 13:44:34@shure_geru @n0rr @YoshiKawahara そのペーパー、特異的エラーを起こすもう一つの大きな原因であるPCRスリップの話が抜けているので、それも。
2013-08-16 14:14:04@shure_geru @YoshiKawahara @n0rr XYX の塩基が XXX になるのが一番多いモードで、 XYZ が XXZ になるのが次ぐらいですかね。bipolymer の下流では ABCDAF が ABADAF になったり、いろいろですね。
2013-08-16 14:17:47