「がん関連遺伝子のインシリコ配列飽和変異誘発」Nature論文のまとめ

がん遺伝子パネル検査などでの変異のがん発症への意義のために機械学習を用いた論文の紹介記事です。
4
Jun Yasuda @jyasuda1

以外にも今まで可視化されていないところとして、臓器単位での発がん過程で、同じ遺伝子が違う形で変異が入っている例などが紹介されている。図にもなっているのがEGFRで、肺癌ではキナーゼドメインが主だが、グリオーマでは細胞外ドメインが主であるなど。

2021-09-02 15:40:41
Jun Yasuda @jyasuda1

うまくモデルが機能している(ように見える)185遺伝子についてはCADDのような、すべての変異についてこのモデルを当てはめるというような解析もできる。ただ、答え合わせが出来ない(変異として未観測)なのであまり大したデータはない。変異発生確率のバイアスがかかっているとかである。

2021-09-02 15:43:52
Jun Yasuda @jyasuda1

変異発生確率に基づいて変異単位で各臓器での発生原因を探った図があって、これが少し面白い。例えばPIK3CAのE542K, E545Kの2つは臓器横断的にAPOBECの活性化が主たる原因と考えられるし、卵巣がんでの変異はHRD欠損、肺がんの変異は喫煙が影響しているなど、同じ変異でも特徴が読み取れるようだ。

2021-09-02 15:47:09
Jun Yasuda @jyasuda1

読み終えての感想だが、既知の遺伝子の意味付けをできるだけもりもりに盛り込んだ手法で、そのためのデータの準備の論文(3報)もインパクトが大きいものが多い。そういう意味では力作といっていいと思う。

2021-09-02 15:49:55
Jun Yasuda @jyasuda1

ただ、モデル構築の時に盛り込まれていない、主として未知の機能によってドライバーと化している遺伝子群については当然ながらモデルがうまく作れないので、見えてこないのだろうと思う。HLA-Aががんのドライバーとして出てくるのはちょっと意外。

2021-09-02 15:51:26
Jun Yasuda @jyasuda1

この手の論文でNatureのarticleになったというのは、がんの変異と変異シグナチャーの情報だけで185個もの遺伝子について変異のインパクト予測ができる、ということだと思う。

2021-09-02 15:54:23
Jun Yasuda @jyasuda1

臓器単位でもdriverかpassengerかの予測ができるようで、BRAFクラス3の変異だと大腸癌ではドライバーだが甲状腺がんでは非ドライバーと出てくる。こういったところは参考になりそうな気がする。

2021-09-02 15:55:13

大事な追加コメント

Jun Yasuda @jyasuda1

よく考えたら遺伝子数じゃなくて遺伝子癌種のペアが185ペアということで遺伝子数はboostDM のサイト上の80個程度なのだろう。それでも80遺伝子全部についてCRISPR で飽和変異誘発をやるのは大変だから、その意味でもいい論文だと思う。

2021-09-03 09:44:09