岩手医大教授でヒトゲノム計画の生き字引の清水厚志先生のヒトゲノム完全解読論文(6報のうち、中心的な1報)の紹介

T2T(ヒトゲノムの、染色体の末端から末端まで完全に解読する)計画の論文について、ヒトゲノム計画の一員であり、今も日本人集団ゲノム解読にかかわっている岩手医大の清水先生による解説。https://togetter.com/li/1869290の続編です。ご本人から承諾をいただいています。
11
厚志 @atsushi_ngs

ついで完成配列の紹介。T2T-CHM13は3,054,815,472 bpの核DNAと16,569 bpのミトコンドリアゲノムを含む。GRCh38から238 Mbpの配列が追加または修正。内訳はセントロメア(76%)、セグメント重複(19%)、rDNA(4%)。 34/n #HGP_T2T

2022-04-08 17:27:24
厚志 @atsushi_ngs

遺伝子について。T2T-CHM13は、63,494の遺伝子と233,615の転写産物。そのうち19,969遺伝子(86,245転写産物)がタンパク質コード遺伝子と予測。385遺伝子(469転写産物)において683のフレームシフトが予測された。GENCODE遺伝子の263個(448転写物)がない。 35/n #HGP_T2T

2022-04-08 17:27:46
厚志 @atsushi_ngs

一方でT2T-CHM13のみ3,604個の遺伝子(6,693個の転写産物)が存在。ほとんどは既知遺伝子のパラログで48個(56転写物)が新規。 36/n #HGP_T2T

2022-04-08 17:28:02

T2Tによって向上するヒトゲノム解読の読み取り精度の向上。エキソン内はどれくらいなのか興味がわきますね。併せてrDNA領域解読によって新たに判明したこと。

厚志 @atsushi_ngs

多型について T2T-CHM13は、GRCh38に182 Mbpの追加と1.2 Mbpの間違った複製配列の除外により、バリアントコールが改善。1000ゲノムプロジェクトのデータでは1検体あたり数万件の偽バリアントが排除された。コピー数多型の推定精度も大幅向上。 37/n #HGP_T2T

2022-04-08 17:28:31
厚志 @atsushi_ngs

ここからrDNAのお話に戻る。アロセントリック染色体の13, 14, 15, 21, 22番染色体は互いに高度に相似。中央値で98.7%の一致率。非rDNA配列も96%はゲノムの他の場所で見つけることができる。ロバートソン転座が起きる理由もよくわかりますね。 38/n #HGP_T2T

2022-04-08 17:28:56
厚志 @atsushi_ngs

その他、アロセントリック染色体短腕のサテライト配列(HSat3, BSat, HSat1, HSat5など)、αサテライト配列(HOR)の説明。14番と22番染色体では64bpのAlu関連サテライトリピート「Walu」が重複。このあたりはFig.4見たほうが文章より早く理解できる。 39/n #HGP_T2T

2022-04-08 17:29:24

T2T計画から派生した医学に応用できる成果の例(顔面肩甲骨上腕型ディストロフィーの責任遺伝子遺伝子の全容解明など)

厚志 @atsushi_ngs

続いて今回のScienceの派生論文に言及した後にT2T-CHM13の有用性を紹介するために顔面肩甲上腕型筋ジストロフィー(Facioscapulohumeral muscular dystrophy: FSHD)の紹介。 40/n #HGP_T2T

2022-04-08 17:29:44
厚志 @atsushi_ngs

FSDH1 (OMIM #158900) の原因遺伝子であるDUX4は転写因子であり発生初期では発現するが、その後上流にある繰り返し配列がDNAメチル化されることで発現抑制をうける。しかし、いずれかの原因で繰り返し配列が短縮していると発現抑制が弱まり非制御発現してFSHDを発症する。 41/n #HGP_T2T

2022-04-08 17:30:16
厚志 @atsushi_ngs

この繰り返し配列にFSHD領域遺伝子1(FRG1)があり、本ツリーで何度か言及しているセグメント重複を起こしている。セグメント重複周辺はGRCh38でギャップになっているので今回のT2T-CHM13でFRG1の全体像が解明できた。 42/n #HGP_T2T

2022-04-08 17:30:36

清水さんによる総括、雑感、今後の展望など

厚志 @atsushi_ngs

最後に今後の課題。T2T-CHM13は46XXなのでY染色体がない(これは論文投稿後に進められ、最新のデータには含まれている)。今回解明した反復性の高い領域の構造多型の多様性についても多数の検体を使った解析が必要。 T2Tヒトゲノム完全解読論文の紹介は以上。 43/n #HGP_T2T

2022-04-08 17:31:15
厚志 @atsushi_ngs

ここからは雑感。まずはDr. Eichlerのセグメント重複論文を始めとする派生論文を読み込まないと今回の主論文だけではヒトの生物学的位置づけにどのような新規の発見があったかなどの理解ができない。週末読み進めよう。 44/n #HGP_T2T

2022-04-08 17:31:51
厚志 @atsushi_ngs

それから今後の展開。当然ヒト疾患解析の参照配列がT2T-CHM13に置き換わるので準備が必要。こちらはラボメンバーに指示済み。改定データを見るのが楽しみ。 45/n #HGP_T2T

2022-04-08 17:32:10
厚志 @atsushi_ngs

後は個人ごとの完全配列決定がどのように進むか。HGPの時は直後にワトソン、ベンターの個人ゲノム解読。その後、富裕層のSindan社のDan Stoicescuや女優のGlenn Closeが個人ゲノム解読サービスを利用したが、T2T-CHM13の実現は胞状奇胎を使えたことが大きかったので簡単にはできない。 46/n #HGP_T2T

2022-04-08 17:32:34
厚志 @atsushi_ngs

例えば廃棄予定の卵子から脱核して利用希望者の精子を用いて人工的に胞状奇胎を作り、複数の利用希望者由来胞状奇胎で完全配列を作ってから2倍体ゲノムを再現するのは技術的には可能だが超えなければならない倫理的課題がある。 47/n #HGP_T2T

2022-04-08 17:33:09
厚志 @atsushi_ngs

あるいは1細胞WGSのように精子を単離し、ONTと10xでハプロタイプを分離して決定した長鎖断片を組み合わせればかなり高精度に完全ゲノムを解読できそうだが現時点そのような論文は発表されていないので技術的なハードルが複数ありそう。 48/n #HGP_T2T

2022-04-08 17:33:35
厚志 @atsushi_ngs

しかし、すでに人類は1つの完全配列を手にしているのである程度の時間は必要だが近未来的に個人ごとの完全ゲノム配列を得られることは間違いない。特にセグメント重複の遺伝性疾患患者の完全配列決定を優先的に実施してくれることを期待している。 以上雑感でした。 49/n #HGP_T2T

2022-04-08 17:34:19
厚志 @atsushi_ngs

ヒトゲノム完全解読論文の付随論文5本を読了。 読み終えてみると主論文は本当にシリーズ論文のとっかかりで5つの論文は生き物としてのヒトの新しい発見が重厚なデータの積み重ねで示されており、消化するのに時間がかかりそう。ただ、疾患ゲノム解析の参照配列はすぐ置き換えたほうが良い。

2022-04-11 18:09:38