岩手医大教授でヒトゲノム計画の生き字引の清水厚志先生のヒトゲノム計画についての振り返りコメント

T2T(ヒトゲノムの、染色体の末端から末端まで完全に解読する)計画の完成によせて、ゼロから始まったヒトゲノム国際コンソーシアムの苦闘について、実際にかかわっていた清水先生による振り返り。ご本人から承諾をいただいています。
14
厚志 @atsushi_ngs

2018年11月にMinIONでGM12878の全ゲノムが解析されました。こちらもGapがありますが別手法の長鎖シークエンサーでも全ゲノム解析が可能であることを証明できました。 41/n #History_of_HGP_T2

2022-04-05 18:32:12
厚志 @atsushi_ngs

2019年10月にPacBioを用いたhigh-fidelity (HiFi) 法でHG002/NA24385の全ゲノムが解析されました。長鎖シークエンサーは長く読めるが精度が低いことが課題でしたがHiFi方は環状の鋳型DNAを何度も読むことでそこそこ長く、精度良く読める技術です。 42/n #History_of_HGP_T2

2022-04-05 18:33:29
厚志 @atsushi_ngs

だいぶ現在に近づきました。2020年1月にとうとう初のヒト染色体1本の完全解読がなされました。X染色体です。 43/n #History_of_HGP_T2

2022-04-05 18:34:33
厚志 @atsushi_ngs

最後のアプリケーションです。 2020年4月に複数の機器・手法を組み合わせたHiCanu法で複数の解読困難領域が解読されました。 44/n #HGP_T2の歴史

2022-04-05 18:35:35
厚志 @atsushi_ngs

2021年5月。ヒト8番染色体の完全解読の発表と合わせてヒトゲノム “完全” 解読論文のプレプリントが公開されました。プレプリントは雑誌の投稿の前にオリジナル論文であることを表明したり早い成果共有の前に使われます。査読前ですが内容を知ることができます。 45/n #History_of_HGP_T2

2022-04-05 18:38:01
厚志 @atsushi_ngs

そして皆様も知る通り、2022年4月にヒトゲノム “完全” 解読の論文発表とY染色体の “完全” 配列データの公開がなされました。 あ、46でキリがいいですね。 ということでヒトゲノム計画とT2Tを振り返ってみました。 46/n #History_of_HGP_T2

2022-04-05 18:39:58
厚志 @atsushi_ngs

@a2YR22O3aftuHkr 読んでいただいてありがとうございます!

2022-04-05 19:14:55
厚志 @atsushi_ngs

@ma31stm シニアの昔話にお付き合いありがとうございました。

2022-04-05 19:15:46
厚志 @atsushi_ngs

@ma31stm 僕も久々に調べ直して理解が深まりました。 本文の読み込みはまだ途中なのでこれから楽しみながら読みます。

2022-04-05 19:56:13
厚志 @atsushi_ngs

@APlantScientist 役立って良かったです。特集号そのものはまだ咀嚼しきれてないので講義資料まで落とし込めたらツイートします。

2022-04-06 07:40:14

その後の追加と詳細な技術論(T2Tフラッグシップ論文の解説)

厚志 @atsushi_ngs

多くの方にヒトゲノム完全解読に至るまでの僕の主観的な振り返りを目に止めて頂いたようですが、日本のヒトゲノム研究をPIとして永年牽引した榊 佳之先生の総説がオープンアクセスで読めますのであまり光が当たらない日本のHGPへの貢献を知りたい方はぜひこちらを一読下さい。 jstage.jst.go.jp/article/pjab/9…

2022-04-07 09:06:58
厚志 @atsushi_ngs

さて、自分の中でだいぶ咀嚼できたので先日のヒトゲノム完全解読論文の概要を備忘録として記載。6本のシリーズ論文として特集されているがまずは主論文のみ。 これまでの20年で機能的な解明は進んでいるので基本的には技術的なマイルストーン論文。 1/n #HGP_T2T bit.ly/3NVwE2O

2022-04-07 17:36:35
厚志 @atsushi_ngs

まず振り返り、HGPではヒトゲノム完全解読ではなかったが、そもそも論文タイトルは「Finishing the euchromatic sequence of the human genome.」でもともとHGPの解読対象はユークロマチン領域だった。 2/n #HGP_T2T go.nature.com/3raQDRD

2022-04-07 17:39:19
厚志 @atsushi_ngs

HGPのゴールは遺伝子地図の作成、ゲノム物理地図の作成、ユークロマチンの95%以上を99.99%以上の精度で解読、シークエンシングコストの削減、一塩基多様体の同定、遺伝子同定、モデル生物のゲノム解読、遺伝子機能解析でこれは2003年に達成した。 3/n #HGP_T2T

2022-04-07 17:40:44
厚志 @atsushi_ngs

解読できなかったのはヘテロクロマチン(セントロメアとテロメア)とクローニング困難領域とセグメント重複。まずはなぜ当時読めないか説明。 4/n #HGP_T2T

2022-04-07 17:42:36
厚志 @atsushi_ngs

HGPでは階層的ショットガン法を選択したため、BACに一旦クローニングし、ついでpUCベクターにサブクローニングしてからシークエンシングを行った。そのため特にCAに富む領域が含まれる場合に欠失を起こした。図は20年前くらいのプレゼン資料。37℃で落ちるので25℃で培養したら読めた。 5/n #HGP_T2T pic.twitter.com/L7v18vRjnq

2022-04-07 17:47:10
拡大
厚志 @atsushi_ngs

次がセグメント重複。思い入れがあるので丁寧に。 セグメント重複は90%以上の同一性を持つ1 kbp以上の配列で、特に大型類人猿で高度に複雑化した構造を取っている。大規模な転座や逆位による遺伝性疾患の原因となるが、健常人でも見られる一般的なゲノム多型も存在する。進化トリガー。 6/n #HGP_T2T pic.twitter.com/1eXh02viTk

2022-04-07 17:52:06
拡大
厚志 @atsushi_ngs

たとえばここはGOR遺伝子がめっちゃならんでてギャップを閉じれず。19番染色体から飛んできた配列が8番でずらずら増えてた。すごい頑張ったが100kb以上あるのでたかだか800bpのキャピラリーシークエンサーでは歯たたず。 7/n #HGP_T2T pic.twitter.com/UvJWa0oNrD

2022-04-07 17:57:20
拡大
拡大
拡大
拡大
厚志 @atsushi_ngs

こちらはもっとひどくて同じ色の矢印が99%同じ配列を示してるけど父母由来染色体でひっくり返ってたり数違ってたりでそっくりな2つのジグゾーパズルが混ざってる感じ。これも解けずにドイツのグループとやれたところまでで論文に。 bit.ly/3jbikVW 8/n #HGP_T2T pic.twitter.com/s6eKopJw3P

2022-04-07 18:03:58
拡大
拡大
拡大
拡大
厚志 @atsushi_ngs

ヒトにはこういうセグメント重複が山程あって大規模なゲノム多様性を生んでいる。どうもコア配列があって、染色体を飛び回って飛んだ先で周辺の配列を巻き込んで増えて、また飛んだりしてゲノムを複雑化してる。 9/n #HGP_T2T

2022-04-07 18:08:01
厚志 @atsushi_ngs

次がヘテロクロマチン。セントロメア(Centromere)はヒトのほとんどの染色体ではほぼ中央に位置してて、セントロメアには50~70%程度の多様性を持つ171塩基のalpha satellite 配列 (aSat)などの短い繰り返し配列が存在する。たとえば171塩基の配列Aと171塩基の配列Bと171塩基の配列C。 10/n #HGP_T2T

2022-04-07 18:10:52
厚志 @atsushi_ngs

これが同一方向に複数並んだユニット「ABC」を形成して、この一連のユニットがほぼ同一の配列ユニットとしてさらにABC-ABC-ABCのようにHOR (Higher Orfer Repeat)を形成している。細胞分裂の際にはHORにCentromere Protein A (CENP-A)などが結合し、動原体(kinetochore)を形成する。 11/n #HGP_T2T

2022-04-07 18:12:06
厚志 @atsushi_ngs

それからテロメアはTTAGGGで、はじっこはループ状構造を取り、保護されてると考えられている。ヒトの誕生時のテロメア長は10 kbp程度で、細胞分裂を繰り返すたびに短くなる。テロメア近傍領域は組み換えのホットスポットで、染色体間での相同性が非常に高くて読んでてもどこかわからず 12/n #HGP_T2T

2022-04-07 18:14:18