Article

二倍体染色体のテロメアからテロメアまでのアセンブリを行うVerkko

Nature Biotechnology 41, 10 doi: 10.1038/s41587-023-01662-6

先頃、テロメア・ツー・テロメア・コンソーシアム(Telomere-to-Telomere consortium)は、最初の真に完全なヒトゲノム塩基配列をアセンブリした。極めて複雑な繰り返し配列を解読するに当たり、このプロジェクトは、オックスフォード・ナノポア(Oxford Nanopore)塩基配列解読の超ロングリードとパックバイオ(PacBio)の長く正確な高忠実度リードから構築した高解像度アセンブリグラフを手作業で組み合わせることに依拠した。完全な二倍体ゲノムのアセンブリを行うためのグラフに基づく反復型パイプラインであるVerkkoでは、その戦略の改良と自動化を行った。Verkkoは、長く正確なリードから構築された多重de Bruijnグラフに始まり、超ロングリードとハプロタイプ特異的マーカーを組み込むことでこのグラフを徐々に単純化する。その結果、両ハプロタイプのフェージングされた二倍体アセンブリが得られ、染色体の多くでテロメアからテロメアまでの自動アセンブリが行われた。HG002ヒトゲノムでVerkkoを実行すると、二倍体染色体46本のうち20本は、99.9997%の正確度でギャップなくアセンブリされた。二倍体ゲノムの完全なアセンブリは、網羅的なパンゲノムデータベースの構築や染色体規模の比較ゲノミクスに向けた極めて重要なステップである。

目次へ戻る

プライバシーマーク制度