Article
ゲノムアラインメントからパンゲノムのグラフを構築するMinigraph-Cactus
Nature Biotechnology 42, 4 doi: 10.1038/s41587-023-01793-w
パンゲノムの参照配列は、多様なハプロタイプとそのアラインメントの代表的なセットを通常はグラフとして蓄えることによって、参照ゲノムの偏りに対処する。バリアントコーラーによって特定された非参照対立遺伝子(alternate allele)を用いてパンゲノムグラフを構築することはできるが、ロングリード塩基配列解読法の進歩は広く利用可能な質の高いフェージング済みのアセンブリにつながりつつある。バリアントコールとは対照的に、アセンブリから直接パンゲノムグラフを構築する際には、さまざまなスケールで多型を表現するグラフの能力を利用する。本論文では、全ゲノムのアラインメントからパンゲノムを直接生成するパンゲノムパイプラインMinigraph-Cactusを紹介し、これがHPRC(Human Pangenome Reference Consortium)の90のヒトハプロタイプにも対応可能であることを示す。この方法は、あらゆる種類の遺伝的多型を含むグラフを構築する一方で、既存のマッピングツールと遺伝子型判定ツールの使用を許容する。我々は、パンゲノム内の解析に使用した参照ゲノムの質と完全性の影響を評価し、T2T(Telomere-to-Telomere)コンソーシアムのCHM13参照配列を用いることでMinigraph-Cactusの正確さが増すことを明らかにした。また、キイロショウジョウバエ(Drosophila melanogaster)のパンゲノムも実際に構築した。