Technical Report
遺伝子型判定:パンゲノムベースのゲノム推論が幅広い変異のクラスで効率的かつ正確な遺伝子型判定を可能にする
Nature Genetics 54, 4 doi: 10.1038/s41588-022-01043-w
典型的な遺伝子型判定のワークフローでは、遺伝的バリアントを特定する前にリードをリファレンスゲノムにマッピングしている。このようなアライメントを生成することは、リファレンスの偏りを生み出すとともに、かなりの計算機負荷を発生させる。加えて、ショートリードの長さは、反復配列からなるゲノム領域を解読する能力を制限する。これは、迅速なk-merベースの遺伝子型判定において特に困難をもたらす。本研究において、我々は新しいアルゴリズムPanGenieを提案する。これは、ハプロタイプ解析されたパンゲノムリファレンスとショートリードシーケンシングデータから得たk-merカウントを利用して、幅広い遺伝的多様性を遺伝子型判定するものである。我々はこの過程をゲノム推論と呼ぶ。マッピングに基づく手法と比較して、PanGenieは30倍のカバレッジを4倍以上速く達成し、テストしたほとんど全てのバリアントタイプとカバレッジでより優れた遺伝子型の一致を実現している。大きな挿入(50 bp以上)と反復領域のバリアントでは特に大きな改善が見られており、これらのタイプのバリアントをゲノムワイド関連研究に含めることを可能にする。PanGenieは、ハプロタイプが解明されたアセンブリーの量の増加を効果的に活用し、アライメントに基づくワークフローに比べて高速でありながら、これまで解明できなかったバリアントの機能的な影響を解明する。