Technical Report
ゲノムグラフ:ゲノムグラフを用いた高速で正確なゲノム解析
Nature Genetics 51, 2 doi: 10.1038/s41588-018-0316-4
ヒトの参照ゲノムは、塩基配列決定法で得られるリード配列を並べる上でスカフォールド(足場)を提供し、ゲノム解析における土台としての役割を果たしている。しかし現在のところ、共通の単一ハプロタイプを反映しているにすぎず、このことによって解析の精度が損なわれている。本研究では、グラフ化参照ゲノムの実装により、1260万のSNPと400万の挿入や欠失(インデル)を網羅する2800の2倍体ゲノムのリードをアラインメントすることが可能になることを報告する。36CPUコアのシステムを用いると、グラフ化参照ゲノムのパイプラインにかけることにより、1つの全ゲノム塩基配列決定試料が6.5時間で処理される。グラフ化した参照ゲノムを用いることにより、リードのマッピングにおける感度が改善され、特異度に影響を与えることなく、バリアントコールの再現率で0.5%の増加が生み出されることが明らかになった。ゲノムグラフに構造バリアントが組み込まれるようになるので、一元的なフレームワークで正確に遺伝子型決定を行えるようになる。また、ゲノムグラフを反復的に拡張することにより、バリアントコールの正確性が漸進的に増大することを示す。今回の実装は、ゲノムグラフによってゲノム解析のスケーラビリティーと正確性を大きく高められることを示す重要な進歩である。