Technical Report

ゲノム解読:集団参照グラフを用いたMHCにおけるゲノム推定の改善

Nature Genetics 47, 6 doi: 10.1038/ng.3257

ヒトの遺伝的な多様性についてはかなりのことが明らかになってきたが、このような情報は新しいゲノムをアセンブルする際には、概して無視されがちである。そして、リード(解読の単位)を単一の参照配列に整列させるので、その結果、配列や構造に高い多様性を持つ領域での特徴付け(アノテーション)が貧弱となる事態を招いている。今回は、複数の参照配列や変異(バリアント)のカタログを組み合わせる集団参照グラフについて紹介する。新しい試料を用いたゲノムについて、高効率な隠れマルコフモデルを用いたグラフでのパスとして再構成することにより、異なるハプロタイプや追加のバリアント間で再度の組み合せを可能にした。この手法をヒト6番染色体における4.5 Mbの拡張MHC領域に適用し、8つのアセンブルされたハプロタイプ、既知の古典的なHLA対立遺伝子の配列、および1,000人ゲノムプロジェクトから得た87,640のSNPを組み合わせた。その結果、いかにこの手法が、ゲノム推定の精度の向上や、現在の参照配列のセットが実質的に不完全な領域の同定を改善するかを、シミュレーション、SNP遺伝子型判定、短いリードと長いリードのデータを用いて実証した。

目次へ戻る

プライバシーマーク制度