Article
超ロングリードによるヒトゲノムのナノポア塩基配列解読とアセンブリー
Nature Biotechnology 36, 4 doi: 10.1038/nbt.4060
ナノポア塩基配列解読装置MinION(オックスフォード・ナノポア・テクノロジーズ社)によるヒトGM12878 Utah/Ceph細胞系列の参照ゲノムの塩基配列解読およびアセンブリー結果を紹介する。91.2 Gbの配列データが得られ、理論上のカバー率は約30倍であった。参照ゲノムに基づくアラインメントによって、大きな構造多様体およびエピジェネティックな修飾が検出された。ナノポアのリードのみによるde novoアセンブリーで連続したアセンブリーが得られた(NG50は約3 Mb)。我々は、超ロングリード(N50 > 100 kb、リード長は最長882 kb)を得るプロトコルを開発した。この超ロングリードによって5倍のカバー率が上乗せされ、アセンブリーの連続性は2倍以上となった(NG50は約6.4 Mb)。最終的にアセンブリーされたゲノムは、サイズが28億6700万塩基であり、参照配列の85.8%をカバーする。補完的なショートリードの配列解読データを組み入れると、アセンブリーの正確度は99.8%を超えた。超ロングリードによって、4 Mbの主要組織適合遺伝子複合体(MHC)座位全体のアセンブリーとフェージング解析、テロメアの反復配列長の測定、ならびにヒトゲノム参照配列アセンブリーGRCh38中の空白の解消が可能となった。