Computational Biology
ヒト塩基配列データセットの統合はSNPおよび挿入欠失の遺伝子型判定の基準となる資源を提供する
Nature Biotechnology 32, 3 doi: 10.1038/nbt.2835
ヒトゲノム塩基配列解読を臨床に応用するには、ゲノムの数百万または数十億か所の部位の遺伝子型を既知の精度で出力する方法が必要である。既存の各種配列解読法およびアルゴリズムによる判定の間には相当数の不一致が存在するため、基準として利用可能な高精度のゲノム遺伝子型セットが求められている。本論文では、ゲノム・イン・ア・ボトル・コンソーシアムのパイロットゲノムであるNA12878に関して、一塩基多型(SNP)、挿入欠失およびホモ接合標準の遺伝子型判定を行う信頼性の高い方法を紹介する。我々は、5種類の配列解読技術、7種類のリードマッピング法および3種類の多型判定法から得た14組のデータセットを統合および調整することにより、任意の方法への偏りを最小化した。また、確実な遺伝子型判定が行われない領域を特定し、それを不確実性の原因に基づいてさまざまなカテゴリーに分類した。今回の遺伝子型判定は「ゲノム比較および分析試験」(Genome Comparison and Analytic Testing)のウェブサイトで一般公開されており、あらゆる方法の基準をリアルタイムで得ることが可能である。