Technical Report
ハプロタイプ推定:英国バイオバンクコホートにおける高速で正確な長距離フェージング(相決定)
Nature Genetics 48, 7 doi: 10.1038/ng.3571
最近、アイスランド集団での広範な遺伝子型決定(ジェノタイピング)を利用して長距離にわたるフェージング(long-range phasing:LRP)を行うことにより、正確なデータ補完、そして標的サンプルのジェノタイピングアレイ遺伝子型決定に基づく希少変異の関連解析が可能となった。今回我々は、高速で正確なLRP手法であるEagleを開発したので報告する。これは、遠縁の個人間に共通する長距離(>4cM)かつ同祖的な(IBD)区画を利用することにより、非常に少人数規模に対してしか遺伝子型決定されていない集団に対して、フェージングを可能にするものである。我々はEagleを英国バイオバンクの約150,000サンプル(イギリスの人口の0.2%)に対して適用し、既存手法と比較して同等かもしくはよりよいフェージングの正確さに達するのに1桁から2桁速いことを確かめた(スイッチエラー率はおよそ0.3%で、10 Mb断片の大部分での完全なフェーズに対応している)。我々はまた、データ補完パイプライン中で予備的なフェージングとして使用したときの、下流のデータ補完結果を比較してみた。Eagleと、それと同等な計算コストに達するのに必要な既存の手法の組み合わせで比較した場合、Eagleの方が下流のデータ補完の正確性が改善していることを確認した。