Technical Report
遺伝的多様性:遺伝的多様性の確率論モデルを数百万人スケールへ拡大
Nature Genetics 48, 12 doi: 10.1038/ng.3710
集団遺伝学の主要な目的は、個人間の遺伝的多型の違いを定量的に理解することである。遺伝子型判定されたヒトの総数は、現在百万のオーダーに上っており、既存の手法でこのサイズのデータに適応できるツールは存在しない。この問題を解決するために我々は、TeraStructureを開発した。TeraStructureは、構造化されたヒト集団における遺伝的多様性のベイズモデルをテラオーダー(1012の実際の遺伝子型。例えば100万のSNPを100万人分)のサンプルサイズデータセットに適応させるアルゴリズムである。TeraStructureは、ベイズ推論を大きいスケールに適応させる方法であり、マーカーのサブサンプルを用いて、個人間に見られる潜在的な集団構造の評価を更新する。我々は、TeraStructureが、現在の大規模にサンプリングされたデータに対して、既存の手法と同様に処理を行えることを実証するとともに、シミュレーションを用いて、テラオーダーのサンプルサイズに対してもTeraStructureが常に正確であり、このサイズに用いることのできる唯一の手法であることを示した。