Technical Report
集団遺伝学:フェーズ化されていない数百の全ゲノムから集団の歴史を推定する強固かつスケーラブルな方法
Nature Genetics 49, 2 doi: 10.1038/ng.3748
最近、系統解析に組換えを組み合わせた推定法により、これまでになく詳細に過去の集団の歴史を明らかにできることが示された。しかし、これらの手法はサンプルサイズの変化にほとんど対応しておらず、ごく最近の時代に限定されている。また、この手法はフェーズ化されたゲノムを必要とし、推定結果を根本的にゆがめてしまうようなスイッチエラーが含まれている。今回、我々は新しい統計ツールであるSMC++について報告する。SMC++は、フェーズ化されていないゲノムしか必要としないが(解析結果はフェーズ化に依存しない)、既存の手法よりも桁違いに多いサンプルを解析する能力がある。SMC++は、集団サイズの歴史と集団が分岐した時間を結びつけて予測可能である。また、推定の誤りを大幅に減らすために、新しいスプライン正則化法を採用している。我々はSMC++を用いて、アフリカとユーラシアの1,000以上のヒトゲノム、アフリカのキイロショウジョウバエ集団の数百のゲノム、オーストラリアのキンカチョウとオナガキンセイチョウ集団の数十のゲノムについて、塩基配列決定データの解析を行った。