Article
多遺伝子リスクスコア:ファインマッピングと複数の集団の訓練データを利用して多数の集団にわたる多遺伝子リスクスコアを改善する
Nature Genetics 54, 4 doi: 10.1038/s41588-022-01036-9
多遺伝子リスクスコアは、非ヨーロッパ系集団では予測精度が低下するため、医療格差を増幅させる。本論文では、2つの予測方法を組み合わせることで、多数の集団に対する多遺伝子リスクスコアを改善するPolyPred法を提案する。組み合わせた2つの予測方法は、機能情報に基づくファインマッピングを利用して、(タグ付け効果ではなく)原因となる効果を予測する新しい予測方法(これによって連鎖不平衡の差異に対処できる)と、公開されている予測方法のBOLT-LMM法である。我々は、標的とする非ヨーロッパ系集団で大規模な訓練試料が利用できる場合は、非ヨーロッパ系の訓練データをさらに組み込んだPolyPred+法を提案する。英国バイオバンクの英国人系集団の訓練データを用いて、英国バイオバンクの4つの集団において49の疾患/形質にPolyPred法を適用すると、BOLT-LMM法に対して、南アジア系集団における+7%からアフリカ系集団における+32%の範囲で多遺伝子リスクスコアによる予測精度の相対的な改善が観察され、これはシミュレーションと一致した。英国バイオバンクの英国人系集団の訓練データとバイオバンクジャパンの訓練データの両方を用いて、英国バイオバンクの東アジア系集団において23の疾患/形質にPolyPred+法を適用すると、BOLT-LMM法に対して+24%、PolyPred法に対して+12%の改善が観察された。PolyPred法およびPolyPred+法の要約統計量に基づく類似法では、同様の改善が達成された。