Article
関連解析:さまざまな祖先系からなる関連解析における連鎖不平衡の高度に疎なスパースモデル
Nature Genetics 55, 9 doi: 10.1038/s41588-023-01487-8
連鎖不均衡(LD)は、近くに存在する遺伝的バリアント間に見られる相関である。遺伝学的関連解析では、LDは大規模な相関マトリックスを用いてモデル化されることが多いが、この手法は、特に祖先系が多様な解析では非効率的である。本論文では、LDを極めて疎かつ効率的に表したLDグラフィックモデル(LDGM)を紹介する。LDGMはゲノム規模の遺伝子系統樹から導かれており、LDGMにおける対立遺伝子間の統計学的関係は、ハプロタイプ間の系統関係に対応している。我々は、5つの祖先系グループにおける1800万のありふれたバリアント(マイナー対立遺伝子頻度> 1%)に対するLDGM、および祖先系に特異的なLDGMの精度マトリックスを公開し、その精度を検証したところ、一般的に使用されるLDマトリックス計算の実行時間が桁違いに向上することを実証した。また、非常に高速に行える多祖先系の多遺伝子予測方法であるBLUPx-ldgmに実装すると、参照LD相関マトリックスに基づく同様の方法よりも優れた性能であることが示された。LDGMにより、多様な祖先系を対象とした何百万ものバリアントや個人が含まれる遺伝学的関連データを扱える洗練された手法が可能になる。