Technical Report

関連解析:量的形質および二値形質に適用可能な計算効率の高い全ゲノム回帰法

Nature Genetics 53, 7 doi: 10.1038/s41588-021-00870-7

表現型の数が何千にも及ぶコホートを対象としたゲノムワイド関連解析では、莫大な計算が必要であり、サンプル間の関係や集団構造を考慮に入れる場合は特にそうである。今回我々は、量的表現型および二値表現型に対して全ゲノム回帰モデルを適用するための新しい機械学習法REGENIEについて述べる。この手法は、既存の手法と比較して、統計的検出力を維持しながら、多数の形質を対象とした解析を大幅に高速化することができる。この手法は当然ながら多数の表現型の並列解析に対応しており、また、既存の手法ではゲノム全体の遺伝型行列をメモリーに読み込んでおく必要があるのに対し、この手法では局所的な遺伝型行列を読み込むだけで済み、結果として計算時間とメモリー使用量の大幅な削減が可能となっている。REGENIEには、症例数と対照数が大きく異なる表現型に適用できる、高速な近似Firthロジスティック回帰分析が実装されている。この手法は分散コンピューティングの長所を生かすのに理想的である。本研究では、40万7746人の英国バイオバンクのデータセットを用いて、この手法の正確さと計算上の利点を実証している。

目次へ戻る

プライバシーマーク制度