Technical Report

関連解析:混合モデルによる大規模データ関連解析のためのリソース効率の高いツール

Nature Genetics 51, 12 doi: 10.1038/s41588-019-0530-8

ゲノムワイド関連解析(GWAS)は、遺伝的バリアントと表現型の間の関連性を検出する目的で広く利用されている研究方法である。しかし、2つの主要な交絡因子である集団の層別化と血縁関係は、GWASにおいて検定統計量の増大をもたらす可能性があり、結果的に偽陽性の関連が検出されることになる。混合線形モデル(MLM)に基づいたアプローチを用いれば、サンプルの層別構造の問題に対処することができる。しかしながら、UKバイオバンク(UKB)のようなバイオバンク規模のサンプルを対象としたGWASでは、調べる形質の数が多い場合には特に、MLMベースの既存ツールで計算できる能力を超えてしまうことが多い。そこで我々は、バイオバンク規模のデータを対象としたGWASのためのMLMベースのツール(fastGWA)を開発した。fastGWAでは、主成分分析により集団の層別化を補正し、遺伝学的血縁係数の疎行列を用いて血縁関係に対処している。fastGWAの信頼性、頑健性、リソース効率の高さを大規模なシミュレーションにより実証した。また、UKBの45万6422人から得た試料を対象として、2173の形質についてアレイおよびインピュテーションによる遺伝子型判定を行った解析にfastGWAを適用した。さらに、全エキソーム塩基解読されたUKBの4万6191人由来のサンプルを対象として、2048の形質についてfastGWAを適用した。

目次へ戻る

プライバシーマーク制度