Analysis

ゲノムワイド関連解析:大規模遺伝学的関連解析における症例数と対照数の不均衡およびサンプル間の関連性の効率的な制御

Nature Genetics 50, 9 doi: 10.1038/s41588-018-0184-y

大規模バイオバンクを利用して何千もの表現型に関するゲノムワイド関連解析(GWAS)を実施する際、二値形質の症例数はたいていの場合、対照数よりも大幅に少なくなる。広く使用されているアプローチは線形混合モデルおよび最近提案されたロジスティック混合モデルであるが、症例数と対照数が不均衡な表現型の解析に用いた場合、いずれも第一種過誤率が高くなるので、性能が落ちるという問題点がある。ここでは、鞍点近似法を用いてスコア検定統計量の分布を補正する、一般化混合モデルによるスケーラブルで正確な関連解析法を提案する。このSAIGE(Scalable and Accurate Implementation of GEneralized mixed model)法は、症例数と対照数が極端に不均衡な場合でも正確なP値を得ることができる。また、SAIGE法では高度な最適化方法を採用して計算量を節約しており、それゆえ大規模バイオバンクを用いた何千もの表現型に関するGWASに適用可能である。SAIGE法を用いて、UKバイオバンクに登録されたヨーロッパ系英国白人参加者40万8961人のデータについて1400以上の二値表現型の解析を行い、SAIGE法が、症例数と対照数の不均衡およびサンプル間の関連性を調節し、大規模なサンプルデータの効率的な解析を可能にすることを示す。

目次へ戻る

プライバシーマーク制度