Technical Report
複雑形質:大規模なバイオバンクおよびコホートにおける領域基準型関連検定のためのスケーラブルな一般化線形混合モデル
Nature Genetics 52, 6 doi: 10.1038/s41588-020-0621-6
複雑形質に関連を有する遺伝子バリアントの特定には、サンプルサイズの極めて大きなバイオバンクが活用されている。希少バリアントを解析する際には、関連検定の検出力を高めるために、領域を基準に複数のバリアントをグループ化して情報集約型の検定を行うことが多い。しかし、計算量が膨大になるため、既存の領域基準型検定手法では、集団の構造化やサンプル間の関連などの交絡因子を考慮しながら数十万にも及ぶサンプルを解析することは不可能である。ここでは、数十万のサンプルを対象としたエキソームワイドあるいはゲノムワイドな領域基準型解析に適用可能で、二値形質における症例数と対照数の不均衡にも対処することができる、スケーラブルな一般化線形混合モデルに基づく領域基準型の関連検定手法、SAIGE-GENEを提案する。本研究では、大規模なシミュレーション研究と、HUNT研究における6万9716のノルウェー人サンプルおよび英国バイオバンクにおける40万8910の英国白人サンプルの解析を通じて、SAIGE-GENEにより大規模なサンプルデータ(N < 400,000)を第Ⅰ種過誤率を適切にコントロールしながら効率的に解析できることを実証する。