Technical Report
関連解析の検出力:複数の表現型の遺伝学的研究における関連のスクリーニングのための共変量選択
Nature Genetics 49, 12 doi: 10.1038/ng.3975
ビッグデータにおいて関連を調べる際には多重比較の問題がつきものであり、検証の対象となる全ての関連のバックグラウンドに隠れて真のシグナルの検出が困難になる。ヒトの遺伝学的関連解析では効果の小さな多数のバリアントが表現型の多様性をもたらしていることが多く、シグナル検出の問題が特に顕著である。こうした弱い関連に対する検出力を向上させるために、現時点では、標準的な単変量の統計的手法のもとで標本サイズを大きくする戦略をとることにより対処している。このアプローチは一定の成果を挙げているが、近年のコホートで収集されている、複数の表現型の間で共有されている環境要因や遺伝要因の情報が活用できていない。今回我々が開発した「複数表現型研究のための共変量(CMS covariates for multiphenotype study)」法は、表現型の相関が見られた同一標本での検出力を向上させる方法である。実データおよび模擬データの解析から、相関する表現型を利用することにより、標本サイズを2倍にした場合を上回るレベルの検出力の向上をしばしば達成できることが実証されている。