Technical Report
表現型予測:遺伝学的解析のための複数表現型予測法
Nature Genetics 48, 4 doi: 10.1038/ng.3513
遺伝的関連研究から、たくさんの生物学的発見がもたらされている。しかし、こういった研究は、多くの場合、一度に1つの形質と1つのSNPを解析するものであったため、データセットに内在する複雑な事象を捉えるには至っていない。高次元の複雑なデータセットについての遺伝子型‐表現型統合解析は、単純なゲノムワイド関連研究(GWAS)を大きく前進させる大きな可能性を秘めた重要な方法である。表現型の解析が高次元データセットの解析になると、統計学上のいろいろな問題が引き起こされることが考えられる。本論文では、試料間の関連性がいろいろなレベルで認められる研究において中心的な問題となっている失われた表現型について取り組んだ。すなわち、複数の表現型についての混合モデルを提案し、この混合モデルに適用する方法として、計算効率のよい、変分ベイズアルゴリズムを使用した。いろいろな生物のいろいろな形質由来のさまざまな実データセットとシミュレーションデータセットにおいて、統計学や機械学習の文献に登場した最先端の既存の方法よりも本解析法が優れており、関連シグナルを強めることができることを示した。