Technical Report
非コード配列:集団の機能ゲノムデータから有害な非コード配列バリアントを高速でスケーラブルに予測
Nature Genetics 49, 4 doi: 10.1038/ng.3810
興味の対象となる表現型に影響を及ぼす遺伝的バリアントの非常に多くが、タンパク質をコードする遺伝子の外側に位置しているが、このようなバリアントを同定するための既存の手法は予測力が貧弱である。今回我々は、LINSIGHTという新しい計算手法を紹介する。この手法は、有害な適応結果を有していると考えられる変異の非コードヌクレオチド部位、すなわち表現型として重要と考えられる非コードヌクレオチド部位の予測を大幅に改善している。LINSIGHTは機能ゲノミクスデータの一般化線形モデルと分子進化の確率モデルとを組み合わせている。この手法は高速で、しかも高度にスケーラブルであり、現代のゲノミクスで得られる「ビッグデータ」の適用を可能にしている。我々はLINSIGHTが、遺伝性疾患に関連するヒトの非コード配列バリアントを同定する手法として現在最も優れているものよりもさらに優れたパフォーマンスを達成できることを示した。加えて、我々はヒトエンハンサーのアトラスに対してLINSIGHTを適用し、細胞種、組織特異性、関連プロモーターの制約にもとづいたエンハンサーの適応結果についても示す。