Article
非コード領域:発現や疾患リスクに及ぼすバリアントの影響についてのディープラーニングを利用したab initio予測
Nature Genetics 50, 8 doi: 10.1038/s41588-018-0160-6
ヒトの遺伝学、精密医療、進化生物学の主要な課題には、遺伝子発現を調節するコードの解読や、ゲノム多様性が転写に及ぼす影響の理解が含まれる。しかし、非コード領域の変異空間が大規模であるため、この理解は極めて困難である。本論文では、組織特異的な転写に及ぼす変異の影響をDNA配列からab initioに正確に予測できる、ディープラーニングに基づいたExPecto法を開発したことを報告する。対象となる変異には、希少な変異や、これまで観察されたことのない変異も含まれる。公開されていて利用可能な全てのゲノムワイド関連研究から得られた、疾患あるいは形質に関連する座位内の原因バリアントについて優先順位付けを行い、4つの免疫関連疾患についての予測を実験的に検証した。ExPectoのスケーラビリティーを生かし、in silicoでの飽和変異誘発を行って、ヒトRNAポリメラーゼIIが転写する遺伝子に関する調節領域の変異空間の特徴を明らかにし、また、1億4000万を超えるプロモーター近接変異のプロファイリングを行った。これにより、遺伝子発現に及ぼす進化的拘束や、変異が疾患に及ぼす影響のab initio予測を調べることが可能となった。ExPectoは、発現や疾患リスクのin silico予測のための、コンピューターのみを用いた方法である。