Letter
変異の効果予測:ディープニューラルネットワークを用いたDNA塩基配列からの個人の遺伝子発現予測に関する性能評価により、不十分な点が明らかになる
Nature Genetics 55, 12 doi: 10.1038/s41588-023-01524-6
深層学習は、最近、ゲノムDNAから遺伝子発現を予測するなど、さまざまなゲノム調節に関する課題において最先端の技術となっている。従ってこれらの方法は、個人のゲノムに見られる遺伝的多様性の全容を解明する上でも重要なツールとなることが期待される。その性能を評価する際、これまではゲノム領域間の遺伝子発現に関する予測性能を評価していたが、個人間での遺伝子発現を予測する能力の評価、つまり、個人DNAの解釈における有用性を直接評価する体系的な研究は存在しない。本論文では、ROSMAP研究の839人に関する全ゲノム塩基配列と遺伝子発現のデータの対を用いて、既存方法の個人間での遺伝子発現のバリエーションの予測性能をさまざまな遺伝子領域において評価した。我々の評価から、既存方法はバリアント効果の正負の方向性を正確に予測することには限界があることが明らかになった。我々は、この限界が、学習した塩基配列モチーフの文法が不十分であることに起因することを明らかにし、性能を向上させるための新しいモデル訓練戦略を示す。