Letter

深層ニューラルネットワークによるユニバーサルなSNP・短鎖インデルバリアント検出法

Nature Biotechnology 36, 10 doi: 10.1038/nbt.4235

塩基配列解読技術は急速に進歩しているが、エラーを含む数十億本の短い配列リードに由来する、単体ゲノムに存在する遺伝的バリアントを正確に検出することは今なお困難である。今回我々は、深層畳み込みニューラルネットワークに推定されるバリアントを取り巻くリードのパイルアップ画像と真の遺伝子型の検出との統計的関係を学習させることで、整列させた次世代配列解読法リードデータ中の遺伝的変動を検出できるようになることを明らかにした。DeepVariantと名付けたこの方法は、現在最先端のツールよりも優れている。学習済みのモデルはゲノムビルドおよび哺乳類種の全体を一般化するため、ヒトの豊富なグラウンドトゥルースデータの恩恵がヒト以外の配列解読プロジェクトにも及ぶ。さらにDeepVariantは、学習により、10X GenomicsやIon Ampliseqのエキソームに由来する大規模な全ゲノムなど、多様な配列解読技術および実験デザインの中のバリアントの検出が可能となることが示され、高度に自動化された一般化可能な技術の利用がバリアントの検出に有益であることが明らかになった。

目次へ戻る

プライバシーマーク制度