Letter
参照配列の遺伝的多様性を示す多様性グラフツールキットがリードのマッピングを改善する
Nature Biotechnology 36, 9 doi: 10.1038/nbt.4227
参照ゲノムはDNA塩基配列データの解釈を支援する。しかし、従来の線形参照は各座位について1種類しか表しておらず、集団内の多様性が無視されている。個体のゲノム配列が十分に表されていなければ、リードのマッピングに影響が及んで偏りが生じる。多様性グラフは、逆位や重複などの大規模な構造多型を含む集団の遺伝的多様性を簡潔に示す、双方向的なDNA塩基配列グラフである。これまでのグラフゲノムソフトウエアの実装は、スケーラビリティーやトポロジカルな拘束によって制限されてきた。本論文では、こうした構造を、ヒトゲノム規模で参照配列として作成、操作、使用するコンピューターによる方法のツールキットであるvgを紹介する。vgは、一般化された圧縮接尾辞配列を用いて任意の多様性グラフにリードをマッピングする効率的な方法であり、その精度は線形参照へのアラインメントを上回り、参照配列の偏りを効果的に排除することができる。こうした性能により、多様性グラフをギガ塩基スケールで、あるいはde novoアセンブリーのトポロジカルな複雑さでDNA配列解読の参照として使用することが実用的なものとなる。