Article
HISAT2およびHISAT-genotypeによるグラフ型のゲノムアラインメントおよび遺伝子型判定
Nature Biotechnology 37, 8 doi: 10.1038/s41587-019-0201-4
ヒト参照ゲノムはごく少数の個人を示すものにすぎず、遺伝子型判定に対する有用性は限定的である。本論文では、HISAT2(hierarchical indexing for spliced alignment of transcripts 2)と命名した方法を紹介する。これは、グラフ構造型のFerragina Manzini(FM)インデックスを用いる方法であり、DNA配列とRNA配列の両方のアラインメントを行うことができる。我々はHISAT2を用いて、検索およびアラインメントに使用されるデータ構造にハプロタイプと組み合わせた1450万点以上のゲノムバリアントを組み込んだヒト参照ゲノムの拡張モデルを示し、検索を行った。シミュレーションデータセットおよび実際のデータセットを用いてHISAT2を評価したところ、ゲノムの集団を示す我々の方法と高速でメモリー効率が高い検索アルゴリズムにより、他の方法と比較して詳細で正確なバリアント解析が行われることが示された。我々は、HISAT2をHLAタイピングおよびDNAフィンガープリンティングに応用した。この2つの用途はどちらも、ハプロタイプを分けた遺伝子またはゲノム領域の解析を可能とするHISAT-genotypeソフトウエアの一部を形成している。HISAT-genotypeは他のコンピューター法よりも優れ、研究室による分析の性能に合致するか、それを上回っている。