Letter

高性能の変分自己符号化器によるメタゲノムのビニングおよびアセンブリーの改善

Nature Biotechnology 39, 5 doi: 10.1038/s41587-020-00777-4

最近のメタゲノムビニングの進歩にもかかわらず、メタゲノムデータから微生物種を再構築することは今なお容易でない。本研究では、クラスター化の前に高性能の変分自己符号化器を用いて同等量塩基配列とk-mer分布情報を符号化するプログラムVAMB(variational autoencoders for metagenomic binning)を開発した。変分自己符号化器は、データセットの事前情報がなくともこれらの2種類のデータを統合できることが示された。VAMBの性能は既存の最先端のビニングプログラム(binner)よりも優れており、模擬データと実際のデータでは、再構築されるほぼ完全な(near-complete;NC)ゲノムがそれぞれ29~98%と45%多かった。またVAMBは、平均ヌクレオチド同一性(average nucleotide identity;ANI)が最大99.5%に達する近縁株を分離することが可能であり、ヒト腸マイクロバイオーム試料1000点のデータセットから、255のBacteroides vulgatus、99のBacteroides doreiの試料特異的なNCゲノムを、2つの異なるクラスターとして再構築した。我々は、このデータセット由来の2606のNCビンを用いることにより、ヒト腸マイクロバイオームの微生物種が異なる地理分布パターンを有することを明らかにした。VAMBは標準的なハードウエアで利用することができ、https://github.com/RasmussenLab/vambから無料で入手可能である。

目次へ戻る

プライバシーマーク制度