Article
COVID-19:UShER(Ultrafast Sample placement on Existing tRees)はパンデミック下にあるSARS-CoV-2のリアルタイム系統樹解析を可能にする
Nature Genetics 53, 6 doi: 10.1038/s41588-021-00862-7
ヒト集団の間で重症急性呼吸器症候群コロナウイルス2(SARS-CoV-2)が蔓延している今、ウイルスのゲノム塩基配列の前例のない蓄積により、「ゲノムコンタクトトレーシング(ゲノム塩基配列に基づく接触者追跡)」の新時代が到来している。つまり、ウイルスのゲノム塩基配列を調べることで、局地的なウイルス伝播の動態を追跡するのである。しかし、SARS-CoV-2の系統樹の規模はすでに非常に大きくなっており、今後も何倍にも拡大していくことは間違いない。そのため、系統樹に新しい塩基配列を配置する作業が、ゲノムコンタクトトレーシングをリアルタイムで行う上での障害となっている。この問題を解決するために、我々はウイルスの推定進化史を効率的にコード化するツリー型のデータ構造を構築した。このアプローチにより、新しいサンプルの系統樹への配置とデータ可視化の速度が大幅に改善され、リアルタイムの接触者追跡という制約下で配置を完了できることが実証された。我々の方法は、参照系統樹を最新のものに更新された形で維持するという重要なニーズに対応できるものである。これらのツールは、カリフォルニア大学サンタクルーズ校のSARS-CoV-2ゲノムブラウザーを通じて研究コミュニティーに利用可能であり、ウイルスの新しいゲノム塩基配列に含まれる情報を、拡大を続ける分子生物学データと構造生物学データと迅速に相互参照することを可能にする。本稿で述べる方法は特に、世界中の研究室で行われているSARS-CoV-2の研究とゲノムコンタクトトレーシングを加速化すると考えられる。