遺伝学:脊椎動物ゲノム研究のバックボーン
Nature
脊椎動物16種について、これまでに発表された中で完成度と質が最も高いゲノムコレクションについて報告する論文が、今週、Nature に掲載される。この研究は、脊椎動物ゲノムプロジェクト(Vertebrate Genomes Project)によってNature とNature Communications に掲載される一連の論文の一部であり、このプロジェクトは、全ての既知の現生脊椎動物種の高品質のゲノムを組み立てることを目的としている。これらのゲノムは、生物学、医学、生物多様性保全における根本的な疑問に取り組む上で役立つ可能性がある。
参照ゲノム配列は、ゲノムの機能に関する知見をもたらし、異種の比較を行う際に役立つ。しかし、第1世代の塩基配列解読技術とアセンブリー技術は、高コストで、大量の労働力と長い時間を必要とし、続く第2世代のショートリード塩基配列解読技術は、コストが削減され、所要時間が短縮されたものの、塩基配列解読リードが短くなったために断片的なアセンブリーが多く生成されて、ゲノムを正確に組み立てることが難しくなってしまったため、参照ゲノム配列に関する我々の知識には若干の空白部分がある。こうした問題の克服を可能にしたのが、ロングリード塩基配列解読技術の普及はじめとする数々の技術開発である。Natureに掲載される概説論文には、非常に正確でほぼ完全な参照ゲノム配列を組み立てる複数の方法について、それぞれの評価とさまざまな脊椎動物種目を代表する動物種の選抜集団への適用が記述されている。
今回、Erich Jarvisたちの研究チームは、最初に単一種(アンナハチドリ)で、複数のゲノム塩基配列解読法とアセンブリー法の評価を行い、続いて、その中で最良の方法を、哺乳類(例えばカモノハシ)、鳥類(例えばキンカチョウ)、爬虫類、両生類、魚類など、主要な脊椎動物綱を代表する計15種に適用した。この最適な方法については、塩基配列解読リードが長くなったことで、ゲノム塩基配列の品質が最もよくなり、生成されたアセンブリーでは、以前の参照ゲノム配列で見られたエラーが大幅に修正されていることが確認された。このように改善された参照ゲノム配列には、以前の参照ゲノム配列では欠落していた遺伝子や染色体全体が含まれている。これらの知見は、ゲノム進化に関する新たな手掛かりになる。
この論文に記述された脊椎動物ゲノムプロジェクトの研究アプローチについては、最適化への取り組みが今後も続く。このプロジェクトの最終的な目標は、既知の現生脊椎動物種(7万1657種)のそれぞれに、高品質で、エラーがほとんどなく、空白部分のない参照ゲノム配列を少なくとも1種類生成することにある。
A collection of the most complete and highest quality genomes for 16 vertebrate species reported to date is presented in a paper in Nature this week. The study is part of a collection of papers being published in Nature and Nature Communications from the Vertebrate Genomes Project, which aims to assemble high-quality genomes for all known living vertebrate species. These genomes could help to address fundamental questions in biology, medicine and biodiversity conservation.
Reference genomes offer insights into the functions of genomes and allow comparisons between species. However, there are some gaps in our knowledge, because first-generation sequencing and assembly techniques were costly, labour-intensive and slow, and the following second-generation short-read sequencing technologies (while being cheaper and faster) generated more fragmented assemblies owing to the use of shorter sequencing reads that made it hard to correctly piece together the genome. Technological developments, including — but not limited to — the availability of long-read sequencing technologies, have made it possible to overcome these issues. An overview paper in Nature describes the evaluation of approaches for assembling highly accurate and nearly complete reference genomes, and their application to a select group of species that represent various orders of vertebrate species.
Multiple genome sequencing and assembly approaches were first evaluated in one species, the Anna’s hummingbird, Erich Jarvis and colleagues report. They then applied the best-performing method to a further 15 species that represent the major vertebrate classes, including mammals and birds (such as the platypus and zebra finch, respectively) and reptiles, amphibians and fish. The optimized approach confirms that longer sequence reads maximize genome quality and the resulting assemblies correct substantial errors that were seen in earlier reference genomes. The improved genomes reveal genes and even whole chromosomes that were missing from previous references. These findings offer new insights into genome evolution.
Moving forward, the Vertebrate Genomes Project approach described here will continue to be optimized. The ultimate goal is to produce at least one high-quality, near error-free and gapless reference genome for each of the 71,657 known living vertebrate species.
After the embargo ends, the overview paper will be available at: https://www.nature.com/articles/s41586-021-03451-0
The landing page for the collection will be: https://www.nature.com/articles/d42859-021-00001-6
doi: 10.1038/s41586-021-03451-0
「Nature 関連誌注目のハイライト」は、ネイチャー広報部門が報道関係者向けに作成したリリースを翻訳したものです。より正確かつ詳細な情報が必要な場合には、必ず原著論文をご覧ください。