遺伝学:gnomADプロジェクトによるゲノム解釈の向上
Nature
ゲノムデータを集約したデータベースであるGenome Aggregation Database(gnomAD)に、ヒトの遺伝的バリアントの公開カタログとして現在知られている最大のものが登録された。このカタログは、ヒトの遺伝子の機能に関する理解を深め、新たな疾患関連遺伝子を発見するための情報源となる。このデータセットは、14万人以上の協力者のサンプルから収集されたもので、このほど、このデータセットの適用について記述された論文が、Nature、Nature Communications、Nature Medicine に掲載される。
ヒトゲノムを構成する遺伝子の大部分は、機能が明らかになっていない。遺伝子の機能を探索する方法の1つは、変異によって遺伝子の機能が破壊された時に何が起こるかを観察することである。こうした遺伝的バリアントは通常、有害な結果をもたらすことが多く、その発生頻度は非常に低い。大規模な遺伝子の塩基配列解読研究は、この機能喪失型バリアントの影響を調べる機会であり、その結果、ヒトの生物学的特性と疾患に関する重要な手掛かりが得られる可能性がある。
Nature に掲載される概括論文で、Konrad Karczewskiたちは、全エキソーム塩基配列解読データセット12万5748件と全ゲノム塩基配列解読データセット1万5708件から予測される機能喪失バリアント44万3769種のカタログを提示している。Karczewskiたちは、正常な機能を阻害するタンパク質を産生すると予測されるこれらのバリアントが、生理的には全く(ほとんど)影響を及ぼさないのか、あるいは重篤な健康問題を引き起こすのかを評価した。また、Nature に掲載される別の2編の論文では、このデータセットを用いて、構造バリアントに関する情報源が構築され、遺伝子の欠失、重複や逆位の影響が評価されている。
今回の一連の論文では他に、ヒトの機能喪失バリアントを用いて、薬物標的候補を評価した論文、遺伝的バリアントの臨床解釈を向上させた論文、特定の機能喪失バリアントをより詳細に研究できることを明らかにした論文が掲載される。例えば、Nature Medicine に掲載される論文では、Nicola Whiffinたちが、パーキンソン病のリスク上昇に関連する遺伝子のバリアントを分析し、この遺伝子を標的とすることが安全な治療選択肢となる可能性を示している。
gnomADプロジェクトによって収集されたサンプルのサイズは、その先行プロジェクトExome Aggregation Consortium(ExAC)による6万例以上のエキソームの集約と比べると2倍以上である。Karczewskiらは、ヒトの予測される機能喪失バリアントの全てを突き止めるという目標には遠く及ばないものの、今回公開されたバリアントのカタログが、希少な遺伝病と一般的な遺伝病の評価を向上させる機会になるという見方を示している。
The largest-known public catalogue of genetic variants in humans, presented by the Genome Aggregation Database (gnomAD), provides a resource for improving our understanding of human gene functions and for discovering new disease-associated genes. The application of this dataset, collected from samples from more than 140,000 people, is described in a collection of papers in Nature, Nature Communications and Nature Medicine.
The function of most genes in the human genome is unknown. One way of discovering the function of a gene is to observe what happens when the gene is disrupted by a mutation. These variants often have adverse outcomes and are usually rare. Large genetic sequencing studies provide an opportunity to examine the effects of these loss-of-function variants, which could provide important insights into human biology and diseases.
In an overview paper in Nature, Konrad Karczewski and colleagues present a catalogue of 443,769 predicted loss-of-function variants in 125,748 whole-exome and 15,708 whole-genome sequencing datasets. The authors go on to assess whether these variants that are predicted to prevent normal functioning of the resulting protein would have little to no effect on physiology, or would cause serious health issues. Two accompanying papers in Nature use this dataset to create a resource of structural variants and assess the impact of deleting, duplicating, or even inverting the orientation of genes.
Other papers in the collection show how human loss-of-function variants can be used to evaluate candidate drug targets, improve the clinical interpretation of genetic variants, or investigate specific loss-of-function variants in more detail. For example, in Nature Medicine, Nicola Whiffin and colleagues analyse variants in a gene associated with increased risk of Parkinson’s disease, and the results suggest that targeting this gene is a potentially safe treatment option.
The size of the sample collected by the gnomAD project is more than twice that of its predecessor, in which more than 60,000 exomes were compiled by the Exome Aggregation Consortium (ExAC). However, Karczewski and colleagues note that they remain far from identifying all predicted loss-of-function variants in humans. Nevertheless, they suggest that the resource provides an opportunity to improve our assessment of rare and common genetic diseases.
doi: 10.1038/s41586-020-2308-7
「Nature 関連誌注目のハイライト」は、ネイチャー広報部門が報道関係者向けに作成したリリースを翻訳したものです。より正確かつ詳細な情報が必要な場合には、必ず原著論文をご覧ください。