Article
医学的に重要な難しい常染色体遺伝子のためのキュレーションを経た多様性ベンチマーク
Nature Biotechnology 40, 5 doi: 10.1038/s41587-021-01158-1
医学的に重要な遺伝子には、その反復性と複雑さのために臨床の場での正確な分析が困難なものがある。Genome in a Bottleコンソーシアムは各種バリアントのベンチマークセットを提供しているが、そこでは約400の医学的に重要な遺伝子が反復性または多型性による複雑さのために除外されている。本論文では、ハプロタイプを分けた全ゲノムアセンブリーを用い、これらの395の難しい常染色体遺伝子のうち273遺伝子の解析を行った。このキュレーションを経たベンチマークにより、HG002ではヒト参照ゲノム配列GRCh37とGRCh38に関して1万7000を超える一塩基変異、3600の挿入欠失、および200の構造多型がそれぞれ示された。GRCh37またはGRCh38のいずれかでの誤った重複により、CBS、CRYAA、KCNE1などの医学的に重要な遺伝子のショートリードおよびロングリード技術による解析で、参照特異的なバリアントの見落としが生じることが示された。それらの誤った重複をマスクすると、バリアントのリコールは8%から100%に改善された。ハプロタイプを分けた全ゲノムアセンブリーによるベンチマークの作成は、全ゲノムを網羅する将来のベンチマークのプロトタイプとなる可能性がある。