Resources
小バリアントコールとリファレンスコールを正確にベンチマーキングするためのオープンリソース
Nature Biotechnology 37, 5 doi: 10.1038/s41587-019-0074-6
塩基配列解読法およびバイオインフォマティクス法を開発して最適化し、その性能を評価するには、基準(ベンチマーク)となる小バリアントのコールが必要である。今回我々は、「ゲノム・イン・ア・ボトル(GIAB)」コンソーシアムの一環として、再現性のあるクラウドベースのパイプラインを用いることにより、複数のショートリード塩基配列解読データセットとlinked-read塩基配列解読データセットを統合し、ヒトゲノムの基準コールを提供する。分析済みのGIAB試料1点と共に、「パーソナル・ゲノム・プロジェクト(PGP)」のゲノム6点の基準コールが得られた。これらの新たなゲノムは包括的な白紙同意を得ているため、この基準コールは研究者が下流のさまざまな用途に利用可能な「今までに類を見ない」リソースとなっている。これまでに発表されているGIAB基準と比較して、基準となる一塩基変異は17%、インデルは176%多く、基準領域は12%拡大した。この基準は、既存のコールセット中の誤りを高い信頼度で特定し、不完全で非網羅的な基準を用いた場合の性能評価指標の解釈における課題を明らかにすることが示された。また、バリアントの種類とゲノムの状況によって性能を層別することで、コールセットの長所と短所が明らかになった。