Letter

親のデータによらずに単一細胞ストランド配列解読とロングリードを用いて行うフェージングの完全なヒトゲノムアセンブリー

Nature Biotechnology 39, 3 doi: 10.1038/s41587-020-0719-5

ヒトゲノムは通常、親のハプロタイプに関する情報を持たないコンセンサス配列としてアセンブリーが行われる。今回我々は、単一細胞ストランド塩基配列解読の染色体規模のフェージング能力とスキャフォールディング能力を連続的なロングリードの塩基配列解読データや高忠実度の塩基配列解読データと組み合わせて、参照ゲノムによらずに二倍体de novoゲノムアセンブリーを行うワークフローを紹介する。我々はこの戦略を用いて、親のデータが存在しないプエルトリコ系個人(HG00733)のそれぞれのハプロタイプに関して、フェージングの完全なde novoゲノムアセンブリーを得た。このアセンブリーは正確(クオリティー値 > 40)かつ高度に連続的(コンティグN50 > 23 Mbp)で、スイッチエラー率が低く(0.17%)、フェージングの完全な一塩基バリアント、インデル、構造バリアントが得られた。オックスフォード・ナノポア・テクノロジーズ社とパシフィック・バイオサイエンシーズ社のフェージングされたアセンブリーを比較した結果、塩基配列解読技術やフェージングのアルゴリズムとは無関係に、コンティグの断絶の好発部位である154領域が特定された。

目次へ戻る

プライバシーマーク制度