Technical Report
3Dゲノム:塩基配列に基づく3次元ゲノム構造のキロベース規模から染色体規模にわたるモデル化
Nature Genetics 54, 5 doi: 10.1038/s41588-022-01065-4
本論文では、マルチスケールの3次元ゲノム構造に対してゲノム塩基配列が与える影響を知るための手段として、Orcaを紹介する。Orcaは、キロベース規模から全染色体規模の3次元ゲノム構造を、塩基配列から直接予測するディープラーニング手法である。Orcaによって、クロマチン区画やトポロジカルドメイン(TAD)などの構造をはじめ、CTCFを介した相互作用から、エンハンサー・プロモーター相互作用やポリコームを介した相互作用まで、それらが有する塩基配列依存性を細胞タイプ特異的に捉えられる。Orcaは、マルチスケールのゲノム構成にバリアントが及ぼす構造的な影響を予測するなど、多彩な応用を可能にし、また実験的にも、さまざまなサイズ(300 bp~90 Mb)のバリアントの影響を再現することができた。Orcaはさらに、in silico仮想スクリーニングが可能で、これにより異なる規模における3次元ゲノム構成の塩基配列基盤を探ることができる。サブメガベース規模(1 Mb未満)では、細胞タイプ特異的なゲノム相互作用の基盤となる特異的転写因子モチーフを予測する。ゲノム区画規模では、塩基配列の活性を仮想スクリーニングすることにより、転写開始点としての顕著な役割を持つクロマチン区画を塩基配列ベースで予測するモデルを提示する。