Technical Report
スプライシング:ヒト組織横断的なスプライシング異常の予測
Nature Genetics 55, 5 doi: 10.1038/s41588-023-01373-3
スプライシング異常は遺伝病の主要な原因の1つだが、トランスクリプトームでそれらを直接検出できるのは、皮膚や体液のように臨床的に利用しやすい組織に限られている。DNAベースの機械学習モデルによって、スプライシングに影響する希少なバリアントに優先順位を付けることができるが、組織特異的な異常スプライシングを予測する性能についての評価はこれまで行われていない。本研究では、GTEx(Genotype-Tissue Expression)データセットの49のヒト組織における880万以上の希少なバリアントに対して、スプライシング異常の基準となるデータセットを生成した。20%再現率では、最先端のDNAベースモデルは最大12%の適合率を示した。トランスクリプトームワイドでの組織特異的スプライス部位使用のマッピングと定量化を行うとともに、アイソフォーム間の競合をモデル化することで、20%再現率での適合率を3倍高めることができた。また、我々のモデル(AbSplice)に、臨床で利用可能な組織のRNA塩基配列決定データを統合することで、適合率は60%に達した。これらの結果は、独立した2つのコホートで再現され、非コード配列の機能喪失バリアントの特定や、遺伝子診断の設計と分析に大いに役立つものである。