Article
多くのヒト集団にわたるHLA クラスIエピトープの予測を大規模ペプチドームデータセットが改善する
Nature Biotechnology 38, 2 doi: 10.1038/s41587-019-0322-9
HLAエピトープの予測は、がんの免疫療法およびワクチンの開発に重要である。しかし、現在の予測アルゴリズムは、さまざまなHLA対立遺伝子を網羅する質の高いエピトープデータセットでの訓練が行われていないこともあって、予測能力が不足している。我々は、多くのヒト集団の内因性HLAクラスI結合ペプチドを予測可能とするため、HLA-A、-B、-C、および-Gの単一対立遺伝子性細胞株95系統から抽出した18万5000個以上のペプチドについて、質量分析法を用いてプロファイリングを行った。HLA対立遺伝子ごとの標準的なペプチドモチーフ、固有および各対立遺伝子共通の結合サブモチーフ、ならびに異なるペプチド長と結合する別個のモチーフが発見された。こうしたデータを転写物の存在量およびペプチドプロセシングと統合することによってHLAthenaを開発し、内因性ペプチドの提示に関する対立遺伝子ペプチド長特異的予測モデルおよび汎対立遺伝子汎ペプチド長予測モデルを得た。そのモデルの予測では、内因性HLAクラスI結合リガンドの陽性的中率が既存ツールの1.5倍に向上し、患者11例に由来する腫瘍細胞株で実験的に観察されたHLA結合ペプチドの75%以上が正確に発見された。