Article

説明可能な機械学習による配列解読データからのタンパク質・リガンド結合親和性の予測

Nature Biotechnology 40, 10 doi: 10.1038/s41587-022-01307-0

タンパク質–リガンド相互作用は、親和性選択と超並列配列解読によるハイスループットのプロファイリングが増加している。しかし、そうしたアッセイでは、分子相互作用を極めて厳密に定量化する生物物理学的パラメーターが得られない。本論文では、平衡結合定数または運動速度の観点から配列認識を正確に判定するフレキシブルな機械学習法ProBoundを紹介する。これは、分子相互作用とデータ生成プロセスの両方をモデル化する多層的な最尤法の枠組みを用いて実現された。ProBoundは、従来のリソースの範囲を超えて結合親和性を予測するモデルによって転写因子(TF)の挙動を定量化し、DNA修飾の影響と多重TF複合体の高次構造的な柔軟性を捕捉し、ピークコーリングによらずにChIP-seqなどのin vivoデータから特異性を直接推測することが示された。KD-seqというアッセイと組み合わせると、タンパク質–リガンド相互作用の絶対親和性が明らかにされた。ProBoundを応用してキナーゼ–基質相互作用の動態のプロファイリングも行った。ProBoundは、生物学的ネットワークの解読およびタンパク質・リガンド相互作用の合理的操作に新たな道を開いた。

目次へ戻る

プライバシーマーク制度