Computational Biology

親和性回帰法で核酸結合タンパク質の認識コードを予測する

Nature Biotechnology 33, 12 doi: 10.1038/nbt.3343

核酸結合タンパク質の親和性プロファイルをタンパク質配列から直接予測することは困難な課題である。本論文では、ハイスループットの結合データから転写因子ファミリーまたはRNA結合タンパク質(RBP)ファミリーの認識コードを学習するための統計的方法を紹介する。親和性回帰というこの方法は、タンパク質結合マイクロアレイ(PBM)またはRNAコンピート(RNAcompete)データで訓練し、タンパク質ドメイン配列およびプローブ配列のみを入力に用いてタンパク質と核酸との相互作用モデルの学習を行う。マウスホメオドメインPBMプロファイルで訓練すると、このモデルはDNA結合特異性をもたらす残基を正しく特定し、異なるホメオドメインの独立したセットの結合モチーフを正確に予測した。同様に、さまざまなRBPのRNAコンピートプロファイルで訓練すると、このモデルはヘルドアウトタンパク質の結合親和性を正しく予測し、RBP配列の発散が高度であるにもかかわらず重要なRNA結合残基を特定した。この方法は、ハイスループットの親和性データが利用可能な環境での対をなす巨大分子の相互作用のモデル化および予測に広く応用可能なものになることが期待される。

目次へ戻る

プライバシーマーク制度