Computational Biology

転写因子の配列特異性のモデル化方法の評価

Nature Biotechnology 31, 2 doi: 10.1038/nbt.2486

ゲノム解析では、DNA結合タンパク質の配列特異性モデルを用いて潜在的な転写因子(TF)結合部位のスキャンが行われる場合が多い。タンパク質のDNA結合特異性をモデル化して学習する方法は多数開発されているが、その系統的な比較は行われていない。本論文ではその種の26種類の方法を、さまざまなファミリーに属する66種類のマウスTFに関するin vitroのタンパク質結合マイクロアレイデータに適用した。9種類のTFに関しては、得られたモチーフモデルをin vivoデータでも評価したところ、in vitro由来の最も優れたモチーフはin vivoデータ由来のモチーフと同程度の性能を示した。今回の結果から、モノヌクレオチドの位置特異的重み行列に基づく単純なモデルを最も優れた方法で訓練したものは、分析した多くのTFに関するさらに複雑なモデルと同程度の性能を示すことがわかったが、特定の場合(今回分析したTFの10%未満)には不十分であった。さらに、最も高性能なモチーフは情報量が比較的少ない場合が多く、これは真核生物のTFの配列選択性に幅広く見られる縮退と整合する。

目次へ戻る

プライバシーマーク制度