Computational Biology
深層学習によるDNAおよびRNA結合タンパク質の配列特異性の予測
Nature Biotechnology 33, 8 doi: 10.1038/nbt.3300
生物学的システムの調節過程のモデル開発および疾患原因多様体の同定には、DNAおよびRNA結合タンパク質の配列特異性を知ることが不可欠である。本論文では、「深層学習(ディープラーニング)」技術によって実験データから配列特異性が見極められることを示す。深層学習技術は、パターンの発見を目的とする拡張可能で柔軟性のある統一的なコンピューター解析法をもたらす。さまざまな実験データおよび評価法を用いたところ、in vitroデータによるトレーニングでもin vivoデータの試験でも、深層学習が他の最新の方法に勝っていることが明らかにされた。我々はこの方法をDeepBindと命名し、実験1回当たり数百万個の配列を処理する全自動の独立型ソフトウエアツールを構築した。DeepBindで明らかにされる特異性は、位置特異的重み行列の重み付きアンサンブルとして、または多様性が特定配列内の結合にどのような影響を及ぼすのかを示す「変異マップ」として、容易に可視化される。