Brief Communication
タンパク質言語モデルを用いて全5タイプのシグナルペプチドを予測する
Nature Biotechnology 40, 7 doi: 10.1038/s41587-021-01156-3
シグナルペプチド(SP)は、あらゆる生物でタンパク質の分泌および移動を制御している短いアミノ酸配列である。SPは配列データから予測可能であるが、既存のアルゴリズムで既知の全てのタイプのSPを検出することはできない。本論文で紹介するSignalP 6.0という機械学習モデルは、5タイプ全てのSPを検出するもので、メタゲノムデータに応用可能である。