Technical Report
がん:がんのドライバー変異を節約の原理が導く学習により教師なしで検出
Nature Genetics 48, 10 doi: 10.1038/ng.3658
がんのハイスループット塩基配列決定データセットにおいて、生物学的活性のないパッセンジャー変異から生物学的活性のあるドライバー変異を確実に優先順位付けする方法が必要である。我々は、節約の原理によって導かれ、教師なしで機能的影響を予測する方法ParsSNPを報告する。ParsSNPは、期待値最大化の枠組みを用いて、偏りが導入され得るラベル付けを行ったトレーニングデータを用いることなく、腫瘍の発生率を広く説明する変異を見つけ出そうというものである。5つの項目について、既存の5つのツール(CanDrA、CHASM、FATHMM Cancer、TransFIC、およびCondel)とParsSNPとを比較すると、その項目と既存ツールを組み合わせた25の場合の24においてParsSNPが優れていた。これらの改良点の実際の恩恵を調べるために、びまん性胃がんの30人の患者からなる独立したデータセットにParsSNPを適用した。ParsSNPでは、多くの既知のドライバー変異や、既知のがん抑制遺伝子の短縮型変異やRHOAに頻発するp.Tyr42Cysドライバー置換など、他の方法では検出されなかったドライバーの可能性のある変異を同定することができた。結論としてParsSNPは、節約の原理を基盤とする革新的な手法を用いてがんのドライバー変異の優先順位付けを行うものであり、既存の方法に劇的な改良をもたらすものである。