Article
がんゲノム:機械学習と集団遺伝学を用いた腫瘍のサブクローン再構築
Nature Genetics 52, 9 doi: 10.1038/s41588-020-0675-5
大部分のがんゲノムデータは、がんの部分集団の混合体に加え、正常細胞をも含む大量のサンプルから生成されたものである。機械学習に基づくサブクローン再構築法は、そうしたサンプル内の部分集合を分離し、それらの進化の過程を推測することを目的としている。しかしながら、現在のそのアプローチはもっぱらデータ駆動型であり、進化的理論を考慮していない。本論文では、進化を考慮せずに解析を進めると、系統誤差が生じることを示す。また、この系統誤差は、同じ腫瘍から複数のサンプルを取るとさらに悪化することが分かった。我々は、腫瘍サブクローン再構築のためのモデルに基づく新手法、MOBSTERを紹介する。この手法は、機械学習と理論集団遺伝学を組み合わせたものである。我々は、異なるコホートに由来する2606サンプルについての全ゲノム塩基配列決定データ(公共データ)と新規データ、および総合的な検証を用いて、単一サンプル、複数領域、長期的データにおいて、この手法が現在の技術よりも堅牢で正確であることを示す。このアプローチは、進化を考慮しない方法の交絡因子を最小化させ、これによってヒトにおけるがんの進化過程のより正確な再現が可能となる。