Article
scJointはアトラス規模の単一細胞RNA-seqおよびATAC-seqデータを転移学習と組み合わせる
Nature Biotechnology 40, 5 doi: 10.1038/s41587-021-01161-6
単一細胞マルチオミクスデータはかつてないペースで増大し続けている。同一組織に由来する複数層データの統合に関して、いくつかの方法が有望な結果を示しているが、細胞アトラスが持つデータ構成の複雑さと規模は今なお障害となっている。本論文では、アトラス規模のscRNA-seqデータとscATAC-seqデータの不均一なコレクションを統合する転移学習法であるscJointを紹介する。scJointは、半教師付き枠組みの中でアノテーション済みのscRNA-seqデータの情報を利用し、ニューラルネットワークを用いてラベル付きデータとラベルなしデータの訓練を同時に行い、統合的枠組みでのラベル転移と共同可視化を可能にする。scJointは、アトラスデータと共にASAP-seqとCITE-seqで得られた多層的なデータセットを用いることにより、意味のある共同可視化を行いながら、計算効率が優れ、細胞タイプラベルの正確さが一貫して既存の方法を大きく上回ることが実証された。これにより、scJointは各層のデータの不均一性を克服し、細胞表現型のさらに包括的な理解を可能にする。