Analysis

転移学習による単一細胞データの参照アトラスへのマッピング

Nature Biotechnology 40, 1 doi: 10.1038/s41587-021-01001-7

大規模な単一細胞アトラスは、現在では日常的に作成され、小規模研究の解析用のリファレンスとして利用されている。しかし、参照データからの学習は、データセット間のバッチ効果、コンピューター情報資源の利用可能性の制約、生データの共有の制限によって困難になっている。本論文では、クエリーデータセットをリファレンス上にマッピングするディープラーニング法scArches(single-cell architectural surgery)を紹介する。scArchesは、転移学習とパラメーター最適化を用いることにより、効率的、分散的、反復的なリファレンス構築と、生データを共有せずに既存のリファレンスを用いる新規データセットのコンテキスト化を可能とする。マウスの脳、膵臓、免疫、全身のアトラスから得た例を用いることにより、scArchesは、新規統合と比較して使用するパラメーターが4桁少ないにもかかわらず、生物学的状態の情報を保持しながらバッチ効果を排除することが示された。scArchesは多層的なリファレンスのマッピングに汎化し、欠落しているモダリティーの推定を可能とする。最後に、scArchesは健常リファレンスにマッピングしても新型コロナウイルス感染症(COVID-19)の多様性を保持し、疾患特異的な細胞状態の発見を可能とする。scArchesは、参照アトラスの反復的構築、更新、共有、効率的使用を可能とすることにより、共同プロジェクトを促進すると考えられる。

目次へ戻る

プライバシーマーク制度