Analysis
単一細胞RNA塩基配列解読データのバッチ効果は相互最近傍のマッチングで補正される
Nature Biotechnology 36, 5 doi: 10.1038/nbt.4091
異なる研究室で異なる時に生成される単一細胞RNA塩基配列解読(scRNA-seq)の大規模なデータセットには、データの統合および解釈を損なう恐れのあるバッチ効果が含まれる。従来のscRNA-seq解析法では、細胞集団の構成が既知であるか、もしくはバッチ間で同一である、という正しくない仮定がなされている。本論文では、高次元の発現空間における相互最近傍(MNN)の検出に基づくバッチ補正戦略を紹介する。この手法は、定義済みの集団構成やバッチ間で差のない集団構成に依存せず、集団中の1つのサブセットがバッチ間で共通であることのみを必要とする。我々は、シミュレーションのscRNA-seqおよび実際のscRNA-seqの両データセットを用いることにより、この手法が従来の方法よりも優れていることを実証した。また、液滴を利用した複数のscRNA-seqデータセットを用いて、このMNNバッチ効果補正法が多数の細胞に拡張可能であることを実証した。