Analysis
単一の参照空間を用いて複数の単一細胞RNA塩基配列解読データセットのロバストな統合
Nature Biotechnology 39, 7 doi: 10.1038/s41587-021-00859-x
単一細胞RNA塩基配列解読(scRNA-seq)の生物学的応用では、複数のバッチまたは研究のデータを統合的に解析する必要があることが多い。従来の方法では、データセット間の共通の細胞タイプまたは共分散の相関を用いて統合を行うのが一般的であるが、生物学的シグナルがゆがめられる場合がある。本論文では、参照データセットの遺伝子の固有ベクトルを用いて統合のための包括的な枠組みを確立するアルゴリズムを紹介する。模擬データセットと現実のデータセットを用いることにより、このRPCI(Reference Principal Component Integration)と命名した手法は、複数の指標で一貫して他の方法よりも優れていることが実証され、異なる発生段階の細胞や摂動と対照を比較する試験に存在するような、対応する細胞タイプの遺伝子発現に関して真の試料間差の維持に明らかな優位性が認められた。さらに、このロバストな性能は複数のデータセットを統合する場合に維持される。また我々は、マウスの腸内胚葉発生のscRNA-seqデータにRPCIを用いて、内臓性内胚葉の前後軸の確立を支える遺伝子プログラムの時間的な出現を明らかにした。