Article
辞書学習による統合的・多モード・拡張可能な単一細胞解析
Nature Biotechnology 42, 2 doi: 10.1038/s41587-023-01767-y
単一細胞塩基配列解読プロファイルの網羅的参照データセットへのマッピングは、教師なし解析の強力な代替手段となる。しかし、参照データセットは単一細胞RNA塩基配列解読データから構築されているものが極めて多く、遺伝子発現を測定していないデータセットのアノテーションには用いることができない。本論文では、マルチオミクスデータセットを分子レベルのブリッジとして用いることで各モダリティーの単一細胞データセットを統合する方法であるブリッジ統合を紹介する。マルチオミクスデータセット中の個々の細胞は「辞書」の要素に相当し、単一モードのデータセットの再構築とそこから共有空間への変換に用いられる。我々の方法は、クロマチン接近可能性、ヒストン修飾、DNAメチル化、およびタンパク質レベルの独立した単一細胞測定結果とトランスクリプトームデータを正確に統合した。また、辞書学習とスケッチ技術を組み合わせることで、計算のスケーラビリティーを向上させ、塩基配列解読実験やマスサイトメトリー実験で得られた860万個のヒト免疫細胞のプロファイルを整合化させ得ることが示された。我々のSeuratツールキットのバージョン5(http://www.satijalab.org/seurat)で実現されている今回の方法は、単一細胞参照データセットの利用の幅を広げ、各種分子モダリティーの比較を容易にする。