Article

オンライン学習による単一細胞マルチオミクスの反復的統合

Nature Biotechnology 39, 8 doi: 10.1038/s41587-021-00867-x

単一細胞の遺伝子発現、クロマチン接近可能性、DNAメチル化の大規模データベースの統合には、一般的でスケーラブルな計算手法が必要である。本論文では、オンラインの統合的非負値行列因数分解(iNMF)を紹介する。これは、続々と集積される大規模で多様な単一細胞データセットを統合するためのアルゴリズムである。この方法は、固定メモリを用いて任意の大きさの細胞群に対応し、新しいデータセットが作成されるたびにそれらを取り込み、インターネット経由のストリーム配信によって大規模なデータセットの単一コピーを多くのユーザーが同時に解析することを可能にする。データの反復的な追加は、新規データの参照データセットへのマッピングに使用することもできる。既報の方法との比較から、効率の改善はデータセットのアラインメントとクラスター保存の性能に影響しないことが示された。我々は、標準的なノートパソコンで100万個超の細胞をまとめ、単一細胞RNA塩基配列解読と空間トランスクリプトームの大規模データセットを統合して、マウスの運動皮質の単一細胞マルチオミクス地図を繰り返し作製することによって、オンラインiNMFの有効性を実証した。

目次へ戻る

プライバシーマーク制度