Article
単一細胞ゲノミクスデータから細胞の転写状態とエピゲノム状態を推測するSEACells
Nature Biotechnology 41, 12 doi: 10.1038/s41587-023-01716-9
メタ細胞は、単一細胞塩基配列解読データに由来し、極めて細かい個別の細胞状態を表す細胞集団である。本論文では、メタ細胞を識別するアルゴリズムSEACells(single-cell aggregation of cell states)を紹介する。これは、従来の細胞クラスタリングでは不明瞭になっていた不均質性を維持しながら単一細胞データのスパース性を克服するものである。SEACellsは、RNAとATAC(assay for transposase-accessible chromatin)のいずれのモダリティーでも、個別の細胞型と連続的な経路を含む全データセットで、網羅的かつコンパクトで十分に分離されたメタ細胞の識別において、既存のアルゴリズムよりも優れていた。SEACellsは、遺伝子とピークの関連付けの改善、ATAC遺伝子スコアの算出、分化中の重要な調節因子の活性の推測での有用性が実証された。メタ細胞レベルの解析は大規模なデータセットへの拡張性があり、患者ごとの集積でデータ統合のためのさらにロバストなユニットが得られる患者コホートには特に適している。我々のメタ細胞を用いることにより、造血分化中のクロマチン全体の発現動態と漸進的再構成が明らかになり、新型コロナウイルス感染症(COVID-19)患者コホートでは疾患の発症と重症度に関連するCD4 T細胞の分化と活性化の状態が一意的に識別された。