Article
単一細胞トランスクリプトミクスから特定の表現型に関連する細胞集団を見いだす共変動近傍領域解析
Nature Biotechnology 40, 3 doi: 10.1038/s41587-021-01066-4
単一細胞データセットはサンプルサイズが大きくなるため、試料間に変動があって臨床表現型などの試料属性と関連する細胞状態の特性を評価することが強く求められている。現在の統計的方法は、細胞をクラスターにマッピングしてからクラスターの存在量の差を評価するものが多い。本論文では、クラスターに基づく方法を上回る柔軟性で関連細胞集団を偏りなく特定する方法であるCNA(co-varying neighborhood analysis)を紹介する。CNAは、存在量が試料間で共変動することから共通の機能または調節が示唆される転写空間内の小領域群(近傍領域と命名)を見いだすことによって、試料横断的に変動の主軸の特性を評価する。CNAは、任意のサンプルレベルの属性とこうした共変動近傍領域群の存在量との関連性に関する統計的検討を行う。シミュレーションでは、CNAがクラスターに基づく方法を上回る感度と正確性で疾患関連の細胞状態を発見可能であることが明らかになった。既報のデータセットに応用したところ、CANは関節リウマチのNotch活性化シグネチャーを捕捉し、敗血症で増加した単球集団を特定し、活動性結核の進行に関連する新たなT細胞集団を発見した。