Analysis
単一細胞RNA塩基配列解読データからの遺伝子発現状態のベイズ推定
Nature Biotechnology 39, 8 doi: 10.1038/s41587-021-00875-x
単一細胞RNA塩基配列解読(scRNA-seq)データの解析法は大きく進歩したが、そうしたデータを正規化する最適な方法に関してはいまだほとんど合意が見られない。我々は、推定された発現状態は生物学的ノイズと測定サンプリングノイズの両方について修正すべきであり、発現の変化は倍率変化の観点から測定すべきであるという基本的要求から出発し、Sanity(SAmpling-Noise-corrected Inference of Transcription activitY)と命名したベイズ正規化法を第一原理から導き出した。Sanityは、一切の調整可能なパラメーターによらずに、未補正の固有分子識別子(unique molecular identifier;UMI)のカウントから発現量と関連する誤差範囲を直接推定する。模擬および実際のscRNA-seqデータセットを用いることにより、最近傍の細胞の発見や細胞のサブタイプへのクラスター化などの下流のタスクで、Sanityが他の正規化法に勝っていることが示された。さらに、他の方法では、低発現遺伝子の発現変動が系統的に過大評価され、より低い次元の表現へのデータのマッピングによって擬似相関が取り込まれることにより、データの全体像が大幅に歪曲されることが明らかになった。