Computational Biology
対照遺伝子または試料の因子分析を用いるRNA塩基配列解読データの正規化
Nature Biotechnology 32, 9 doi: 10.1038/nbt.2931
RNA塩基配列解読(RNA-seq)データの正規化は、発現レベルの正確な推定を図る上で不可欠である。本論文では、通常の正規化法が基本的に解読深度に関するものであり、ライブラリーの調製およびさらに複雑で望ましくない他の技術的影響が修正されないことを示す。我々は、ERCC(External RNA Control Consortium;外部RNA標準コンソーシアム)のスパイクイン標準の性能を評価し、それを正規化に直接利用する可能性を検討した。その結果、スパイクインは標準的なグローバルスケーリング、または回帰法に基づく正規化処理に利用可能なほど信頼性が高くないことが示された。今回提案するRUV(remove unwanted variation;望ましくないばらつきの除去)という正規化法は、適切な対照遺伝子(ERCCスパイクインなど)または試料(複製物ライブラリーなど)のセットで因子分析を行うことによって有害な技術的影響を補正するものである。我々の方法では、最新の正規化法と比較して、発現量比の推定および差次的発現の検定が正確に行われる。とりわけ、RUVは、複数の実験室や技術者、塩基配列解読プラットフォームが関わる大規模な共同プロジェクトで有用と考えられる。