Letter

RNA-Seq断片配列バイアスのモデル化が転写物量評価の系統的エラーを減少させる

Nature Biotechnology 34, 12 doi: 10.1038/nbt.3682

我々は、コンピューターでRNA-seqデータから転写物量を評価する従来の方法が数百件の偽陽性結果を生じる場合があることを明らかにする。その系統的エラーは、主として断片のGC含有バイアスが適切にモデル化されないことに起因することが分かった。断片配列の特徴に関連する試料特異的なバイアスは、転写物アイソフォームの誤った発見につながる。本論文では、試料特異的なバイアスを修正した転写物量を評価する「alpine」という方法を紹介する。断片配列の特徴を取り込むことで、alpineは転写物量評価の精度を大幅に高め、発現変化の偽陽性発生数をCufflinksの4分の1にすることを可能とした。我々はシミュレーションデータを用い、alpineが他の方法と同様の真陽性発見能力を保持していることも示した。この方法は、バイアス発見に有用なデータ視覚化ツールを含むR/Bioconductorパッケージとして利用可能である。

目次へ戻る

プライバシーマーク制度