Computational Biology

マッピングされた大規模配列解読データの統一的で最適なシグナル処理

Nature Biotechnology 31, 7 doi: 10.1038/nbt.2596

高処理能配列解読データの分析にはさまざまな問題があるものの、それはシグナルの検出およびシグナルの評価という2つの一般的な問題の特別な例にすぎない。我々はシグナル処理理論の形式的に最適な解決策を応用し、ゲノムにマッピングされたDNA読み取り配列のシグナルを分析した。本論文で紹介する検出アルゴリズム「DFilter」は、ChIP-seq、DNase-seq、およびFAIRE-seqのデータから制御的特徴をアッセイ特異的なアルゴリズム以上の精度で特定する。また、わずか1~2個のヒストンプロファイル(R ~0.9)からmRNAレベルを正確に予測する評価アルゴリズム「EFilter」も紹介する。興味深いことに、プロモーター内の制御モチーフの存在はmRNAレベル以上にヒストン修飾との相関が高く、ヒストンプロファイルの方がcis制御メカニズムを正確に予測することが示唆された。我々はDFilterとEFilterを胚生期前脳のChIP-seqデータに応用し、組織の不均質性にかかわらず、制御タンパク質の同定ならびに機能アノテーションが可能であることを示した。我々のツールの基礎となっている数学的形式主義は、配列解読による機能プロファイルから得られるほぼ全てのデータの統合的分析に有用である。

目次へ戻る

プライバシーマーク制度