Computational Biology

さまざまなヒト組織の系統的アノテーションを目的とするエピゲノムデータセットの大規模な補完

Nature Biotechnology 33, 4 doi: 10.1038/nbt.3157

何百点ものエピゲノムマップを用いることにより、標識および試料の両方で全体的なエピジェネティックシグナルの相関性を利用して追加的なデータセットを大規模に予測することができる。今回我々は、回帰ツリーのアンサンブルを通してそうした相関性を活用することでエピゲノムの補完を行った。補完した高分解能のシグナルマップ4315点のうち、26%は実験でも観察された。補完されたシグナルトラックは観察されたシグナルと全般的に類似しており、一貫性、遺伝子アノテーションの回復、および疾病関連変異体の集中は実験的データセットを上回っていた。我々はこの補完データを用いて質の低い実験的データセットを検出し、予想外のエピジェネティックシグナルを有するゲノム部位を発見するとともに、新たな実験のための優先度の高い標識を特定して、さまざまな組織および細胞型に関する標準エピゲノム127種類のクロマチン状態を明らかにした。この補完データセットはこれまでで最も網羅的なヒト調節領域のアノテーションをもたらしており、この方法およびChromImputeソフトウェアはエピゲノム情報の大規模な実験的マッピングの補完に有用である。

目次へ戻る

プライバシーマーク制度