Technical Report

バイオインフォマティクス:ヒトの遺伝的バリアントの相対的な病原性を見積もるための一般的なフレームワーク

Nature Genetics 46, 3 doi: 10.1038/ng.2892

ヒトの遺伝的バリアント(多様体)を機能づけし解釈するための現在の手法は1つの側面からの情報(例えば保存)だけを利用する傾向にあったり、ある範囲の情報(例えばミスセンス変化)だけに限られていたりする。今回、我々は混合アノテーション依存型喪失(CADD)という、それぞれのバリアントに関して、多くの異なるアノテーション(機能注釈)を単一の指標(Cスコア)に客観的に統合するための手法について述べる。我々はCADDを、1,470万のシミュレーションされたバリアントからの1,470万の高頻度なヒト由来の対立遺伝子を区別するよう訓練されたサポートベクターマシンとして実装した。86億個の可能性のある全てのヒト単一塩基バリアントについて、Cスコアを事前計算し、短い挿入や欠失のスコアリングを可能にした。Cスコアは、対立遺伝子の多様性、機能のアノテーション、病原性、疾患の重篤度、実験的に測定された調節作用、複雑形質の関連に相関している。また、個々のゲノム中に存在する既知の病原性バリアントを高度に順位付けする。CADDは、多くの機能カテゴリー、効果サイズ、遺伝子構造にわたって、バリアントの機能、有害性、病原性を順位づけることができ、その能力は、現在のどんな単一のアノテーション付け手法にも並ぶものはないものである。

目次へ戻る

プライバシーマーク制度