Analysis
多型レベル:範囲を拡大した塩基配列文脈(context)モデルがヒトゲノム全体の多型レベルの変動を幅広く説明できる
Nature Genetics 48, 4 doi: 10.1038/ng.3511
一塩基多型の割合はヒトゲノム全体では大きく異なっており、進化や遺伝学的疾患の発生率に根本的な影響を与えている。これまでの研究は多型部位の両隣に位置する塩基のみを考慮して、つまり多型部位の3つの塩基配列の文脈(context)で、ゲノム全体の多型レベルを研究していた。また、塩基配列の文脈が多型の発生率に大きな影響を与えることは分かっていても、長い塩基配列の文脈が及ぼす影響の解明はなされていなかった。我々は、新しい統計的な枠組みと1000ゲノムプロジェクトのデータを用いて、7塩基の配列が置換確率の変化の81%以上を説明しうることを実証し、また、ApTの二塩基での新しい変異促進モチーフとして配列CAATおよびTACGを明らかにした。また、我々の手法により、CpG部位でのCからTへの置換について、これまでには示されていなかった変化も明らかになったが、これはメチル化強度の差異によって直ちに説明されるものではなかった。我々のモデルを用いることにより、遺伝子について有益な情報をもたらす置換不寛容スコア、およびアミノ酸についての新たな置換不寛容スコアを提示する。また、神経精神病学的な疾患に対してこのモデルの臨床的応用を報告する。