Article
1億個のランダムなプロモーターで真核細胞の遺伝子調節論理を解読する
Nature Biotechnology 38, 1 doi: 10.1038/s41587-019-0315-8
転写因子(TF)がどのようにシス調節DNA配列を解釈して遺伝子発現を制御するのかはいまだ明らかにされていないが、これは天然の配列および操作された配列を用いた過去の研究の規模が不十分であったことによるところが大きい。今回我々は、1億個を超える完全にランダムな酵母の合成プロモーター配列の発現出力を測定した。その配列は、機能性のTF結合部位が偶然に含まれることによって説明される多様で再現可能な発現レベルを生じる。我々は機械学習を利用し、解釈可能な転写調節モデルを構築した。それは、独立した試験プロモーターから行われる発現の約94%、および酵母の天然プロモーター断片から行われる発現の約89%を予測した。このモデルは、個々のTFの特異性、活性、およびクロマチンとの相互作用の特性評価を可能にする。TFの活性は、結合部位の鎖、位置、DNAらせんの面、およびクロマチンの状況に依存する。特に、発現レベルは設計された配列の研究を混乱させる弱い調節相互作用に影響される。我々の解析は、完全にランダムなDNAの超スループットアッセイによって遺伝子調節の複雑な予測モデルの開発に必要なビッグデータが得られることを示している。