Article
長鎖ノンコーディングRNA:キャプチャー長リード塩基配列決定法による完全長長鎖ノンコーディングRNA全長の高効率なアノテーション
Nature Genetics 49, 12 doi: 10.1038/ng.3988
遺伝子やその転写産物の正確なアノテーションはゲノム研究の根幹をなす問題であるが、現在、効率と正確性の両方を兼ね備えるアノテーション技術は存在しない。その結果、リファレンスとなる遺伝子コレクションは不完全なままである。つまり多くの遺伝子モデルが断片的であり、何千もがカタログ化されないままとなっている。こういう問題は、特に長鎖ノンコーディングRNA(lncRNA)で著しい。lncRNAのアノテーションを加速させるため、GENCODEコンソーシアムが、RNA Capture Long Seq(CLS)を開発した。これは標的RNAキャプチャーと第三世代ロングリード塩基配列決定法とを組み合わせたものである。今回我々は、GENCODEのデータを用いて、ヒトやマウスの対応組織を対象にした遺伝子間lncRNA集団の実験的な再アノテーションを行い、それぞれ3574と561の遺伝子座の新規転写物モデルを得た。CLSにより、標的座位のアノテーションされた複雑性がおよそ2倍になった。これは既存のショートリード技術よりも優れた値である。CLSにより作製された完全長転写物モデルから、プロモーターと遺伝子構造、タンパク質コード能力といったlncRNAのゲノムの特性を明確に特徴付けることが可能になる。このようにCLSは、トランスクリプトームアノテーションに長きに存在したボトルネック問題を解決し、人手で行うレベルの完全長転写物モデルを高効率に生み出すことを可能にする。