Analysis

長鎖非コードRNA:ヒトのトランスクリプトームに含まれる長鎖非コードRNAの遺伝的基盤

Nature Genetics 47, 3 doi: 10.1038/ng.3192

長鎖非コードRNA(lncRNA)は、組織の生理活性やがんなどの疾患における重要な調節因子として近年注目を集めている。lncRNAのゲノムワイドな発現を明らかにするため、7256個のRNA塩基配列決定(RNA-seq)ライブラリーを統合して解析した。これらのライブラリーは、25の独立した研究から得た腫瘍、健常組織、細胞株由来のライブラリーで、43テラベース超の配列を含んでいる。このデータセットに対してab initioアッセンブル法を適用し、9万1013個の発現遺伝子からなるヒトのコンセンサストランスクリプトームを明らかにした。これらの遺伝子の68%以上(5万8648個)がlncRNAであることが判明した。そして、このうち79%はこれまでアノテーションがなされていなかった。このようなlncRNAのおよそ1%(597)には高度保存配列エレメント(ultraconserved element:UCE)が存在し、7%(3900)には疾患に関連するSNPとの重複が見られた。細胞系譜特異的あるいは疾患に関連するlncRNAの発現を優先するため、発現量の差異に対するノンパラメトリック検定を行った。その結果、7942個の細胞系譜特異的もしくはがん関連lncRNA遺伝子を選ぶことができた。今回特性解析されたlncRNAの遺伝的基盤は、正常な生理活性とがんの発症機構を明らかにし、今後のバイオマーカーの開発に役立つ可能性が高い。

目次へ戻る

プライバシーマーク制度