Highlight

遺伝子型から表現型へ:文献ライブラリを使った近道

Nature Reviews Genetics

2005年7月1日

遺伝子のリストを見ていても、遺伝子の生物学的役割はほとんどわからない。その解明には、通常、時間をかけて機能研究や比較研究を行う必要がある。ところが、このほど発表された新しい方法を使うと、遺伝子型と表現型を結びつける作業で近道ができる。これは、比較ゲノム解析と文献マイニングを組み合わせて、既に塩基配列が解読された多数の遺伝子について、機能を予測しようという方法なのだ。

Peer Borkたちは、複数の生物種に1つの共通の表現形質があると、これらの生物種に共通のオルソロガス遺伝子が、表現形質の背後にある生物学的過程に関与している可能性が高い、と考えた。遺伝子型と表現型の相関は、これまでに数多く明らかになっているが、研究の初期段階で、それぞれの生物種について表現型データを手作業で収集しなければならなかった。これには労力がかかり、表現型のサンプリングが偏るおそれもある。

今回の研究では、既発表文献で入手できる表現型データと生物種を直接結びつけることで、このような注釈付けが省略された。つまり、Borkたちは、ゲノム配列が完全解読されている92種類の原核生物種とMEDLINEの論文抄録(米国立医学図書館によってまとめられたデータベースから入手したもの)に記載された172,967個の名詞との対応付けを行った。ここでは、特定の生物種の一群と関連して使用される頻度の高い名詞の単語が、その生物種群に共通の形質に特異な単語である可能性が高いと仮定して、このような名詞を生物種ごとに分類した。また、この92種類の生物種について、STRING(search tool for the retrieval of interacting genes/proteins;相互作用する遺伝子・タンパク質の検索ツール)データベースから11,026のオルソロガス遺伝子群を検索し、生物種間に共通する遺伝子群を特定した。

最後にBorkたちは、名詞の分類と共通遺伝子の分類との相関性を調べた。Borkたちは、形質を表わす単語とオルソロガス遺伝子グループの間に2,700の有意な対応関係を見出し、その結果、1つ以上の形質と関連性のある遺伝子を28,888個も特定した。この中には、既知の遺伝子−表現型対応関係が数多く含まれており、Borkたちの手法の妥当性が確認された。その一方で数多くの新発見もある。例えば、食中毒と結びつく形質を示す用語と代謝関連遺伝子の一群との対応関係が新たに見つかっている。

このほかに今回の研究で特定された対応関係の多くは、遺伝子と疾患関連表現型の対応関係であり、これは新たな薬剤標的の貴重な情報源となるかもしれない。このように臨床的に重要な表現型が多く見られる傾向は、塩基配列が完全解読された原核生物に占める病原体の割合が大きいことを示している。今後、より多くの塩基配列が解読されMEDLINE論文を研究に利用できるようになると、この方法が遺伝子と広範な生物学的過程を結びつける方法となるはずだ。

doi:10.1038/fake494

「レビューハイライト」記事一覧へ戻る

プライバシーマーク制度