News Feature

数の力で健康リスクを予測

ヒトゲノムの構成に基づく健康予測は大きく前進している。しかし、こうした予測の指標の1つとして使われ始めた多遺伝子性リスクスコアについては、まだ大いに議論の余地がある。

英国バイオバンクではこれまでに、英国全域の40～69歳の約50万人の人々から遺伝学的データと表現型データが集められている。参加者たちは、健康測定を受け、血液、尿、唾液の試料の他、自身の詳細な情報を提供するとともに、その後の健康追跡に同意している。 Credit: NIK SPENCER/*NATURE*

660万。この数字は、マサチューセッツ総合病院（米国ボストン）の遺伝学者Sekar Kathiresanが、個人の冠動脈疾患の発生リスクを算出するために調べているヒトゲノム上のスポットの数である。Kathiresanは、選定したこれらのスポットにあるDNAの1文字（塩基1個）の個人間の差異を総合して解析することが、冠動脈疾患という世界の主要な死因の1つで死亡するかどうかを予測するのに役立つ可能性があることを明らかにした。それらの塩基（ACTGの4文字）の大多数が何をやっているかは誰にも分からない。それでもKathiresanは、「生まれながらに決まっているものに基づいて心臓発作のリスクの高低を軌跡で明確に表し、人々を分類することができるのです」と話す。

膨大な数のこうしたバリアント（集団内に見られる、ゲノムDNAの塩基配列が多様に変異した箇所で、多様体とも呼ばれる）を考慮に入れているのはKathiresanだけではない。彼が開発した多遺伝子性リスクスコア（polygenic risk score）は、ありふれた疾患に関わる遺伝的要因を探す研究で最先端を行く取り組みの一部である。過去20年にわたって研究者らは、心疾患や糖尿病、統合失調症といった病気の遺伝率を何とか説明しようと努力してきた。多遺伝子性リスクスコアは、ゲノム上の数十〜数百万カ所のスポットの小さい（時には極小の）関与を総合して評価する手法であり、これまでで最も強力な遺伝子診断法のいくつかを生み出している。

英国バイオバンクではこれまでに、英国全域の40~69歳の約50万人の人々から遺伝学的データと表現型データが集められている。参加者たちは、健康測定を受け、血液、尿、唾液の試料の他、自身の詳細な情報を提供するとともに、その後の健康追跡に同意している。 Credit: Christopher Furlong/Getty Images

この評価手法は、十分な資金で行われた多くのコホート研究や大規模データリポジトリーのおかげで誕生した。数十万人に由来するDNAデータと共に膨大な量の健康情報を集めた「英国バイオバンク」は、そうしたリポジトリーの1つだ（Nature 2018年10月11日号 194, 203, 210ページ参照）。過去1年ほどの間に発表された研究の中には、そのような情報源に由来する情報を組み合わせることで100万人以上の被験者情報を解析し、遺伝子の微弱な作用を検出できる能力を向上させたものもある。

多遺伝子性リスクスコアはゲノム医療において次の大きな一歩になるだろうと支持者らは言うが、この手法は大きな議論も巻き起こしている。いくつかの研究によって、例えば学業成績の予測など、多遺伝子性リスクスコアの使われ方についての倫理的なジレンマが提起されているのだ。批判的な人々は、この種のスコアから浮かび上がる複雑で時として曖昧な情報の解釈の仕方についても心配している。また、主要なバイオバンクには民族的多様性や地理的多様性がほとんどないため、遺伝子スクリーニング・ツールで現在得られるスコアは、それらのデータベースに対応する集団に対してしか予測能力を発揮できない可能性がある。

「多くの人が、これについてきちんと議論することを強く望んでいます。なぜなら、多遺伝子性リスクスコアという手法は論理学的、社会的、倫理的なあらゆる種類の問題を引き起こすからです」と、オックスフォード大学（英国）の遺伝学者Mark McCarthyは話す。そうした中で、多遺伝子性リスクスコアの臨床での実用化は現在急ピッチで進んでおり、少なくとも米国企業1社がすでに消費者に提供している。

こうした流れを作り出した多遺伝子性リスクスコアの先駆者である、クイーンズランド大学（オーストラリア）の遺伝学者Peter Visscherは、この手法に関しておおむね楽観的だが、それでも進展の速さには驚いている。「この流れは予想以上に速く進んでいくだろうと強く確信しています」と彼は話す。

リスク計算

2000年代初頭にヒトゲノムの最初の概要配列解読が終了したとき、多くの人々はこれが医療革命の出発点になると予想した。遺伝学者らは、糖尿病や心疾患になる人とならない人がいる理由を説明できそうなゲノムの差異を探し始めた。その考え方は、ある疾患のあるヒト集団とない集団を比較解析してDNAの違いを探すという単純なものだ。そうした違いは一般に、一塩基多型（SNP；スニップ）という、DNAを作る塩基の多様性の形で見られる。もし、ある病気の人々がDNAの特定の位置に塩基のTを持ち、その病気でない人々がCを持つなら、そのSNPと病気には何らかの関連性があると考えられる。

こうしたゲノムワイド関連解析（GWAS）は人気を博した。しかし探索を何年か続けても、ありふれた疾患の遺伝リスクのほんの一部しか説明付けることができなかった。これらの疾患の大半には、最初の予想よりも多くのSNPが関連していることが分かったのだと、スクリプス研究所（米国カリフォルニア州ラホヤ）の遺伝学者Ali Torkamaniは話す。

しかも、なお悪いことに、大多数のバリアントはもたらすリスクが非常に小さく、相当大規模なヒト集団を調べないと検出できなかった。「標本サイズを大きくすれば遺伝リスクを予測できると一部の人々は単純に考えていたのですが、現実的な予測を行うのに足るだけの標本サイズは得られませんでした」と、欧州バイオインフォマティクス研究所（英国ヒンクストン）の所長であるEwan Birneyは話す。2007年ごろになると、遺伝学者らは「失われた遺伝率（missing heritability）」と呼ばれる問題について頭を悩ませるようになった。ありふれた疾患の多くに遺伝的要因があることは明白だったが、GWASでは明らかに、そうした要因をほとんど捉えられなかったのだ。

しかし近年、事態は変わりつつある。大量のデータセットを利用できるようになり、また、データの解析方法の進歩もあって、そうした非常に小さいリスクの測定能が向上しているのだと、Kathiresanは説明する（2017年1月号「『致死的変異』の正体を見極める」参照）。

典型的な一例は、Kathiresanが2018年8月に発表した、660万に及ぶSNPのスコア作成手法である¹。彼のチームは、冠動脈疾患のある6万1000人と対照群の12万人を含む48件のGWASを統合した2015年のメタ解析²からデータを取り出した。彼らは次に、英国バイオバンクの29万人を対象にして、自分たちの多遺伝子性リスク予測因子を試験した。その結果、リスクスコアが最も高い少数のパーセンタイルに位置する人々が、集団内のそれ以外の人々よりも冠動脈疾患を発生するリスクが平均して数倍になることを見つけた（「多遺伝子予測ツール」参照）。例えば、スコア上位の2万3000人のうち実際に冠動脈疾患がある人は7％であるのに対して、集団内のそれ以外の人々では2.7％だった。研究チームは、炎症性腸疾患や乳がんなど他の4つの疾患についても同様の解析を行い、それぞれの場合でスコアが最も高い少数のパーセンタイルに位置していて特にリスクの高い人々を特定した。

**多遺伝子予測ツール**
英国バイオバンクの29万人を対象として冠動脈疾患（CAD）の多遺伝子性リスクスコアを評価した研究で、CADの有病率はスコアの最も高いパーセンタイルで急激に上昇することが明らかになった。
別の研究では、米国の成人および青少年5000人と50歳以上の9000人を対象に、学歴に関する多遺伝子性予測スコアを検証した。その予測能力は人口統計学的要因とほぼ同等だった。 Credit: SOURCE: REF. 1, REF. 5

Kathiresanらのこの論文は、多遺伝子性リスクスコアが理論的に臨床現場で使える可能性を示したものだとして、一部の研究者から賞賛された。Kathiresanによれば、このスコアが高リスク集団を特定できる能力は、医療現場で使われている既存のリスク測定法と同等だという。「本質的に、冠動脈疾患の新しいリスク因子が1つ分かったのと同じことです」。

Kathiresanの研究成果はニュースとなり、ちょっとした議論を巻き起こした。このリスクスコアに関係するバリアントの数があまりに多かったためだ。660万のSNPのうち、実際に予測に寄与するのは一部だけなのだと、ジョンズホプキンス大学公衆衛生大学院（米国メリーランド州ボルティモア）の生物統計学者Nilanjan Chatterjeeは話す（この研究には関わっていない）。その理由は、この種のスコアの計算方法にある。全てのバリアントのデータを1つのアルゴリズムに読み込み、その中で、疾患との関連の強さに応じてそれぞれのバリアントに重み付けをするのだが、そうすると大半のバリアントのリスクが実際にはほとんど無いか無視できる程度になってしまうのだ。

Chatterjeeなど多くの研究者は、作用が極小レベルのバリアントが多く含まれているとしても問題ないと話す。しかし他の研究者らは、何もしない数百万ものバリアントを含ませることで、スコアに対する一般市民の信頼が損なわれるのではないかと懸念している。エモリー大学（米国ジョージア州アトランタ）の疫学者Cecile Janssensは、この研究に好印象を持たなかったと言う。彼女が問題視する点の1つは、数百万のバリアントを使って計算された最終スコアが、疾患との関連が最強クラスの74のSNPから算定されたスコアと比べて、成績がそれほど良いわけではなかったことだ。もしこの種のスコアを臨床現場で使おうとするなら、「スコアの信頼性も重要になります」と彼女は話す。

行動の指針

Kathiresanの研究は主に遺伝的リスクに焦点を当てたものだが、多遺伝子性スコアが既存のリスク測定法をどのように補完できるかに注目した研究もある。2013年、ヘルシンキ大学の統計遺伝学者Samuli Ripattiは、多遺伝子性リスクスコアと従来の冠動脈疾患リスク因子（高い肥満度指数や高血圧など）を組み合わせることで、この疾患を発生しそうな人の予測能が向上することを報告した³。また彼は、これまでリスクが中程度だと見なされてきたが実際には遺伝的リスクスコアが高いヒト集団も特定することができた。このように予測網から漏れた人々をすくい上げる能力は、多遺伝子性リスクスコアの最大の長所だとRipattiは話す。

遺伝的リスクスコアは、乳がんなどのスクリーニング法の改善にも役立つかもしれない。米国では現在、女性は50歳から乳がん検診を受けるよう勧められるが、もっと若い段階で高リスクの女性を特定できれば、高リスクの人々はスクリーニングを早めることで恩恵が得られるだろう。2016年にChatterjeeは、従来のリスク因子と、約90のSNPから算出した多遺伝子性スコアの両方を組み込んだ乳がん用モデルを開発した⁴。彼はこれらのスコアに基づいて、40歳の女性の16％には50歳女性の平均と同程度のリスクがあると予測した。つまり、この16％の女性には40歳からスクリーニングを始めることが有効だと考えられる。Chatterjeeのチームは現在、このモデルの予測に耐久性があるかどうかを見るため、他のデータセットと多数のSNPを用いて検証しているところだ。

一方、個別化医療大手のミリアド・ジェネティクス社（以下ミリアド社；米国ユタ州ソルトレークシティー）は既に、一部の女性に提供する解析結果に乳がんの多遺伝子性リスクスコアを導入し始めている。乳がん家系の女性のうち、乳がんと関連する有害な単一遺伝子変異の1つを保有しているのは10％ほどにすぎない。そのためミリアド社は現在、残りの90％の人に対しては、多遺伝子性リスクと家系や生活スタイルなどの因子を組み合わせることで乳がん発生の可能性を示すスコアを出して、当事者に返送している。こうしたスコアの強みの1つは、全ての人を対象にして結果を提供できることだと、ミリアド社の科学部門責任者であるJerry Lanchburyは話す。同社の現在の重点目標は、乳がんについて高リスクの女性を特定することだが、将来的には、これらのスコアを使ってリスクが平均以下の女性を見つけ出せるのではないかと彼は言う。そうした低リスクの女性は、乳がん検診の頻度を減らすという恩恵が得られるかもしれない。「我々は今、全ての人に個別化医療の成果を提供できる世界に足を踏み入れたところなのです」とLanchbury。

全てが統計学

多遺伝子性スコアに関する不満の1つは、生物学を捨てて統計学で解釈することだ。多遺伝子性スコアだけでは創薬の手掛かりがあまり得られないだろうが、スコア研究は、個人の持つバリアントを詳細に調べたり、バリアントが影響を与える遺伝子や、疾患につながる可能性のある機構を明らかにしたりするための出発点となり得る。

そうした手掛かりの一部は、どのバリアントが実際に任意の形質もしくは疾患を生み出し、どのバリアントが単に付随しているだけなのかを解きほぐすことで得られるだろう。ある疾患との関連が見られるSNPがその原因だとは限らない。そのバリアントは単に、疾患に直接関与する別のゲノム領域と一緒に遺伝する傾向があるだけかもしれないのだ。例えばKathiresanの見積もりによれば、彼が研究に使った660万のSNPのうち、冠動脈疾患と因果関係があるのはたった6000程度という。標本サイズが大きくなるほど、これらのバリアントを見分けることが容易になるとMcCarthyは説明する。

大規模なバイオバンクプロジェクトの一環として集められた試料は、遺伝学的スクリーニング技術の開発に貢献するだろう。 Credit: JOANNE RATHE/THE BOSTON GLOBE/GETTY

遺伝的リスクには現在の研究では説明がつかない部分がまだかなりある。Ripattiの推定では、多くのありふれた疾患のリスクの30〜50％は遺伝的なものであり、残りの多くは環境要因によって決まる。しかし、「失われた遺伝率」の問題は依然としてある。大ざっぱに見て、GWASによって現在、疾患の遺伝的リスクの3分の1から3分の2ほどが説明できるとVisscherは話す。またTorkamaniによれば、標本サイズが大きくなるほど、リスクに関与するバリアントをより多く見つけられるようになるだろうが、それによる見返りは少なくなるという。「どこかの時点で、遺伝的リスク因子を追加して実用性を高めようとするのを止めることになります」と彼は話す。さらにVisscherは、全ゲノム塩基配列解読によって、より多くの遺伝的リスクを検出できるのではないかと話す。現在、GWAS研究は主に、ゲノムの一部分だけを解析するアレイ法を使って行われているが、全ゲノム塩基配列解読法が安価となって以前よりも普及しているため、疾患に関与する希少なバリアントを見つけるのも容易になったと思われる。

研究室から臨床現場へ

Kathiresanは、冠動脈疾患のスコアを2019年に市場に出したいと話す。しかし、この種のスコアを普及させる前に乗り越えるべき障壁がいくつかあることを、大半の研究者は承知している。一番のハードルは、McCarthyによると、スコアをさまざまな集団に適用することだ。多遺伝子性リスクスコアは主に欧州系の人々から成るデータセット（英国バイオバンクなど）で作成・確認されたものであり、他の民族の人々に適用できる程度は限定される。例えばミリアド社のスコアは現在、欧州系の個人のみに適用可能だが、同社は現在、アフリカ系米国人女性を対象とする同様のスコアを開発中だとLanchburyは話す。McCarthyによれば、最終目標は民族に特異的なリスクスコアを作成することだという。

問題を複雑にしているのは民族性だけではないと、Birneyは付け加える。多遺伝子性リスクスコアの研究で解析対象となった集団は、特定の医療システムに由来するものであり、どこの国でもその集団が経験したのと同じ経験ができるというわけではないのだ。心臓発作を起こす確率は、例えば標準的な医療が受けられる英国と米国の間でも異なっている可能性がある。そのため、スコアは国を超えて当てはまるものではないと見ていいだろう。

得られたスコアを人々に通知するという単純な行為にも、さまざまな懸念が伴う。医師が必ずしも遺伝学に詳しいわけではないとMcCarthyは話し、「遺伝的リスクスコアには、注意を要する議論が付随します。それを行えるような遺伝学カウンセラーの数が、とにかく足りないのです」と嘆く。Birneyによれば、「我々の遺伝学的特性は変わらないので、それを運命として甘んじて受け入れよう」という、誤った考え方が広く存在しているという。またJanssensは、もし人々が、疾患発生の可能性が自分のDNAにもともと組み込まれたものだと考えるなら、それに対して積極的に何かをしようと思わないのではないかと心配する。

この懸念は、多遺伝子性スコアによって予測できそうな疾患以外の形質だと、より深刻になる。100万人以上を対象として解析し、学歴と基本的に相関する多遺伝子性スコアを開発した研究が、2018年7月に報告された⁵。この論文の著者らは、スコアが非常に低い人々に対するいかなる種類の介入も示唆していないことを明確にしようと努めた。「この研究や同様の研究に対する実際のどのような対応（個人レベルであれ政策レベルであれ）も、極めて未熟で不十分なものとなるだろう」と、この研究に関するFAQ文書の中で彼らは述べている（www.thessgac.org/faqs）。

この論文の共著者であるガイシンガー・ヘルス・システム社（米国ペンシルベニア州ダンビル）の生命倫理学者Michelle Meyerは、この研究で得られたスコアはどう見ても実用的ではないと話す。スコアという形で現れた生物学的な差異（あるいは、そうした差異と必ず相互作用する環境要因や社会的要因）の実態を解明しなければ、介入の仕方を知ることは不可能なのだ。

遺伝学について話し合う

人々が多遺伝子性スコアにどう反応するかを理解することは、研究者にとって優先度の高い問題だ。Ripattiは同僚らと、フィンランドの7000人以上に、多遺伝子性スコアと従来の高血圧などのリスク因子の両方に基づく心疾患発生の確率の情報を提供した。それに対する回答者の大半は、この情報を得たことで、積極的に変化を起こそうという気持ちになったと答えたとRipattiは言う。予備的研究結果からは、遺伝的リスクスコアが高かった人々は、減量や禁煙といった行動を取る可能性が最も高いことが示唆された。

フィンランドに近いエストニアでは現在、10万人の遺伝子型解析が行われており、既存の5万人分のデータに加えられることになる。また、他の多くのバイオバンクと違って、エストニアの計画の参加者はオンライン登録をしてフィードバックを受け取ることができる。返送される解析結果の中には、2型糖尿病や心血管疾患に関する多遺伝子性リスクスコアが含まれていると、タルトゥ大学（エストニア）のエストニア・ゲノムセンターの遺伝学者Lili Milaniは話す。フィンランドの研究と同様、参加者には、生活スタイルの変化がリスクをどのように増減させる可能性があるかをグラフで見せる。Milaniによれば、参加者はアドバイスを受け取るとまず、喜んでくれるという。

現在のところ、参加者は遺伝学カウンセラーから自分のスコアを受け取っている。しかし、Milaniはエストニア政府と共同で、ゲノムデータを医療システムに組み込み、医師が日常的にこれを使えるような仕組みを練り上げているところだ。エストニアが最終的に目指すのは、希望する国民全員の遺伝子型を解析することであり、参加者の数は最大で全人口の130万人になるとMilaniは話す。「目標は、全ての医師が推奨したいと考え、なおかつ国民全員が望むほどの優れた仕組みを作り上げることです」。

翻訳：船田晶子

Nature ダイジェスト Vol. 16 No. 1

DOI: 10.1038/ndigest.2019.190122

原文

The approach to predictive medicine that is taking genomics research by storm

Nature (2018-10-11) | DOI: 10.1038/d41586-018-06956-3
Matthew Warren
Matthew Warrenは、ロンドン在住のNature のライター。

参考文献

Khera, A. V. et al. Nature Genetics 50, 1219–1224 (2018).
Nikpay, M. et al. Nature Genetics 47, 1121–1130 (2015).
Tikkanen, E., Havulinna, A. S., Palotie, A., Salomaa, V. & Ripatti, S. Arterioscler. Thromb. Vasc. Biol. 33, 2261–2266 (2013).
Maas, P. et al. JAMA Oncol. 2, 1295–1302 (2016).
Lee, J. J. et al. Nature Genetics 50, 1112–1121 (2018).