Article

肺疾患:スパイログラムの生データの深層学習による慢性閉塞性肺疾患の新規関連座位の特定とリスクモデルの改善

Nature Genetics 55, 5 doi: 10.1038/s41588-023-01372-4

世界で第3位の死亡原因となっている慢性閉塞性肺疾患(COPD)は、遺伝性が高い。COPDは肺機能の要約指標に閾値を適用することで臨床的に定義されているが、遺伝的シグナルの特定において検出力がより高いのは定量的な易罹患性スコアという指標である。本研究では、信頼性の低い自己申告や国際疾病分類コードに基づくラベルに対して深層畳み込みニューラルネットワークを訓練し、スパイログラムの高次元の生データからCOPDの症例–対照の状態を予測し、このモデルによる予測値を易罹患性スコアとして使用した。機械学習に基づく易罹患性スコアにより、ドメイン固有の知識を何ら必要とせずにCOPDの症例と対照を正確に識別し、COPDに関連した入院を予測することができた。機械学習に基づく易罹患性スコアはさらに、全生存期間や増悪イベントとも関連していた。機械学習に基づく易罹患性スコアに関するゲノムワイド関連解析では、COPDや肺機能に関連を有する既知の座位が確認され、加えて67の新規座位が特定された。このアプローチは、機械学習の手法と医療記録に基づくラベルを使用して、ドメインに関する知識や専門家によるキュレーションを必要とせずに、疾患の発症予測や、薬剤設計のためのゲノム探索を改善するための汎用的な枠組みとなり得る。

目次へ戻る

プライバシーマーク制度