Article

高分解能断片化質量スペクトルによる未知の代謝物の系統的な分類

Nature Biotechnology 39, 4 doi: 10.1038/s41587-020-0740-8

非選択的なタンデム質量分析法によるメタボロミクスは、生物学的試料中の数千種類の分子を検出することができる。しかし、構造分子のアノテーションはライブラリーやデータベースに存在する構造に限定され、実験データの解析や解釈の制約となっている。今回我々は、化合物クラスの系統的なアノテーションのためのコンピューターツールであるCANOPUS(class assignment and ontology prediction using mass spectrometry)を紹介する。CANOPUSは、ディープニューラルネットワークを用いて、断片化スペクトルから生物学的な意味を持つ全てのクラスを含む2497種類の化合物クラスを予測する。CANOPUSは、スペクトルも構造も参照データが存在しない化合物を明確に標的とし、タンデム質量分析法の訓練データを欠くクラスを予測する。参照データを用いた評価では、CANOPUSは極めて高い予測性能(相互検証の平均正確度99.7%)を達成し、4つの対照法の性能を上回った。我々は、マウス消化器系の微生物定着の影響を研究することによって、また各種トウダイグサ属植物の化学的多様性の解析を通じて、さらに海洋天然物の発見に関して、CANOPUSの幅広い有用性を実証し、化合物クラスレベルの生物学的な知見を明らかにした。

目次へ戻る

プライバシーマーク制度