Nature ハイライト

計算材料科学:行間を読む

Nature 571, 7763

最近の「機械学習」や「人工知能」による材料発見方法のブームは、多くの場合、膨大な数値データを含むことが多い構造化された特性データベースによって支えられている。しかし、もちろん文献には、単なるデータ点や数字以上のものが含まれている。今回V Tshitoyan、A Jain、G Cederたちは、文献中の単語間の暗黙のつながりや関係性を利用することによっても、新材料を発見できる可能性があると主張している。著者たちは、出版された材料科学論文300万編のアブストラクトを取得し、これに自然言語処理アルゴリズムを適用することで、単語間の関係、材料組成、材料特性を(明白なものもあまり明白でないものも含めて)明らかにした。著者たちはまた、材料組成を「熱電」という単語に投射することで新しい熱電材料候補を予測するとともに、最新の「最高性能」材料を予測するだけの十分な情報が、その材料が実際に発見される数年前の文献中に存在したことも示している。

目次へ戻る

プライバシーマーク制度