Article

大規模なデータアノテーションとディープラーニングを用いたヒトレベルの性能での組織画像の全細胞セグメンテーション

Nature Biotechnology 40, 4 doi: 10.1038/s41587-021-01094-0

組織画像データ解析には、細胞セグメンテーション(画像中の全細胞の正確な境界を特定する作業)という重要な課題がある。我々は、この問題に取り組むため、セグメンテーションモデルの訓練用データセットTissueNetを作製した。TissueNetには手作業で標識した100万個以上の細胞が含まれており、これは既報のあらゆるセグメンテーション訓練データセットを1桁上回る。TissueNetを用いて、ディープラーニングによるセグメンテーションアルゴリズムMesmerを訓練した。我々は、Mesmerが既存の方法以上に正確であって、TissueNetの多様な組織タイプや画像化プラットフォームに広く対応し、ヒトレベルの性能を達成することを実証した。Mesmerは、タンパク質シグナルの細胞内局在など、従来の方法では困難であった細胞の重要な特徴の自動抽出を可能にした。次に我々は、極めて複雑なデータセットの細胞系譜の情報を利用するようにMesmerを改変し、この改良版を用いて妊娠期間中のヒト細胞の形態変化を定量化した。全てのコード、データ、モデルは、コミュニティーの情報資源として公開されている。

目次へ戻る

プライバシーマーク制度