Analysis
ディープラーニングを巨大市民科学と組み合わせて大規模な画像分類を改善する
Nature Biotechnology 36, 9 doi: 10.1038/nbt.4225
画像のパターンの認識と分類は、生命科学の全領域で重要な課題である。我々は、蛍光顕微鏡画像の大規模な分類を行うために、2つの方法を組み合わせた。まず、ヒトタンパク質アトラス(HPA)の細胞アトラスの公開データセットを用いて、画像分類タスクを、ミニゲーム「プロジェクト・ディスカバリー」として流行のビデオゲーム(EVE Online)に組み込んだ。1年間にわたって32万2006人のゲーマーが参加した結果、HPAがアノテーションしていなかったパターンを含めて、細胞内局在パターン約3300万件の分類が得られた。次に、ディープラーニング(深層学習)を用いて、自動化された「局在細胞アノテーションツール(Loc-CAT)」を構築した。このツールは、タンパク質を29種類の細胞内局在パターンに分類し、多局在性タンパク質を効率よく扱うことが可能であり、さまざまな種類の細胞で確実に機能する。ゲーマーによるアノテーションとディープラーニングを組み合わせ、トランスファーラーニング(転移学習)を用いることにより、細胞内タンパク質分布をF1スコア0.72で判断することができる高度な学習器が得られた。以上より、営利コンピューターゲームのプレーヤーの参加によって、ディープラーニングを増強するデータが得られ、拡張可能で改善の容易な画像分類が実現されることが明らかになった。