Article
皮膚科学:多様な肌の色に対応した皮膚疾患診断の意思決定を深層学習により支援
Nature Medicine 30, 2 doi: 10.1038/s41591-023-02728-3
画像を用いた医療診断のための深層学習システムの進展により、これらのシステムが臨床での意思決定を補強できることが実証されているが、医師と機械の協力体制の有効性は未解決の問題である。この原因の一部は、医師とアルゴリズムはどちらも、特に過小評価(underrepresented)集団の診断においては、系統誤差の影響を受けやすいということがある。今回我々は、39カ国の皮膚科専門医(n = 389)とプライマリーケア医(n = 459)が参加した大規模デジタル実験において、蓄積交換方式の皮膚科遠隔医療シミュレーションにより医師が提出した診断の精度を評価した結果を報告する。この実験では、医師には46の皮膚疾患の画像364枚が提示され、最大4つまでの鑑別診断を提出することが求められた。診断精度は、皮膚科専門医が38%、プライマリーケア医が19%を達成したが、皮膚科専門医もプライマリーケア医も、暗い肌の色の画像を診断する場合は、明るい肌の色の場合に比べて、診断精度が4パーセントポイント低かった。公平性を配慮した深層学習システムによる意思決定支援は、皮膚科専門医とプライマリーケア医の両方の診断精度を33%以上向上させたが、プライマリーケア医の診断精度については肌の色による差が広がった。以上の結果は、適切に設計された医師と機械の協力体制は、医師の診断精度を向上させられることを実証しているが、全体的な診断精度の向上には成功しても、必ずしも偏りに対処できるわけではないことを示している。