Article
大規模言語モデル:適応化を行った大規模言語モデルは臨床文書の要約において医療専門家の成績を上回り得る
Nature Medicine 30, 4 doi: 10.1038/s41591-024-02855-5
電子健康記録の膨大な文字情報を分析し、重要な情報の要約を行う作業は、臨床医の時間配分に大きな負担を強いる。大規模言語モデル(LLM)は、自然言語処理(NLP)タスクにおいて有望とされているが、多様な範囲に及ぶ臨床情報の要約タスクに対する有効性は、いまだ明らかにされていない。本研究では、8つのLLMに対して適応化手法を適用し、4種類の異なる臨床情報(放射線画像診断報告書、患者への問診、経過記録、医師と患者の対話)の要約タスクを行わせた。NLPの構文、意味、概念のメトリックスを用いた定量的評価により、モデルと適応化手法の間にトレードオフがあることが明らかになった。10人の医師によるclinical reader study(臨床医が読んで評価する手法)によって、要約の完全性、正確性、簡潔性を評価すると、ほとんどの場合、最もよく適応したLLMによる要約は、医療専門家による要約と比較して、同等(45%)あるいは優れている(36%)と判断された。この後の安全性解析では、エラーと医療被害の可能性を結び付け、捏造された情報のタイプを分類することで、LLMと医療専門家の両方が直面する課題が浮き彫りになった。我々の研究は、複数のタスクにわたる臨床文書の要約において、LLMが医療専門家の成績を上回る根拠を示している。この結果は、臨床ワークフローにLLMを統合することで、文書作成の負担を軽減でき、臨床医は患者のケアにより専念できるようになる可能性があることを示唆している。