
近畿大学医学部の研究グループが、生成AIであるChatGPT-5が皮膚科の若手研修医の診断精度を有意に向上させる可能性があることを発見しました。この研究は、AIが臨床判断を支援する「認知的パートナー」としての活用可能性を示唆しています。
概要
近畿大学医学部皮膚科学教室の研究グループは、ChatGPT-5を用いた皮膚科の鑑別診断支援が若手研修医の診断精度に与える影響を検証しました。その結果、ChatGPT-5が正しい診断候補を提示した場合に研修医の診断精度が向上することが確認されましたが、誤った候補を提示した場合には診断精度が低下するリスクも判明しました。本研究は、ChatGPT-5が臨床判断を代替するのではなく、診断推論を支援・強化する「認知的パートナー」としての活用を提言しています。
提供元:近畿大学医学部皮膚科学教室
論文掲載誌:Acta Dermato-Venereologica(令和8年5月11日掲載)
研究対象:皮膚科専門医資格未取得の若手研修医23名
検証内容:確定診断済みの皮膚科30症例におけるChatGPT-5なしでの診断精度と、ChatGPT-5の鑑別診断を参照した後の診断精度の比較
結果:ChatGPT-5参照により、研修医の診断精度中央値が43.3%から50.0%へ有意に向上
専門医参考値:診断精度中央値66.7%
ChatGPT-5の候補に正解が含まれていた場合:診断精度中央値が64.7%から82.4%へ向上
ChatGPT-5の候補に正解が含まれていなかった場合:診断精度中央値が15.4%から7.7%へ低下
ChatGPT-5による鑑別診断支援の有効性とリスク
AI技術の進歩は皮膚科領域における診断支援研究を大きく前進させており、特に深層学習に基づく画像解析AIは専門医レベルの精度に達しつつあります。近年、ChatGPT-5のような大規模言語モデルも、テキスト情報から臨床的に関連のある診断を提示する能力が注目されています。近畿大学の研究グループは、以前のChatGPT-4oを用いた研究で、専門医と同等の診断精度を示すことを報告していましたが、実際の臨床現場における若手研修医のAI提案の扱い方や、誤った提案が診断判断を誤らせるリスクについては、さらなる検証が必要でした。
本研究では、より新しいモデルであるChatGPT-5を用いて、皮膚科専門医資格を未取得の若手研修医23名を対象に、確定診断済みの30症例(腫瘍性15例、炎症性15例)を用いて検証が行われました。参加者はまずChatGPT-5を参照せずに独立して診断を行い、その後、ChatGPT-5が生成した3つの鑑別診断を参照しながら再評価しました。ChatGPT-5には、患者背景や臨床所見といった初診時に入手可能な情報のみが提供されました。
その結果、ChatGPT-5は56.7%の症例で、上位3つの鑑別診断の中に正解を含んでいました。若手研修医はChatGPT-5の提案を参考にしたことで、診断精度の中央値が43.3%から50.0%へと統計学的に有意に向上することが示されました。これは、ChatGPT-5が診断推論の補助として一定の効果を持つことを裏付けるものです。参考値として、皮膚科専門医の診断精度中央値は66.7%でした。
しかし、ChatGPT-5の提案内容の質が研修医の診断結果に大きく影響することも明らかになりました。全690回答(30症例×23名)を解析した結果、ChatGPT-5の使用前後で44.9%の診断が変更され、そのうち86.1%はChatGPT-5が提示した鑑別診断候補を採用していました。特に、ChatGPT-5が提示した候補に正解が含まれていた17例では、診断精度の中央値は64.7%から82.4%へと大幅に向上しました。一方で、正解が含まれていなかった13例では、診断精度の中央値は15.4%から7.7%へと低下しました。これらの結果は、ChatGPT-5が適切な候補を提示した場合には診断精度の向上に寄与するものの、不適切な候補を提示した場合には研修医の判断が影響を受け、誤診の増加につながる可能性があることを示しています。
AIは「認知的パートナー」としての活用を提言
本研究の重要な意義は、ChatGPT-5が皮膚科の初期診療において若手研修医の診断推論を支援しうる現実的なツールであることを示した点にあります。同時に、ChatGPT-5の出力を無批判に受け入れることの危険性も明らかになり、人間による批判的吟味と臨床判断の重要性が改めて強調されました。
研究グループは、ChatGPT-5は臨床判断を置き換えるものではなく、医師の診断推論を支援・強化する「認知的パートナー(cognitive partner)」として位置づけることを提言しています。この知見は、AIが最も効果的に機能する条件の解明や、皮膚科教育への応用、さらにはAIの安全な臨床活用ガイドラインの整備につながることが期待されます。
近畿大学医学部皮膚科学教室の主任教授である大塚篤司博士は、「AIの出力を鵜呑みにせず、批判的に吟味する臨床判断こそが鍵となります。生成AIは医師に取って代わる存在ではなく、共に診断を考える『認知的パートナー』です。」とコメントしています。
まとめ
近畿大学医学部の研究により、ChatGPT-5は皮膚科の若手研修医の診断精度を向上させる可能性を持つ一方で、誤った情報を提供した場合のリスクも示されました。AIは診断を支援する「認知的パートナー」として、医師の批判的吟味を前提に活用することが重要であると結論づけられました。
関連リンク
https://www.kindai.ac.jp/meikan/2634-otsuka-atsushi.html
https://www.kindai.ac.jp/meikan/3183-fujii-kazuyasu.html