波士顿医院研究比较医生与聊天机器人的临床推理能力Clinicians and Chatbots: Boston Hospital Study Compares Their Clinical Reasoning

环球医讯 / AI与医疗健康来源:www.aha.org美国 - 英语2024-11-14 05:34:00 - 阅读时长2分钟 - 537字
波士顿贝斯以色列女执事医疗中心的研究显示,尽管ChatGPT-4在某些方面表现出色,但其临床推理能力仍不如人类医生准确。
波士顿医院医生聊天机器人临床推理能力医疗保健JAMA内科学ChatGPT-4诊断准确性
波士顿医院研究比较医生与聊天机器人的临床推理能力

尽管人工智能有潜力改善和变革医疗保健,但医生们暂时还不太可能将决策权交给聊天机器人。波士顿贝斯以色列女执事医疗中心(BIDMC)的医师科学家们研究了一个人工智能聊天机器人程序处理医疗数据和展示临床推理的能力,与完成相同任务的临床医生进行了对比。该研究结果发表在《JAMA内科学》杂志的一封研究信中,显示大型语言模型ChatGPT-4可以像人类一样做出临床诊断,在某些情况下甚至更好,但在临床推理的准确性上,聊天机器人出现错误的情况更多。

“这一发现强调了人工智能最有可能作为工具来增强而非替代人类的推理过程。”BIDMC博客中写道。

BIDMC的研究人员招募了21名主治医生和18名住院医生,分别完成了20个临床案例中的四个连续诊断推理阶段。聊天机器人接受了相同的指令,并运行了所有20个临床案例。为了评估答案,研究人员使用了一种经过验证的评估临床推理的工具——修订版IDEA以及其他几个指标。

研究发现,ChatGPT-4在修订版IDEA评估中得分最高,大型语言模型的中位数得分为10分(满分10分),主治医生为9分,住院医生为8分。然而,研究人员观察到,诊断准确性和正确的临床推理更为接近。研究发现,聊天机器人在答案中出现错误推理的情况显著多于住院医生。


(全文结束)

猜你喜欢
  • 合作推动医疗保健领域的人工智能创新合作推动医疗保健领域的人工智能创新
  • 医院报告保险拒赔增加,人工智能是否在推波助澜?医院报告保险拒赔增加,人工智能是否在推波助澜?
  • AI能否改善医生的诊断?研究将其付诸测试AI能否改善医生的诊断?研究将其付诸测试
  • 2024-2029年临床和分子诊断市场中的人工智能:个性化医疗、带有人工智能的软件、发展中市场的未开发机会推动发展2024-2029年临床和分子诊断市场中的人工智能:个性化医疗、带有人工智能的软件、发展中市场的未开发机会推动发展
  • 有效管理收入周期技术的8个建议有效管理收入周期技术的8个建议
  • Ubie 和 PatientsLikeMe 合作,利用 AI 改善患者旅程Ubie 和 PatientsLikeMe 合作,利用 AI 改善患者旅程
  • 内科医学学会发布关于生成式AI的立场声明内科医学学会发布关于生成式AI的立场声明
  • 恢复肺干细胞以治疗特发性肺纤维化恢复肺干细胞以治疗特发性肺纤维化
  • AI进入医疗领域的真正意义是什么?AI进入医疗领域的真正意义是什么?
  • 慢性炎症既危险又常见,这是如何判断自己是否有慢性炎症的方法慢性炎症既危险又常见,这是如何判断自己是否有慢性炎症的方法
热点资讯
全站热点
全站热文