波士顿医院研究比较医生与聊天机器人的临床推理能力Clinicians and Chatbots: Boston Hospital Study Compares Their Clinical Reasoning

环球医讯 / AI与医疗健康来源：www.aha.org美国 - 英语2024-11-14 05:34:00 - 阅读时长2分钟 - 537字

波士顿贝斯以色列女执事医疗中心的研究显示，尽管ChatGPT-4在某些方面表现出色，但其临床推理能力仍不如人类医生准确。

波士顿医院研究比较医生与聊天机器人的临床推理能力

尽管人工智能有潜力改善和变革医疗保健，但医生们暂时还不太可能将决策权交给聊天机器人。波士顿贝斯以色列女执事医疗中心（BIDMC）的医师科学家们研究了一个人工智能聊天机器人程序处理医疗数据和展示临床推理的能力，与完成相同任务的临床医生进行了对比。该研究结果发表在《JAMA内科学》杂志的一封研究信中，显示大型语言模型ChatGPT-4可以像人类一样做出临床诊断，在某些情况下甚至更好，但在临床推理的准确性上，聊天机器人出现错误的情况更多。

“这一发现强调了人工智能最有可能作为工具来增强而非替代人类的推理过程。”BIDMC博客中写道。

BIDMC的研究人员招募了21名主治医生和18名住院医生，分别完成了20个临床案例中的四个连续诊断推理阶段。聊天机器人接受了相同的指令，并运行了所有20个临床案例。为了评估答案，研究人员使用了一种经过验证的评估临床推理的工具——修订版IDEA以及其他几个指标。

研究发现，ChatGPT-4在修订版IDEA评估中得分最高，大型语言模型的中位数得分为10分（满分10分），主治医生为9分，住院医生为8分。然而，研究人员观察到，诊断准确性和正确的临床推理更为接近。研究发现，聊天机器人在答案中出现错误推理的情况显著多于住院医生。

(全文结束)

本文内容由家庭大健康团队所原创或整理，未经授权不得转载、摘编或利用其它方式使用。欢迎分享至朋友圈。
本文仅代表作者观点，不代表本站立场，如有侵权请联系我们删除。

AI内容声明：本页内容撰写过程部分涉及AI（包括且不限于题材，素材，提纲的搜集与整理），请注意甄别。

猜你喜欢

合作推动医疗保健领域的人工智能创新
医院报告保险拒赔增加，人工智能是否在推波助澜？
AI能否改善医生的诊断？研究将其付诸测试
2024-2029年临床和分子诊断市场中的人工智能：个性化医疗、带有人工智能的软件、发展中市场的未开发机会推动发展
有效管理收入周期技术的8个建议
Ubie 和 PatientsLikeMe 合作，利用 AI 改善患者旅程
内科医学学会发布关于生成式AI的立场声明
恢复肺干细胞以治疗特发性肺纤维化
AI进入医疗领域的真正意义是什么？
慢性炎症既危险又常见，这是如何判断自己是否有慢性炎症的方法

热点资讯

全站热点

全站热文

Copyright © 1998 - 2025 familydoctor.cn All Rights Reserved 家庭医生在线版权所有

家庭医生在线版旗下网站

本网站敬告网民：网站资讯仅供参考，身体若有不适，请及时到医院就诊。

经营许可证编号：粤B2-20050069号 | ICP备案粤ICP备14007806号-2

营业执照 | 广播电视节目制作经营许可证

粤公网安备44010402003489号 | 不良信息举报中心 | 垃圾信息举报中心 | 网络110报警服务

违法和不良信息举报电话：020-37617298，举报邮箱：fw@familydoctor.com.cn

互联网文化经营单位