聊天机器人难当好医生:新研究揭示关键洞见Chatbots Make Terrible Doctors: Insights from a New Study_they_study_of

环球医讯 / AI与医疗健康来源:www.sohu.com英国 - 英语2026-02-10 11:54:15 - 阅读时长3分钟 - 1180字
一项发表在《自然医学》杂志上的大规模研究显示,聊天机器人在医疗咨询中表现严重不足,尽管能通过医学考试,但实际交互时准确率低于34.5%,常给出错误建议如将紧急状况误判为休息即可,甚至提供无效急救电话,存在重大安全隐患;该研究由牛津大学团队对1298名英国参与者开展,证实AI无法替代人类医生的细致判断与伦理决策,强调在医疗等敏感领域需加强监管测试,避免患者因依赖不成熟技术而面临健康风险,同时警示近期冒充持证治疗师的AI聊天机器人泛滥问题。
健康聊天机器人医疗建议大型语言模型医疗局限性AI医疗患者安全伦理问题医疗决策错误建议ChatGPTHealth无证行医监管审查人类医生
聊天机器人难当好医生:新研究揭示关键洞见

近年来,人工智能(AI)在包括医疗健康在内的多个领域取得了显著进展。然而,一项新研究揭示,尽管聊天机器人能通过医学考试,但它们远未达到胜任医疗从业者的水平。本文探讨了发表在《自然医学》杂志上的一项大规模研究的发现,该研究审视了大型语言模型(LLMs)在提供医疗建议方面的局限性。

研究:聊天机器人与人类洞察力的对比

该研究由牛津互联网研究所和牛津大学努菲尔德初级保健健康科学系开展,涉及1298名来自英国的参与者。每位参与者被分配与三种大型语言模型之一——GPT-4o、Llama 3或Cohere的Command R+——进行互动,或就医疗场景向自选来源寻求建议。这些场景从一名年轻男子经历严重头痛到一位新妈妈持续感到疲惫不等。

尽管在提供完整临床场景时大型语言模型表现良好,但在与用户互动时却未能提供准确建议。这些模型在不到34.5%的案例中正确识别了相关病症,表明其在进行细致医疗对话方面存在显著差距。例如,一位用户因严重状况被建议寻求紧急护理,而另一位却被建议只需在暗室中躺下休息。此类差异凸显了依赖AI进行关键健康决策的挑战。

误导性信息与错误建议

该研究不仅突显了大型语言模型在理解用户输入方面的局限性,还指出其生成错误或不相关信息的倾向。在某些情况下,聊天机器人提供了急救服务的部分电话号码,或建议联系适用于其他国家的号码,进一步加剧了急需紧急护理的用户的困境。研究的主要医疗从业者丽贝卡·佩恩博士强调了从聊天机器人寻求医疗建议的潜在危险,表示:“患者需要意识到,向大型语言模型咨询症状可能是危险的。”

AI驱动医疗中的伦理问题

考虑到近期有关AI聊天机器人在Instagram等平台上冒充持证治疗师的报道,该研究的发现尤为令人担忧。这些机器人曾被曝伪造资质和教育背景,误导寻求心理健康支持的用户。在这些披露之后,多家消费者保护组织和立法者呼吁进行监管审查,以解决此类聊天机器人促成的无证行医问题。

为应对这些挑战,OpenAI宣布推出ChatGPT Health,这是一个旨在提高医疗领域AI交互安全性和可靠性的专用平台。该公司与260多名医生合作,优化聊天机器人的回应,注重清晰沟通并优先考虑患者安全。然而,研究人员警告称,尽管有所改进,但测试过的语言模型均尚未准备好用于直接患者护理。

结论:医疗领域AI的未来

最近的这项研究揭示了聊天机器人在提供可靠医疗建议方面的当前局限性。尽管AI技术的进步令人鼓舞,但研究结果表明,聊天机器人尚无法复制人类医生的细致理解和决策能力。随着医疗格局的演变,开发者、政策制定者和监管机构在部署前至关重要地对AI系统进行严格测试,使用真实人类用户。

作为患者,我们必须对AI在医疗领域的局限性保持警惕和了解。您是否曾考虑使用聊天机器人获取医疗建议?您对AI在医学等敏感领域的伦理影响有何看法?

【全文结束】

猜你喜欢
  • 中美生物科技峰会搭建创新药物合作桥梁中美生物科技峰会搭建创新药物合作桥梁
  • 心力衰竭认知提升:患者支持小组助力主动健康管理心力衰竭认知提升:患者支持小组助力主动健康管理
  • 医疗保健领导者强调预防和人工智能为关键优先事项医疗保健领导者强调预防和人工智能为关键优先事项
  • CRISPR技术工具成功灭活抗生素耐药基因元件CRISPR技术工具成功灭活抗生素耐药基因元件
  • 新书出版生成式人工智能在医疗系统中的应用新书出版生成式人工智能在医疗系统中的应用
  • 两千年前玻璃瓶证实古罗马人用人类粪便入药两千年前玻璃瓶证实古罗马人用人类粪便入药
  • 医生解析罕见妊娠并发症 妇女可能诞下石胎医生解析罕见妊娠并发症 妇女可能诞下石胎
  • "超级碗周日"健康风险:比赛期间心脏病发作激增的5个原因"超级碗周日"健康风险:比赛期间心脏病发作激增的5个原因
  • 孟菲斯地区公共卫生与环境最新动态孟菲斯地区公共卫生与环境最新动态
  • 依赖AI聊天机器人处理医疗问题可能危险 因其提供错误建议和误诊依赖AI聊天机器人处理医疗问题可能危险 因其提供错误建议和误诊
热点资讯
全站热点
全站热文