AI聊天机器人在识别精神药物反应方面存在不足，仍落后于专家建议AI chatbots aren't experts on psych med reactions—yet

环球医讯 / AI与医疗健康来源：medicalxpress.com美国 - 英语2025-08-24 05:41:29 - 阅读时长2分钟 - 770字

乔治亚理工学院研究发现，基于大语言模型的AI聊天机器人在识别精神药物不良反应和提供专家级应对策略方面存在显著缺陷。研究团队通过Reddit数据构建测试集，发现AI在区分不同副作用类型、提供可操作建议方面准确率不足50%，尽管其回复情感和可读性接近人类专家。该研究为改善医疗AI提供了重要参考方向。

AI聊天机器人在识别精神药物反应方面存在不足，仍落后于专家建议

基于大语言模型（LLMs）的AI聊天机器人虽然能全天候提供免费服务，但其在精神药物副作用识别方面的表现远未达到医疗标准。乔治亚理工学院最新研究显示，AI在检测药物不良反应准确率不足40%，在提供可操作建议方面与精神病学专家建议的匹配度低于35%。

由Munmun De Choudhury教授和博士生Mohit Chandra领导的研究团队开发了新型评估框架，通过分析Reddit平台上超过2000条真实用药讨论，系统评估了GPT-4o、LLama-3.1等九个模型的表现。研究发现：

AI对药物反应主观描述的识别准确率仅为38.7%
在区分神经兴奋、代谢紊乱等七类副作用时，分类准确率不足45%
虽然回复情感温度与专家相当，但仅有29%的建议具备临床可操作性
医疗专用模型表现优于通用模型，但差距不足5%

研究团队与八位精神病学专家合作建立了评估标准，发现AI系统在三个关键环节存在明显缺陷：对非典型副作用描述的识别失误率高达62%，对紧急状况的分级准确率仅31%，提出的缓解策略中仅有18%符合临床指南。

"当患者无法获得专业医疗帮助时，AI建议的偏差可能直接影响生命安全。"Chandra强调，"我们的测试显示，AI在处理'服药后出现幻觉'这类紧急情况时，42%的回复未能建议立即就医。"

这项发表于NAACL 2025的研究建议从三个维度改进医疗AI：

建立包含真实患者叙事的训练数据集
开发针对精神药物反应的专用模型
构建专家反馈的强化学习机制

研究团队计划与梅奥诊所合作开发新型训练框架，旨在将AI的临床建议准确率提升至80%以上。De Choudhury教授指出："医疗AI不应追求完美替代医生，而应专注于成为连接患者与专业医疗的有效桥梁。"

【全文结束】

本文内容由家庭大健康团队所原创或整理，未经授权不得转载、摘编或利用其它方式使用。欢迎分享至朋友圈。
本文仅代表作者观点，不代表本站立场，如有侵权请联系我们删除。

AI内容声明：本页内容撰写过程部分涉及AI（包括且不限于题材，素材，提纲的搜集与整理），请注意甄别。

猜你喜欢

人工智能促进公共卫生发展
信任与依从性：面向老年人的医疗机器人顾问
Simple Avo™获2025年度MedTech突破奖"最佳虚拟健康教练"
数字健康融资TOP榜：Advocate与Corewell力挺Rad AI
AI外骨骼助轮椅使用者重新行走
法国初创公司Aqemia利用人工智能支持的物理工具加速药物研发
AI模型提升肝癌风险预测准确率
科学家称生命与死亡间存在“第三状态” 细胞或具备意识
Ensemble与Solventum合作推进AI自动化住院患者编码
风险投资集团在等待萨玛健康收购获批之际分享人工智能应用愿景

热点资讯

全站热点

全站热文