使用生成式AI聊天机器人进行心理健康护理可能存在风险,但达特茅斯大学研究人员的一项早期研究表明,这种工具具有潜力。
未来的治疗师可能是一个聊天机器人,并且你可能会看到积极的结果,但现在还不应该开始向ChatGPT倾诉你的感受。
达特茅斯大学的研究人员进行的一项新研究发现,一种设计为治疗师的生成式AI工具在治疗抑郁症、焦虑症和饮食障碍患者方面取得了显著改善——但该工具仍需由人类专家密切监控。
该研究于三月份发表在《NEJM AI》期刊上。研究人员对106名使用Therabot智能手机应用程序的人进行了试验。Therabot是在过去几年中在达特茅斯开发的应用程序。
尽管样本量较小,但研究人员表示这是首次对AI治疗聊天机器人进行临床试验。结果显示了显著的优势,主要是因为该机器人全天候可用,这弥补了传统治疗中的即时性差距。然而,研究人员警告说,如果生成式AI辅助治疗不正确实施,可能会带来危险。
“我认为这个领域还有很多发展空间,”该研究的资深作者、达特茅斯生物医学数据科学和精神病学副教授Nick Jacobson说。“它在个性化和规模化影响方面的潜力非常惊人。”
Therabot研究
共有210名参与者被分为两组——一组106人被允许使用聊天机器人,而对照组则被列入“等待名单”。参与者在接受测试前后通过标准化评估来评估他们的焦虑、抑郁或饮食障碍症状。在前四周,应用程序每天提示用户与其互动。在接下来的四周里,提示停止,但人们仍然可以自行互动。
研究参与者实际上使用了该应用程序,研究人员表示他们惊讶于人们与机器人的交流频率和深度。调查后,参与者报告了一种类似于面对面治疗师的信任和合作程度的“治疗联盟”。
互动的时间也很值得注意,在午夜和其他患者经常感到担忧的时候,互动次数激增。这些时间段很难联系到人类治疗师。
“使用Therabot的人们在整个试验期间,在日常生活中需要时都会访问它,”Jacobson说。这包括某人在凌晨2点因焦虑难以入睡或在经历困难时刻后的立即时段。
参与者的后续评估显示,重度抑郁症患者的症状减少了51%,广泛性焦虑障碍患者的症状减少了31%,处于特定条件风险中的饮食障碍患者的症状减少了19%。
“参加试验的人不仅仅是轻度患者,”Jacobson说。“小组中的成员在开始时是中度到重度的抑郁症患者。但平均而言,他们的症状减少了50%,从重度减轻到轻度或几乎消失。”
Therabot的不同之处
研究团队并没有只是选择100多名需要支持的人,给他们访问像OpenAI的ChatGPT这样的大型语言模型的机会,然后看看会发生什么。Therabot是定制构建的——经过微调以遵循特定的治疗程序。它被设计成能够注意严重的关切,如潜在的自伤迹象,并报告以便人类专业人员在必要时介入。人类还跟踪了机器人的通信,以便在机器人说出不当内容时进行干预。
Jacobson说,在研究的前四周,由于不确定机器人会如何表现,他尽快阅读了每条消息。“在试验的最初部分,我几乎没有睡多少觉,”他说。
人类干预很少见,Jacobson说。两年前对早期模型的测试显示,超过90%的响应符合最佳实践。当研究人员确实进行干预时,通常是因为机器人提供了超出治疗师范围的建议——例如,当它试图提供更一般的医疗建议(如如何治疗性传播疾病)而不是将患者转介给医疗服务提供者时。“它的实际建议都是合理的,但这超出了我们提供的护理范围。”
Therabot不是典型的大型语言模型;它实际上是手工训练的。Jacobson说,一个由100多人组成的团队根据最佳实践创建了一个数据集,描述了治疗师应该如何回应真实的人类经历。“只有最高质量的数据才会被纳入其中,”他说。像谷歌的Gemini或Anthropic的Claude这样的通用模型,训练数据远不止医学文献,可能会做出不适当的回应。
生成式AI能成为你的治疗师吗?
达特茅斯大学的研究是早期迹象,表明专门构建的生成式AI工具在某些情况下是有帮助的,但这并不意味着任何AI聊天机器人都可以成为你的治疗师。这是一个由人类专家监督的受控研究,自行尝试存在危险。
记住,大多数通用大型语言模型是基于互联网上的大量数据训练的。因此,虽然它们有时可以提供一些好的心理健康指导,但也包含错误信息——比如虚构的治疗师的行为,或者人们在网上论坛上发布的关于心理健康的内容。
“他们在健康设置中表现出许多极其不安全的行为,”他说。
即使一个聊天机器人提供有用的建议,也可能在错误的情况下造成伤害。Jacobson说,如果你告诉聊天机器人你正在尝试减肥,它会想出帮助你的方法。但如果你正在处理饮食障碍,这可能是有害的。
许多人已经在使用聊天机器人来执行类似治疗师的任务。Jacobson说你应该小心。
“在训练方式方面,它非常接近互联网的质量,”他说。“那里有很好的内容吗?是的。那里有危险的内容吗?也是的。”
用对待陌生网站同样的怀疑态度对待你从聊天机器人那里得到的任何信息,Jacobson说。尽管它看起来比一般的生成式AI工具更精致,但它仍然可能不可靠。
如果你或你爱的人患有饮食障碍,请联系全国饮食障碍协会寻求可以帮助的资源。如果你觉得你或你认识的人正处于紧急危险中,请拨打988或发送短信“NEDA”至741741以连接危机短信热线。
(全文结束)

