聊天机器人可以成为你的治疗师吗？研究发现其在适当监管下有“巨大潜力” - AI与医疗健康

聊天机器人可以成为你的治疗师吗？研究发现其在适当监管下有“巨大潜力”Can a Chatbot Be Your Therapist? A Study Found 'Amazing Potential' With the Right Guardrails

环球医讯 / AI与医疗健康来源：www.cnet.com美国 - 英语2025-04-03 17:22:00 - 阅读时长5分钟 - 2192字

达特茅斯大学研究人员开发的一款名为Therabot的生成式AI工具在治疗抑郁症、焦虑症和饮食障碍方面显示出显著优势，但需要人类专家的密切监督。这项初步研究表明，这种个性化且可扩展的治疗方法具有巨大的潜力。

使用生成式AI聊天机器人进行心理健康护理可能存在风险，但达特茅斯大学研究人员的一项早期研究表明，这种工具具有潜力。

未来的治疗师可能是一个聊天机器人，并且你可能会看到积极的结果，但现在还不应该开始向ChatGPT倾诉你的感受。

达特茅斯大学的研究人员进行的一项新研究发现，一种设计为治疗师的生成式AI工具在治疗抑郁症、焦虑症和饮食障碍患者方面取得了显著改善——但该工具仍需由人类专家密切监控。

该研究于三月份发表在《NEJM AI》期刊上。研究人员对106名使用Therabot智能手机应用程序的人进行了试验。Therabot是在过去几年中在达特茅斯开发的应用程序。

尽管样本量较小，但研究人员表示这是首次对AI治疗聊天机器人进行临床试验。结果显示了显著的优势，主要是因为该机器人全天候可用，这弥补了传统治疗中的即时性差距。然而，研究人员警告说，如果生成式AI辅助治疗不正确实施，可能会带来危险。

“我认为这个领域还有很多发展空间，”该研究的资深作者、达特茅斯生物医学数据科学和精神病学副教授Nick Jacobson说。“它在个性化和规模化影响方面的潜力非常惊人。”

Therabot研究

共有210名参与者被分为两组——一组106人被允许使用聊天机器人，而对照组则被列入“等待名单”。参与者在接受测试前后通过标准化评估来评估他们的焦虑、抑郁或饮食障碍症状。在前四周，应用程序每天提示用户与其互动。在接下来的四周里，提示停止，但人们仍然可以自行互动。

研究参与者实际上使用了该应用程序，研究人员表示他们惊讶于人们与机器人的交流频率和深度。调查后，参与者报告了一种类似于面对面治疗师的信任和合作程度的“治疗联盟”。

互动的时间也很值得注意，在午夜和其他患者经常感到担忧的时候，互动次数激增。这些时间段很难联系到人类治疗师。

“使用Therabot的人们在整个试验期间，在日常生活中需要时都会访问它，”Jacobson说。这包括某人在凌晨2点因焦虑难以入睡或在经历困难时刻后的立即时段。

参与者的后续评估显示，重度抑郁症患者的症状减少了51%，广泛性焦虑障碍患者的症状减少了31%，处于特定条件风险中的饮食障碍患者的症状减少了19%。

“参加试验的人不仅仅是轻度患者，”Jacobson说。“小组中的成员在开始时是中度到重度的抑郁症患者。但平均而言，他们的症状减少了50%，从重度减轻到轻度或几乎消失。”

Therabot的不同之处

研究团队并没有只是选择100多名需要支持的人，给他们访问像OpenAI的ChatGPT这样的大型语言模型的机会，然后看看会发生什么。Therabot是定制构建的——经过微调以遵循特定的治疗程序。它被设计成能够注意严重的关切，如潜在的自伤迹象，并报告以便人类专业人员在必要时介入。人类还跟踪了机器人的通信，以便在机器人说出不当内容时进行干预。

Jacobson说，在研究的前四周，由于不确定机器人会如何表现，他尽快阅读了每条消息。“在试验的最初部分，我几乎没有睡多少觉，”他说。

人类干预很少见，Jacobson说。两年前对早期模型的测试显示，超过90%的响应符合最佳实践。当研究人员确实进行干预时，通常是因为机器人提供了超出治疗师范围的建议——例如，当它试图提供更一般的医疗建议（如如何治疗性传播疾病）而不是将患者转介给医疗服务提供者时。“它的实际建议都是合理的，但这超出了我们提供的护理范围。”

Therabot不是典型的大型语言模型；它实际上是手工训练的。Jacobson说，一个由100多人组成的团队根据最佳实践创建了一个数据集，描述了治疗师应该如何回应真实的人类经历。“只有最高质量的数据才会被纳入其中，”他说。像谷歌的Gemini或Anthropic的Claude这样的通用模型，训练数据远不止医学文献，可能会做出不适当的回应。