一项新的研究表明,分析个人的词选择可以预测重度抑郁症症状的恶化。研究人员使用了人类评估者和ChatGPT来评估书面回应,发现两者都能准确预测几周后的抑郁严重程度。虽然传统的语言分析工具如LIWC表现不佳,但ChatGPT成功地通过词序和短语意义捕捉到了情感基调。这一发现可能为AI辅助的心理健康评估铺平道路,为临床医生提供新的诊断和预测心理健康结果的工具。
这项研究由耶鲁大学进行,结果显示一个人的词选择可以预测其未来抑郁症症状的恶化。研究人员通过人类评估者和大型语言模型ChatGPT,证明了对开放式问题的书面回应可以用来预测谁会在几周后经历更严重的抑郁症状。该研究结果于9月16日发表在《美国国家科学院院刊》上,表明自动化的语言评估程序可能补充并增强心理评估。
越来越多的研究揭示了抑郁与个人使用的语言之间的联系。例如,患有抑郁症的人在社交媒体和短信中使用更多的负面情绪词汇,而词选择与个体对治疗的反应有关。在这项研究中,耶鲁大学的研究人员希望探索语言是否也能提供对未来症状的洞察。为了更好地理解这一点,他们要求467名参与者回答九个开放性、中性的简答题,并完成了评估抑郁严重程度的患者健康问卷(PHQ-9)。三周后,所有参与者再次完成了PHQ-9问卷。
研究人员使用了一种名为Linguistic Inquiry and Word Count(LIWC)的工具,该工具可以计算属于特定类别的词汇数量,以确定参与者对简答题的书面回应中有多少词汇具有积极或消极的情感基调。尽管LIWC得分与参与者回答问题时的抑郁严重程度相关,但它们未能预测三周后的抑郁严重程度。
另一方面,人类评估者给出的情绪得分确实预测了未来的抑郁症状。“这告诉我们,人类评估者捕捉到了仅仅统计情感词汇无法捕捉到的东西,”耶鲁大学艺术与科学学院心理学助理教授、该研究的资深作者Robb Rutledge说。
LIWC单独处理每个词,这可能是它在此特定应用中表现不佳的原因,研究人员表示。“我们想研究词序和语言的情感基调塑造中起核心作用的多维方面,”主要作者Jihyun Hur说,她是Rutledge实验室和合著者Jutta Joormann(理查德·埃利基金会心理学教授)实验室的博士生。“这就是我们对ChatGPT感兴趣的时候。”
ChatGPT是一种旨在模仿人类对话的人工智能工具。因此,词序和短语之间的意义以标准语言分析工具(如LIWC)无法做到的方式被考虑在内。当研究人员指示ChatGPT 3.5和4.0版本评估参与者的回应的正面和负面情感时,这些得分像人类评估者的得分一样,预测了未来抑郁严重程度的变化。
研究人员表示,这一发现是一个起点,为后续研究奠定了基础。Rutledge和他的团队对如何将这种方法应用于其他精神疾病和更长时间段的研究感兴趣。
这项工作是实验室正在进行的研究的一部分,研究情感与决策之间的关系。任何人都可以通过玩实验室免费的智能手机应用程序Happiness Quest中的游戏来参与这项研究。
Rutledge认为,这种语言评估在未来可能会成为临床医生工具箱中的一个有用补充。“对人们使用的语言进行分析提供了临床医生目前没有的额外信息,我们的方法可能是临床医生评估患者的一种方式,”Rutledge说。“你希望有一套适用于许多人的工具,这些工具结合起来可以给你一个个体的快照。如果其中一些工具是自动化的,这将使临床医生有更多时间帮助患者。”
最终,更好地理解症状及其预测方法将是有益的。“像ChatGPT这样的人工智能工具为利用临床环境中已有的大量语言数据更好地理解心理健康开辟了新的途径,”Hur说。
(全文结束)

