研究人员首次使用了一种能够理解图像和语言的高级AI模型来模拟阅读障碍,为潜在的新治疗方法铺平了道路。阅读障碍是影响阅读、拼写和写作的全球最常见的学习障碍,估计影响全球高达20%的人口。迄今为止,研究阅读障碍的传统方法,如行为和神经影像学方法,虽然提供了有价值的见解,但在测试阅读障碍的潜在机制方面仍然存在局限性。
现在,隶属于计算机与通信科学学院和生命科学学院的洛桑联邦理工学院NeuroAI实验室的研究人员,使用新一代视觉语言模型对阅读障碍进行了建模,该模型能够完整模拟从看到文字到处理和理解上下文的整个流程。
在2026年国际学习表示会议(ICLR)上发表的一篇论文中,研究人员概述了如何利用认知神经科学的刺激,发现AI数字孪生大脑的某些部分以与人类大脑处理文字相同的方式运作。然后他们改变了这些部分的工作方式。这项工作也已发表在arXiv预印本服务器上。
行为相似性
NeuroAI实验室的博士助理、该论文的主要作者Melika Honarmand解释道:"当我们确定了AI大脑中对文字反应强烈的视觉文字形态区域后,我们'关闭'了这些部分,以观察模型是否拥有形成完整网络的神经元,并且是否会像人类大脑一样运作。我们发现AI在阅读方面遇到了困难,但它仍然能够理解图像和语言...就像受阅读障碍影响的人一样。它确实有效,并向我们展示了行为上的相似性。"
这项研究建立在近十年来独立使用视觉和语言模型工作的基础上,只有借助最新一代的综合视觉语言模型才成为可能。
NeuroAI实验室负责人Martin Schrimpf教授表示:"仅视觉和仅语言模型确实可以预测一些大脑活动和某些行为,但它们远非完美。"
他继续说道:"我们使用的视觉语言模型是在我们开始这个项目前几个月才发布的,即使是早期的综合模型也不足以让我们针对阅读障碍。这项研究之所以可能,是因为近期AI的指数级进步。"
除了是实验室首个使用新一代视觉语言模型的项目外,这项研究还从过去对健康人群建模的工作转向关注患者群体。
Schrimpf补充道:"我不知道神经AI领域还有其他任何做过这方面工作的研究。阅读障碍一直被认为是一种非常难以描述的障碍或功能障碍,没有人真正了解其机制,但从伦理角度你不能进入人类大脑并敲除所有那些神经元。在模型中,我们可以进行机械扰动,以我们喜欢的方式改变任何东西,所以这感觉就像一个巨大的机会。"
完成研究的这一部分后,研究人员开始评估不同的字体,其中一些是常用字体,另一些则是专门为受阅读障碍影响的人开发的。
研究脑部障碍的通用框架
Honarmand说:"我们在不改变其他任何条件的情况下,检查了模型使用不同字体定义文本的准确性,发现它在专为阅读障碍者设计的字体上表现明显更好,而在那些已知对阅读障碍者有问题的字体上表现更差。我们现在正在使用该模型为自己创建最佳字体,并相应地为阅读障碍者创建。"
她继续说道:"尽管它们并非使用完全相同的架构,但这些模型确实试图复制大脑,所以当然我们期望看到一些相似之处。但令人惊讶的是,关于特定人类大脑组件的假设——当受损时会导致特定行为——在模型中以完全相同的方式发生。"
除了研究结果外,这项研究最令人兴奋的成果之一可能是建立了一个用于研究脑部障碍的计算框架。
Schrimpf总结道:"我们已经将这种方法应用于阅读障碍,但我们认为我们开发的通用框架广泛适用于各种不同的脑部功能障碍。"
"目前我们正在研究与帕金森病相关的视觉幻觉以及更广泛的抑郁症。当然,并非每位临床医生都会立即被基于AI的数字大脑所信服,但在某个时刻,你无法再拒绝证据。如果结果存在,那么至少它可能是一个有用的工具。"
出版详情
Melika Honarmand等人,《在视觉语言模型中诱发阅读障碍》,arXiv (2025)。DOI: 10.48550/arxiv.2509.24597
期刊信息:arXiv
关键医学概念
阅读障碍
临床类别
神经学
心理学与心理健康
提供方:洛桑联邦理工学院
【全文结束】

