研究概要
罗切斯特大学研究人员发现,人工智能可通过分析患者朗读特定句子时的语音特征,以85.7%的准确率检测帕金森病。这项突破性技术使用网页端麦克风录音即可完成检测,可能为医疗资源匮乏地区带来革命性改变。
技术原理
系统通过分析"the quick brown fox jumps over the lazy dog"(包含英语所有26个字母的典型句)的朗读语音,捕捉语音质量、节奏和发音中的细微变化。研究团队整合WavLM、ImageBind和Wav2Vec 2.0三种先进语音模型,开发出新型"基于投影的融合架构",从1306名受试者(392名患者/914名健康人)的录音数据中提取复杂语音特征。
临床验证
- 内部测试:85.7%准确率,88.9% AUROC(受试者工作特征曲线下面积)
- 外部验证:70-75%准确率,78-82% AUROC
- 诊断效能优于非专科医生(73.8%)并接近专科医生(79.6%)
- 无显著性别/种族偏差,但对过渡年龄组(老年女性/中年男性)误判率较高
全球医疗价值
- 潜在解决2030年全球帕金森病例翻倍带来的医疗资源缺口(2014年孟加拉国1.4亿人口仅86名神经科医生)
- 可作为家庭筛查工具(需网络和电脑设备),阳性结果提示就医
- 美国治疗成本预计从2017年的520亿美元增至2030年的790亿美元
局限性
- 仅适用于英语使用者
- 25%假阴性率(漏诊率)
- 需要稳定的网络连接
- 与正常衰老导致的语音变化存在重叠
- 数据集中患者比例失衡(对照组914人 vs 患者392人)
技术细节
- 训练集:70%数据
- 验证集:15%数据
- 测试集:15%数据
- 关键指标:75%灵敏度,91.08%特异性
- 论文发表于《npj帕金森病》2025年第11卷,研究编号P50NS108676
罗切斯特大学计算机科学教授Ehsan Hoque表示:"通过用户授权,亚马逊Alexa或谷歌助手等语音接口可能帮助人们判断是否需要就医。"该研究经美国国立卫生研究院和戈登与贝蒂·摩尔基金会资助,所有作者声明无利益冲突。
【全文结束】

