科学家们开发了一种人工智能系统,能够利用一晚的睡眠数据预测数十种严重疾病的患病风险。通过发现大脑和身体信号中的细微不匹配,该系统能在疾病出现前很久就揭示早期预警信号。
辗转反侧的夜晚通常会导致第二天疲劳,但也可能预示着很久以后才会出现的健康问题。斯坦福医学院及其合作者的科学家们开发了一种人工智能系统,能够检测一晚睡眠中的身体信号,并评估一个人罹患100多种不同疾病的风险。
该系统名为SleepFM,使用来自65,000名个体的近600,000小时睡眠记录进行训练。这些记录来自多导睡眠监测,这是一种深度睡眠测试,使用多个传感器来追踪睡眠期间的大脑活动、心脏功能、呼吸模式、眼球运动、腿部运动和其他生理信号。
睡眠研究蕴藏未开发的健康数据
多导睡眠监测被认为是评估睡眠的金标准,通常在实验室环境中进行整夜监测。虽然它被广泛用于诊断睡眠障碍,但研究人员意识到它还捕获了大量很少被完全分析的生理信息。
"我们在研究睡眠时记录了大量信号,"斯坦福医学院睡眠医学克雷格·里诺兹教授、该新研究的共同资深作者埃马纽埃尔·米尼奥特(Emmanuel Mignot)医学博士、哲学博士表示,"我们研究的是受试者完全处于监控状态下的八小时生理状态,数据非常丰富。"
在常规临床实践中,仅会检查这些信息的一小部分。人工智能的最新进展使研究人员能够更彻底地分析这些大型复杂数据集。研究团队表示,这是首次在如此大规模上将AI应用于睡眠数据。
"从AI角度来看,睡眠相对研究不足。虽然有很多AI工作专注于病理学或心脏病学,但尽管睡眠是生活中如此重要的一部分,针对睡眠的研究却相对较少,"该研究的共同资深作者、生物医学数据科学副教授詹姆斯·邹(James Zou)哲学博士表示。
教授AI睡眠的模式
为从数据中提取洞察,研究人员构建了一个基础模型,这是一种旨在从非常大的数据集中学习广泛模式,然后将这些知识应用于多种任务的AI。类似ChatGPT等大型语言模型采用相似方法,尽管它们是使用文本而非生物信号进行训练的。
SleepFM使用从睡眠诊所患者收集的585,000小时多导睡眠监测数据进行训练。每个睡眠记录被分为五秒的片段,其功能类似于训练基于语言的AI系统的"词"。
"SleepFM本质上是在学习睡眠的语言,"邹表示。
该模型整合了包括脑信号、心律、肌肉活动、脉搏测量和呼吸气流在内的多种信息流,并学习这些信号如何相互作用。为帮助系统理解这些关系,研究人员开发了一种称为"留一法对比学习"的训练方法。这种方法一次移除一种信号类型,并要求模型使用剩余数据重建它。
"我们在本工作中取得的一项技术突破是弄清楚如何协调所有这些不同的数据模式,使它们能够共同学习同一种语言,"邹表示。
从睡眠预测未来疾病
训练完成后,研究人员将该模型调整用于特定任务。他们首先在标准睡眠评估上进行测试,例如识别睡眠阶段和评估睡眠呼吸暂停严重程度。在这些测试中,SleepFM达到或超过了当前使用领先模型的性能。
研究团队随后追求一个更雄心勃勃的目标:确定睡眠数据是否能预测未来疾病。为此,他们将多导睡眠监测记录与来自同一受试者的长期健康结果联系起来。这成为可能,因为他们能够获取来自单一睡眠诊所数十年的医疗记录。
斯坦福睡眠医学中心由已故的威廉·德门特(William Dement)医学博士、哲学博士于1970年创立,他被广泛认为是睡眠医学之父。用于训练SleepFM的最大一组包括约35,000名年龄在2至96岁之间的患者。他们的睡眠研究于1999年至2024年间在诊所进行,并与电子健康记录配对,其中一些患者被追踪长达25年。
(米尼奥特表示,该诊所的多导睡眠监测记录甚至可以追溯得更久,但仅以纸质形式存在;米尼奥特曾在2010年至2019年期间担任睡眠中心主任。)
利用这一综合数据集,SleepFM审查了1,000多种疾病类别,并确定了仅使用睡眠数据就能以合理准确性预测的130种疾病。在癌症、妊娠并发症、循环系统疾病和精神健康障碍方面的预测结果最为显著,预测得分一致性指数超过0.8。
如何衡量预测准确性
一致性指数(C-index)衡量模型按风险对人员进行排序的能力。它反映了模型正确预测两人中谁将先经历健康事件的频率。
"对于所有可能的受试者对,模型给出谁更可能先经历事件——例如心脏病发作——的排序。一致性指数为0.8意味着模型的预测与实际发生情况有80%的时间一致,"邹表示。
SleepFM在预测帕金森病(C-index 0.89)、痴呆(0.85)、高血压性心脏病(0.84)、心肌梗死(0.81)、前列腺癌(0.89)、乳腺癌(0.87)和死亡风险(0.84)方面表现尤为出色。
"我们惊喜地发现,对于相当多样化的疾病,该模型能够做出有信息量的预测,"邹表示。
邹还指出,准确性较低的模型,通常一致性指数在0.7左右,已经在医疗实践中使用,例如帮助预测患者如何应对某些癌症治疗的工具。
理解AI所见内容
研究人员目前正在努力改进SleepFM的预测,并更好地理解系统如何得出结论。未来版本可能会整合来自可穿戴设备的数据,以扩展生理信号的范围。
"它不会用英语向我们解释,"邹表示,"但我们开发了不同的解释技术,以弄清楚模型在做出特定疾病预测时关注什么。"
研究团队发现,虽然与心脏相关的信号在预测心血管疾病时更具影响力,与大脑相关的信号在精神健康预测中扮演更大角色,但最准确的结果来自结合所有类型的数据。
"我们在预测疾病时获得的最多信息是通过对比不同通道,"米尼奥特表示。不同身体成分不同步——例如看起来在睡觉的大脑但看起来清醒的心脏——似乎预示着问题。
丹麦技术大学生物医学数据科学博士生拉胡尔·塔帕(Rahul Thapa)和丹麦技术大学博士生马格努斯·鲁德·凯尔(Magnus Ruud Kjaer)是该研究的共同第一作者。
来自丹麦技术大学、哥本哈根大学医院-里格斯医院、BioSerenity、哥本哈根大学和哈佛医学院的研究人员为这项工作做出了贡献。
该研究获得了美国国立卫生研究院(资助号R01HL161253)、骑士-亨尼西学者项目和陈-扎克伯格生物中心的资助。
【全文结束】

