单晚睡眠可能揭示多年后才会发作的疾病隐藏线索。
科学家开发出一种人工智能系统,仅需一晚睡眠数据即可预测未来疾病风险。该系统通过分析大脑、心脏和呼吸的详细生理信号,识别隐藏模式。这项技术成功预测了癌症、痴呆症和心脏病等疾病的患病风险,结果表明睡眠中蕴含的早期健康预警信号长期被医学界忽视。
睡眠基础模型(SleepFM)
该系统名为SleepFM,使用来自6.5万名个体的近60万小时睡眠监测数据进行训练。这些数据源自多导睡眠监测——一种通过多传感器追踪睡眠期间脑活动、心脏功能、呼吸模式、眼动、腿部运动及其他生理信号的深度睡眠检测。多导睡眠监测是评估睡眠的黄金标准,通常在实验室过夜进行。尽管广泛用于诊断睡眠障碍,研究人员发现它捕捉的海量生理信息极少被全面分析。
在常规临床实践中,仅会检查其中少量数据。人工智能的最新进展使研究者能够更彻底地分析这些庞大复杂的数据集。研究团队表示,这是首次在如此大规模上将人工智能应用于睡眠数据。
人工智能训练
为从数据中获取洞见,研究人员构建了基础模型——一种专为从超大数据集学习广泛模式并应用于多项任务的AI类型。ChatGPT等大型语言模型采用类似方法,但训练数据是文本而非生物信号。
SleepFM基于睡眠诊所患者采集的58.5万小时多导睡眠监测数据训练。每个睡眠记录被分割为五秒片段,其功能类似于训练语言类AI系统的单词。该模型整合脑信号、心律、肌肉活动、脉搏测量及呼吸气流等多源信息,学习这些信号的相互作用。为帮助系统理解这些关系,研究人员开发了"留一法对比学习"训练方法:每次移除一种信号类型,要求模型用剩余数据重建该信号。
训练完成后,研究人员将模型适配至特定任务。首先在标准睡眠评估(如识别睡眠阶段和评估睡眠呼吸暂停严重程度)中进行测试,SleepFM的表现达到或超过当前领先模型。
随后,研究者验证睡眠数据能否预测未来疾病。通过将多导睡眠监测记录与同一群体的长期健康结果相关联(得益于单一睡眠诊所积累的数十年医疗记录),SleepFM分析了1000多种疾病类别,发现仅凭睡眠数据就能合理准确预测其中130种疾病。癌症、妊娠并发症、循环系统疾病及精神健康障碍的预测效果最佳,一致性指数均超过0.8。
C指数(一致性指数):生存分析中衡量预测模型区分能力的指标。数值越接近1.0表示预测越准确。在疾病预测中,该指数反映模型区分高风险与低风险患者的能力。
SleepFM在预测帕金森病(C指数0.89)、痴呆症(0.85)、高血压性心脏病(0.84)、心肌梗死(0.81)、前列腺癌(0.89)、乳腺癌(0.87)及死亡风险(0.84)方面表现尤为突出。
该研究发表于《自然医学》期刊,题为《用于疾病预测的多模态睡眠基础模型》。
本文作者:蒂姆·桑德尔博士
蒂姆·桑德尔博士是数字期刊的科学新闻特约编辑,专精科学、技术、环境、商业及健康领域报道。他同时是执业微生物学家、作家,并对历史、政治和时事保持关注。
【全文结束】

