一晚的睡眠可能包含多年后才会显现的疾病的早期预警信号。斯坦福大学的研究人员已经证明,人工智能可以分析睡眠数据来评估癌症、痴呆症或心脏病的长期风险——远在第一症状出现之前。
突破性人工智能估算未来疾病风险
斯坦福大学的研究人员开发出一种名为SleepFM的基础模型。仅使用一晚多导睡眠图(polysomnography)的数据,该系统就能评估100多种医学状况的长期风险。这项人工智能疾病预测的突破使科学家能够识别前列腺癌、乳腺癌、帕金森病、痴呆症、心脏病甚至全因死亡率的升高风险。
SleepFM分析多导睡眠图数据——这是一种综合睡眠检查,记录脑活动、心律、肌肉运动、血氧水平、气流和其他生理信号。
"我们在睡眠研究中记录了数量惊人的信号。这是一个数据极其丰富的过程,"
——研究合著者Emmanuel Mignot博士在ScienceDaily的报道中强调。
研究人员使用包含65,000名年龄在2至96岁个体的585,000小时睡眠记录的庞大数据集训练该模型。随后,研究人员将这些数据与长达25年的电子健康记录相关联,使他们能够将睡眠模式与随时间推移的实际医疗结果进行比较。
SleepFM工作原理:人工智能学习"睡眠语言"
SleepFM作为一种基础模型运行,其概念类似于大型语言模型——不同之处在于,它学习的是生物信号的模式而非文本。
每段睡眠记录被分为五秒的片段,作为睡眠的"词汇"。该模型随后学习多个信号通道之间的复杂关系,包括脑电图(EEG)、心电图(EKG)、呼吸、脉搏血氧测定和肌肉活动。
最有价值的信息来自信号之间的细微差异。例如,系统会检测到脑活动表明处于深度睡眠而心血管系统却表现出身体处于清醒状态的情况。这些差异通常与长期健康风险升高相关。
"SleepFM学习睡眠的语言。它不会用简单的英语解释其推理过程,但我们开发了阐释技术,使我们能够理解模型在评估疾病风险时关注的模式,"
——合著者James Zou博士解释道。
多种疾病中的出色准确性
该人工智能模型评估了1,000多种疾病类别,并确定了130种疾病,仅凭睡眠数据就能以显著准确性估计风险。在这些情况下,模型达到了C指数超过0.8,意味着其预测与实际医疗结果在80%以上的情况下相符。
在癌症、心血管疾病、神经系统疾病、妊娠并发症和精神疾病方面观察到最佳结果。报告的性能包括:
- 帕金森病:0.89
- 痴呆症:0.85
- 高血压:0.84
- 心脏病发作:0.81
- 前列腺癌:0.89
- 乳腺癌:0.87
- 死亡风险:0.84
"我们惊讶于该模型在如此广泛条件下的风险模式识别如此一致,"
——Zou博士补充道。
睡眠研究能否成为预防医学的工具?
迄今为止,临床医生主要使用多导睡眠图来诊断睡眠呼吸暂停或失眠等睡眠障碍。在常规临床实践中,他们只分析所记录数据的一小部分。
SleepFM表明,睡眠中包含未来疾病的早期生物信号,这些信号通常在临床诊断前数年就已出现。如果这些发现在更广泛和更多样化的人群中得到证实,睡眠研究可能成为预防医学的有力工具。
对于风险升高的个体,这种人工智能疾病预测的进步最终可能使医生能够更早地进行干预——远在疾病变得不可逆转之前。
【全文结束】

