研究人员近日公布了一种新型AI模型,可预测个体罹患1000多种疾病的概率,甚至能估算发病时间。本周发表在《自然》杂志的这项研究将该工具命名为Delphi-2M,其训练数据源自英国和丹麦近230万人的匿名健康记录,标志着生成式AI在人类健康未来预测领域的最大规模应用之一。
与仅覆盖特定疾病(如心脏病、糖尿病)的传统健康计算器不同,Delphi-2M采用整体性方法。该工具能实际模拟数十年间的健康轨迹,预测包括疾病发作序列、睡眠模式及其他健康影响因素在内的并发症发展路径。
Delphi-2M的工作原理
基于ChatGPT等聊天机器人的同源技术,Delphi-2M与语言模型的关键区别在于其专为处理医疗历史数据而非文本设计。每项诊断、人口统计细节或生活方式因素均被编码为类似"标记"的单元,使AI能像语言模型预测下一个单词那样分析疾病发展进程。
核心输入参数包括:
- 年龄与性别
- 涵盖1000多种病症的既往诊断史
- BMI、吸烟及饮酒等生活方式因素
通过这些基础但关键的信息,模型可同时预测患者可能面临的下一个疾病及其发生时间。在英国数据集测试中,该模型对数百种疾病的平均准确率(曲线下面积AUC)达到0.76,考虑到人类健康的复杂性,这一结果相当可观。
成果与局限
研究显示,当要求Delphi-2M为60岁人群生成模拟健康未来时,其十年后的预测结果与实际人口级健康数据高度吻合,表明该工具可用于公共卫生规划,例如识别未来世代可能激增的疾病类型。
然而与所有AI技术一样,该模型存在局限:应用于丹麦数据时准确性下降,证明其跨人群可靠性不均衡;此外,作为预测型AI,模型不可避免地反映训练数据集的偏差。例如,英国生物银行数据偏向较富裕、健康状况更好的参与者,可能导致对代表性不足群体的风险评估失真。
可信度评估
必须明确的是,人类监督必不可少,AI绝不能替代医生。研究人员强调,Delphi-2M目前并非诊断工具,而应视为风险预测引擎,用于识别普遍风险并规划预防性护理。预测您72岁患癌风险高并不意味着必然发生,仅表示您与训练数据中发病人群特征相似。
尽管如此,其潜力令人瞩目。未来类似Delphi-2M的AI模型或可与现有健康计算器协同工作,为患者和医生提供更个性化的未来风险路线图,甚至生成可操作的预防措施以延缓或避免疾病发生。
核心启示
虽然仍处于研究阶段,但AI引导医学的发展引发诸多思考:能否将ChatGPT或Claude用于代码生成的生成式技术,同样应用于疾病预测?Delphi-2M暗示了这样的未来:医生可能利用AI扫描您数十年的潜在健康历程,帮助您在症状出现前就采取预防行动。
【全文结束】