《自然》杂志详细介绍了名为德尔斐-2M的新生成式AI模型,该模型可预测个人多达1000多种疾病的患病风险,提前期可达20年。
一个由欧洲科学家组成的团队开发了一种强大的新型生成式AI,可以预测个人多达1000多种疾病的患病风险,有时甚至能提前数十年进行预测。这款名为德尔斐-2M(Delphi-2M)的模型在2025年9月17日发表于《自然》杂志的一项研究中进行了详细介绍。
通过分析数十万人的健康记录和生活方式数据中的模式,该工具提供全面的健康预测。其创造者认为,它可以通过识别高风险患者进行早期干预,并帮助规划未来的医疗需求,从而改变预防医学。
这标志着个性化、预测性医疗保健的重要一步。该项目是欧洲分子生物学实验室(EMBL)、德国癌症研究中心(DKFZ)和哥本哈根大学之间的重大合作成果。
基于GPT架构的健康预言家
德尔斐-2M建立在修改版的生成式预训练变换器(GPT)架构之上,这也是ChatGPT等AI聊天机器人的基础技术。研究人员使用来自英国生物银行(UK Biobank)的庞大匿名数据集对模型进行了训练,该数据集包含40万名参与者的健康信息。
与按顺序处理单词的标准大型语言模型(LLMs)不同,德尔斐-2M被改进以处理健康数据的时间特性。它用对年龄的连续理解替代了离散的位置编码,并增加了第二个输出,不仅能预测什么疾病可能发生,还能预测何时发生。
该AI将患者的整个病史作为一系列事件进行处理。它考虑诊断、诊断时间以及年龄、性别、BMI和个人习惯(如吸烟或饮酒)等个人因素。
这使其能够学习导致未来健康结果的复杂因素相互作用。
为确保模型的稳健性,其预测结果在一个完全独立的数据集上进行了验证:来自丹麦国家患者登记处的190万人的健康记录。
EMBL临时执行主任伊万·伯尼(Ewan Birney)指出该模型令人印象深刻的适应性,表示:"我们惊讶于该模型从英国转移到丹麦的效果如此之好,尽管它从未见过任何丹麦数据。"
从单一疾病评分到整体预测
目前的临床工具,如用于心脏病的QRisk评分,通常只关注单一疾病。
德尔斐-2M通过同时评估1000多种疾病的风险代表了范式转变。这种整体方法提供了对个人未来健康更为全面的图景。
该模型的性能被发现可与甚至优于这些已建立的单一疾病预测工具。
正如伯尼所解释的:"我们可以同时处理所有疾病并在很长一段时间内进行预测。这是单一疾病模型无法做到的。"这种多疾病、长期的视角是该工具的关键创新。
除了个人预测外,德尔斐-2M还可以生成"合成的未来健康轨迹"。
此功能使医疗规划者能够模拟人口内的未来疾病负担,为资源分配和战略规划提供强大工具。
DKFZ的莫里茨·格斯特恩教授(Professor Moritz Gerstung)表示:"像我们这样的生成模型有朝一日可以帮助大规模个性化护理并预测医疗需求。"
临床AI竞赛及其伦理障碍
德尔斐-2M的发布正值科技巨头加大进军医疗AI的力度。
微软最近详细介绍了其用于复杂诊断的MAI-DxO系统,而谷歌刚刚开始在医院部署其Med-PaLM 3模型,标志着竞争激烈的格局。
这一快速进展伴随着深刻的伦理担忧。即使"去标识化"的大型健康数据集的使用也引发了重大的隐私问题。
围绕英国"远见"(Foresight)AI的近期争议——该AI在5700万份NHS记录上进行了训练——突显了公众和专家对数据安全和重新识别可能性的焦虑。
批评者认为,准确AI模型所需的数据丰富性使得真正的匿名化几乎不可能,从而造成敏感信息暴露的风险。
这场辩论凸显了创新与数据隐私基本权利之间的紧张关系,这是行业尚未解决的挑战。
专家们敦促谨慎行事,强调建立公众信任与技术创新同等重要。
临床部署的道路将需要应对复杂的监管和伦理挑战。
参与该项目的研究人员将此视为一个基础步骤。格斯特恩教授表示:"这是理解人类健康和疾病进展新方式的开始。"
最终目标是创建一种能够安全有效地增强临床决策的工具,带来预防性和个性化医疗的新时代。
【全文结束】