能够即时准确预测个人未来数年的健康轨迹,长期以来被视为医学的巅峰成就。这类信息将对整个医疗保健系统产生深远影响——使医疗重心从治疗转向预防。
根据近期发表的一篇论文研究成果,研究人员正致力于实现这一目标。通过尖端人工智能(AI)技术,研究团队开发了Delphi-2M工具。该工具旨在预测个人未来20年内最可能发生的健康事件及其发生时间,可针对包括癌症、糖尿病和心脏病在内的千余种不同疾病进行预测。
为开发Delphi-2M,欧洲研究团队使用了英国生物样本库(UK Biobank)近40.3万人的数据作为AI模型的输入。在最终训练完成的AI模型中,Delphi-2M基于个人出生性别、身体质量指数、吸烟饮酒习惯以及既往疾病时间线,预测下一个疾病及其发生时间。
该模型预测的曲线下面积(AUC)达到0.7。AUC综合了假阳性和假阴性率,可作为理论环境下准确性的代理指标。这意味着该模型在所有疾病类别上的预测准确率约为70%——尽管这些预测在现实世界结果中的准确性尚未经过验证。随后研究团队将该模型应用于丹麦生物样本库数据,验证其依然保持相似的理论准确率。
AI工具
论文的目的并非表明Delphi-2M已准备好供医生或医疗领域使用,而是展示研究团队提出的AI架构的潜力,及其在分析医疗数据方面的优势。
Delphi-2M采用"变换器网络"(transformer network)进行预测,这也是驱动ChatGPT的技术架构。研究人员修改了GPT2变换器架构,使其能够利用时间和疾病特征来预测何时以及会发生何种健康事件。尽管过去其他健康预测模型也曾使用变换器网络,但这些模型仅设计用于预测个人患单一疾病的风险,且主要应用于小规模医院记录数据。
变换器网络特别适合预测个人患多种疾病的风险,因为它们能轻松调整关注点,并能从多个不同数据点解析多种疾病之间的复杂交互关系。Delphi-2M已被证明比使用其他架构的多疾病预测模型略为准确。
例如,Milton模型采用标准机器学习技术组合应用于相同的英国生物样本库数据,其对大多数疾病的预测能力低于Delphi-2M——且需要使用更多数据才能达到该水平。此外,非变换器模型难以通过添加更多数据层进行改进,这意味着这些模型无法像变换器模型那样轻松适应和改进以用于不同场景和研究。
尚为时过早
无论Delphi-2M是否将成为预测患者未来健康风险的AI工具的基础模型,它都表明这类模型正在发展中。得益于其分层架构和开源特性,未来类似Delphi-2M的模型将继续通过整合更丰富的数据(如电子健康记录、医学影像、可穿戴设备技术和地理位置数据)而不断进化,从而随时间推移提升其预测能力和准确性。
然而,尽管预防疾病和提供早期诊断的能力前景广阔,但这款预测工具仍存在几个关键注意事项。
首先,此类工具存在诸多与数据相关的担忧。正如我们先前所述,AI工具接收的数据质量和训练水平决定了其预测的成败。
用于创建Delphi-2M的英国生物样本库数据集在种族和民族多样性方面数据不足,无法进行深入训练和性能分析。尽管Delphi-2M研究人员进行了一些分析,表明添加种族和民族因素对结果影响不大,但在许多类别中仍缺乏足够数据进行评估。
若在现实世界中应用,个人医疗数据可能会被使用并叠加在Delphi-2M等基础模型之上。虽然纳入这些个人数据将提高预测准确性,但也带来风险——例如个人数据安全和数据的上下文外使用问题。
将该模型扩展到医疗系统与数据集设计所用系统不同的国家也可能存在困难。例如,将Delphi-2M应用于美国环境可能更具挑战性,因为美国的医疗数据分散在多个医院系统和私人诊所中。
目前,Delphi-2M尚不适合患者或医生使用。虽然Delphi-2M基于训练数据提供了概括性预测,但将其用于个体患者的个性化健康建议仍为时过早。但希望随着对Delphi-2M类模型研究和构建的持续投入,未来某天能够将患者的个人健康数据输入模型,获得个性化预测。
【全文结束】

