伦敦大学学院
一种人工智能(AI)模型正在接受一组来自英格兰5700万人的NHS数据训练,这些数据已经去除了个人身份信息。这是由伦敦大学学院和国王学院研究人员进行的一项世界首创的试点项目。
该模型可能会改变患者的护理方式,识别出早期干预可以显著改善或挽救生命的机会。
Foresight是一种生成式人工智能模型,它基于之前的医疗事件学习预测接下来会发生什么。这类似于ChatGPT这样的模型,后者根据从互联网上获取的数据预测句子中的下一个单词。
Foresight正在接受常规收集的、去标识化的NHS数据训练,例如医院入院记录和新冠疫苗接种率,以预测英格兰各地患者群体的潜在健康结果。这些可能包括住院、心脏病发作或新的诊断。早期预测这些事件可以实现有针对性的干预,从而转向更大规模的预防性医疗保健。
这项试点研究完全在NHS England安全数据环境(SDE)内进行,这是一个安全的数据和研究分析平台,通过提供对英格兰5700万居民的去标识化健康数据的受控访问,使这项工作成为可能。只有通过NHS England SDE才能访问如此大规模的数据,在此过程中,AI模型和所有患者数据都受到严格的NHS控制。
通过包含覆盖英格兰全部人口的数据,该模型可以预测所有人群和罕见疾病的健康结果。
首席研究员克里斯·汤姆林森博士(UCL健康信息学研究所)表示:“人工智能模型的好坏取决于其训练数据的质量。因此,如果我们希望一个模型能够惠及所有患者及其所有疾病,那么人工智能需要在训练过程中看到这些情况。”
“使用全国范围的数据可以使我们代表英格兰人口的千变万化的多样性,特别是对于少数群体和罕见疾病,这些往往被排除在研究之外。”
通过严格的审批流程,英国心脏基金会数据科学中心在健康数据研究英国的支持下,使研究人员得以访问并使用SDE。该中心还邀请了公众成员参与,他们继续为批准和塑造研究做出贡献。
研究人员认为,该模型的预测能力可以确定高风险患者群体,从而打开机会窗口,进行干预以改善和拯救生命。由于训练数据的多样性和完整性,该模型还有助于突出和解决医疗不平等问题。并且,能够在人口层面分析医疗风险和结果,可以为NHS在规划方面提供关键支持。
UCL健康信息学研究所的博士研究员西蒙·埃勒肖表示:“将人工智能所需的计算资源与NHS数据结合起来一直是一个挑战,但感谢我们的合作伙伴的支持,我们已经能够安全地、大规模地将最先进的AI方法应用于NHS数据。”
这项试点研究是在一个安全和受保护的环境中测试模型的机会,保护隐私,并且所有预测都经过严格测试,以确保与现实世界的结果一致。目前,该模型使用的是从2018年11月至2023年底的最近数据,用于有限数量的数据集,并可用于新冠研究。
首席研究员理查德·多布森教授(UCL健康信息学研究所以及国王学院),也是NIHR Maudsley生物医学研究中心副主任,表示:“这项试点是在之前研究的基础上进行的,之前的研究展示了Foresight从两个NHS信托基金的数据中预测健康轨迹的能力。能够在国家层面上使用它是令人兴奋的,因为它有可能展示更强大的预测能力,从而为全国和地方的服务提供信息。”
“目前,这项试点中的数据广泛但浅显,最终我们希望能够利用Foresight背后的专业知识和AI平台,包括更丰富的信息来源,如医生笔记或检查结果,如果这些数据变得可用的话。”
未来,研究人员希望进一步使用更深层次的数据源对模型进行训练,回溯到更早的时间。他们还在探索如何负责任地扩展模型的范围,目前该模型仅限于与新冠相关的研究。
然而,研究人员明确表示:患者和公众必须处于任何关于模型使用和预测的指导方针的核心,以确保这项研究及其应用符合他们的最佳利益。
一位参与审查和批准该项目的英国心脏基金会数据科学中心公众贡献者表示:“作为一名患者,我对这项研究如何帮助识别相关健康状况、降低新疾病的风险以及支持那些面临医疗保健挑战的人感兴趣。重要的是,人们要知道他们的健康数据是如何被使用的,因此看到透明度的关注和确保AI在NHS中的安全、道德使用,以公共利益为核心,是令人鼓舞的。”
NHS England转型国家主任文·迪瓦卡尔博士表示:“如果在大型数据集上训练并在安全环境下测试,AI有潜力彻底改变我们预防和治疗疾病的方式。NHS安全数据环境对这项开创性研究至关重要,塑造了一个未来,在这个未来中,早期治疗和干预措施将针对受益者,预防未来的疾病。这将增强我们快速迈向个性化、预防性护理的能力。”
(全文结束)

