共享AI见解而不共享患者数据Sharing AI insights without sharing patient data

环球医讯 / AI与医疗健康来源:www.fredhutch.org美国 - 英语2025-01-07 02:00:00 - 阅读时长8分钟 - 3645字
本文介绍了弗雷德·哈奇癌症研究中心领导的一项联盟项目,该项目旨在利用先进的AI技术,在不共享患者数据的前提下,通过联邦学习方法提升癌症研究和治疗的效果,从而更好地保护患者隐私并推动医学进步。
癌症AI患者数据隐私保护弗雷德·哈奇联邦学习CAIA模型训练医疗记录健康信息伦理优先计算技术合作研究预测性模型癌症治疗罕见癌症机器学习数据共享合规框架人机协作
共享AI见解而不共享患者数据

弗雷德·哈奇癌症研究中心(Fred Hutch)首席数据官杰夫·里克(Jeff Leek)在2024年6月10日于华盛顿州西雅图举行的弗雷德·哈奇教员退修会上主持了一场关于人工智能的分组讨论会。照片由罗伯特·胡德(Robert Hood)/弗雷德·哈奇新闻服务提供。

保护私人健康信息不仅是一项法律义务,也是弗雷德·哈奇癌症研究中心最高的伦理优先事项之一。电子健康记录跟踪所有与患者护理和治疗相关的临床数据,包括检查结果、生命体征、病程记录和放射学报告。这些记录还包含有关年龄、性别、种族、收入、教育水平和婚姻状况等个人信息。医学影像和基因测序有助于指导个体患者的护理。

所有同意参与研究的弗雷德·哈奇患者的累积数据对于癌症研究也具有重要价值。通过使用复杂的计算技术,弗雷德·哈奇的研究人员可以在这些患者数据中找到隐藏的模式和联系,以更好地理解癌症并发现更有效的治疗方法。其他综合癌症中心也在从其患者记录中学习。

然而,患者保密的要求使得难以将来自不同中心的数据整合到一个单一的计算机模型中,该模型可以根据大量实例进行强大的预测和推理。为此,弗雷德·哈奇宣布了一个项目,与另外三个国家癌症研究所指定的癌症中心合作,利用尖端的人工智能技术构建这样一个模型。

癌症AI联盟(Cancer AI Alliance - CAIA)包括丹娜法伯癌症研究所(Dana-Farber Cancer Institute)、纪念斯隆凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)、悉尼基梅尔综合癌症中心(The Sidney Kimmel Comprehensive Cancer Center)以及约翰霍普金斯大学惠廷工程学院(Whiting School of Engineering at Johns Hopkins)。弗雷德·哈奇获得了初始资金并将作为联盟的协调中心。CAIA得到了AWS、德勤、微软、英伟达和Slalom提供的超过4000万美元的资金、AI技术和专业知识支持。

CAIA中心将共同建立一个资源,使研究人员能够在不共享患者数据的情况下,构建一个从每个癌症中心的患者记录中学习的计算机模型。

计算机模型的工作原理

基本上,模型是对现实的简化表示,就像地图一样。想象一下你是如何到达今天的工作地点的。你依赖于基于以前通勤经历的心理地图。你走的路越多,心理地图就越可靠,这很重要,因为它帮助你准确预测交通情况并准时到达。

但心理地图仍然是你通勤的模型,不是真实的情况。绕道、关闭、事故、天气和水手队的主场比赛都是可能影响通勤的变量,你需要不断更新心理地图以使其更接近实际情况。

弗雷德·哈奇和其他CAIA中心希望创建一个可以准确预测患者癌症可能如何进展、哪些治疗在什么条件下可能有效以及癌症如何改变以逃避这些治疗的计算机模型。这个模型需要从大量多样化的患者数据中学习,以准确反映现实世界中的癌症。模型的变量将是代表患者记录中所有不同类型信息的数字,从年龄、种族和吸烟史到遗传学、MRI、血液测试和药物剂量。这些变量及其相对影响是模型的设置,可以根据反馈调整,以使模型的预测更加准确。

如何共享见解而不共享数据

弗雷德·哈奇只能在其自己的数据上训练模型,但如果它还能训练波士顿、纽约和巴尔的摩的患者数据,其模型会更好。同样,这些中心的模型也会因为训练西雅图和其他城市的患者数据而变得更好。联邦学习方法使得这一点成为可能,而无需共享患者数据。具体过程如下:

每个CAIA中心都会获得同一总体模型的副本,并在自己的患者数据上对其进行训练,调整变量设置以获得更准确的预测。然后,各中心将这些新的、调整后的设置发送到中央位置以更新和改进总体模型。当你更新你的通勤心理地图以反映水手队的主场比赛时,你不需要知道谁在比赛、谁是首发投手或水手队正在与谁比赛——只需要知道日期和时间即可。

同样,在更新癌症模型时,你不需要共享完整的患者数据配置文件。各中心只会共享调整后的设置,而不是影响这些调整的患者数据。患者记录本身仍然安全地保存在各个机构的防火墙内。这些共享的调整(数百万个)被合并,以建立反映总体模型从所有中心的患者记录中学到的新共识设置。每个中心然后会获得更新后的总体模型的新共识设置副本,并用自身的患者数据进一步细化。这一本地训练和中央更新的循环可能会重复多次,以使癌症模型与CAIA中心的癌症现实更加吻合。

这些模型——基于四个癌症中心的全面且多样化的患者经验数据训练,并可能扩展到更多机构——将帮助研究人员更好地理解肿瘤生物学、疾病进展、对治疗的反应和耐药性的复杂分子相互作用。这对于研究罕见癌症和小群体尤其有用,这些群体在每个中心只有少数患者,这可能会揭示新的治疗方法。

关于CAIA的问答

11月20日的在线全体职员弗雷德·哈奇市政厅会议包括了一个关于新联盟的问答环节,参与者包括弗雷德·哈奇总裁托马斯·林奇二世博士(Thomas J. Lynch Jr., MD),他担任Raisbeck主席,以及弗雷德·哈奇副总裁兼首席数据官杰夫·里克博士(Jeff Leek, PhD),他担任J. Orin Edson基金会主席。以下是经过编辑的简短和清晰的对话记录。

问:(托马斯·林奇) 上个月,我们宣布启动癌症AI联盟,称为CAIA。我对此非常兴奋。几家著名的技术公司以及四个杰出的癌症中心聚集在一起,思考如何利用AI来改变癌症护理和研究。CAIA意味着什么?谁参与其中,这个想法是如何开始的?

答:(杰夫·里克) 这个想法的初衷是基于从患者数据中开发预测性、预后性、治疗分配和发现性机器学习模型,并将其重新部署到医疗系统中以改善患者护理。我们在弗雷德·哈奇的液体肿瘤项目中已经有过这样的尝试,通过Gateway系统让患者同意参与研究,并利用这些患者的信息进行新发现,以实现癌症的新疗法。

我们已经开始开发最新的迭代版本,即CARDS平台(临床和研究数据解决方案),以使我们的所有患者都能受益。我们确保从所有信息中学习,同时严格保护隐私,遵循正确的监管框架,并利用这些数据帮助每个人学习和发展新的模型、新的预测和新的癌症疗法。

这是UW、IT部门、数据部门、法律和合规团队共同努力的结果,使我们能够按照所有规则和协议使用患者数据,以构建新模型并从中学习。每个癌症中心都在尝试做类似的事情。我们的合作伙伴——纪念斯隆凯特琳、丹娜法伯和悉尼基梅尔癌症研究所——也在建立类似的学习医疗数据系统。

但挑战在于这些系统是孤立的。如果我想了解约翰霍普金斯的癌症患者,我必须创建一项研究并制定数据共享协议和材料转移协议。这需要很长时间才能为每个单独的研究建立起来。

我们如何创造一种激励机制,打破这些孤岛,使我们能够在癌症中心之间开展这项工作?

有很多原因使得这一点很难做到,但现在出现了一些技术,使我们能够进行所谓的联邦学习。利用这些技术的进步,我们可以避免直接共享数据带来的挑战。

问:AI是一种策略还是AI启用策略?

答: 我认为有三个组成部分:一是我们从未如此大规模收集的数据;二是我们从未能以前所未有的规模拟合的模型;三是与人的接口。

这三个方面在当前的交汇点上几乎适用于各行各业,这就是为什么你会看到围绕AI的兴奋。我曾经是AI怀疑论者。改变我观点的是思考AI到底是什么。AI是要取代人类吗?AI会取代所有卡车司机吗?五年前我们听到过这样的炒作,但事实并非如此。我们仍然需要很多放射科医生。

问:我们有点时间不够用了。

答: 改变我观点的是将AI视为“更好的计算机”或辅助工具,以及人机协作工具。这样你可以思考如何更快、做得更多,并真正做出原本不可能的发现。当我开始这样思考时,我的怀疑大大减少。我认为这在我们的研究社区和临床护理社区中作为助手,有可能带来巨大影响,帮助我们做出原本不可能的发现。

问:请告诉我目前CAIA的情况。我们10月份宣布了CAIA,现在进展如何?

答: 简短的回答是,这将成为有史以来为癌症研究创建的最酷的AI实验室。如果成功,我们将拥有最全面的数据,并结合一个系统,使你能够构建最大、最具创意的模型,这些模型将可供所有这些癌症中心的研究人员使用,并以非营利方式推进研究。这是一个巨大的机会。

我们正在进行大量的幕后机构工作。我们在构建平台、处理法律安排、建立数据模型、谈判细节,并开始考虑使用案例。我们从这四个癌症中心开始,最终的目标是包括美国所有的综合癌症中心。一旦能够在这些癌症中心之间构建和部署模型,我们将有机会继续这一循环,做出发现,开发新模型,并将它们重新部署到这些中心。

我特别兴奋的是,我们可以在研究中探讨这对患者是否有效,这对我们的提供者是否有效,这是否有助于或妨碍我们的护理。我们正处于这一革命的初期,我认为这使弗雷德·哈奇在未来十年内处于战略性的有利位置,以推动这项研究向前发展。


(全文结束)

大健康

猜你喜欢

  • AI奠基人预测人类超能力的未来AI奠基人预测人类超能力的未来
  • CANAIRI:医疗保健中的人工智能临床转化合作CANAIRI:医疗保健中的人工智能临床转化合作
  • Veda:与首席执行官兼联合创始人Meghan Gaffney关于医疗创新公司的访谈Veda:与首席执行官兼联合创始人Meghan Gaffney关于医疗创新公司的访谈
  • 人工智能会革新药物开发吗?研究人员解释其应用方式的重要性人工智能会革新药物开发吗?研究人员解释其应用方式的重要性
  • 医疗云计算市场预计到2032年将达到1992.1亿美元,通过AI集成、先进数据管理和成本降低推动创新和效率 | SNS Insider研究医疗云计算市场预计到2032年将达到1992.1亿美元,通过AI集成、先进数据管理和成本降低推动创新和效率 | SNS Insider研究
  • 这种饮食可以改善记忆力,降低痴呆风险并提高“认知灵活性”这种饮食可以改善记忆力,降低痴呆风险并提高“认知灵活性”
  • 从承诺到实践:丹纳赫召集愿景家讨论AI驱动的研发从承诺到实践:丹纳赫召集愿景家讨论AI驱动的研发
  • 通过生成式AI满足客户需求通过生成式AI满足客户需求
  • 西奈山研究人员创建AI工具以普及癌症免疫疗法的使用西奈山研究人员创建AI工具以普及癌症免疫疗法的使用
  • Qure.ai:联合创始人兼首席执行官Prashant Warier访谈Qure.ai:联合创始人兼首席执行官Prashant Warier访谈
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康