合成医疗保健数据治理中心(SEARCH)最近已亮相,其目标是通过为人工智能/机器学习模型生成 FAIR 化的合成数据来加速医疗保健创新。
这是一个多学科倡议,专注于创建合成医疗保健数据,并促进整个生物医学生态系统中的安全数据共享。
此次发布标志着医疗保健研究的重大飞跃,通过前沿的合成数据生成和联合学习方法推动数字健康和人工智能驱动的诊断的进步。
SEARCH 将通过创建一个平台来解决医疗保健数据访问中的关键挑战,该平台能够实现多模式医疗保健数据的安全、保护隐私的搜索、共享和分析。
该倡议由都柏林三一学院通过位于圣詹姆斯医院的三一转化医学研究所(TTMI)协调,汇集了欧洲的 26 个跨部门合作伙伴,包括合成数据专家、医疗保健提供者和解决方案开发者,以开启数据驱动的医疗保健创新的新机遇。在创新健康倡议联合事业(IHI JU)的资助下,SEARCH 初始预算超过 1520 万欧元。
SEARCH 旨在通过为人工智能/机器学习模型生成 FAIR 化的合成数据来加速医疗保健创新,实现大规模数据协作,同时保护隐私并符合监管标准。
SEARCH 将为合成数据生成(SDG)提供可靠的方法,这些方法符合最高的准确性和适用性标准,大大增加了可互操作数据集的可用性。这些数据集将用于开发基于人工智能的工具,支持诊断、个性化治疗和预测健康结果,在降低隐私风险的同时改善患者护理。
三一转化医学研究所(TTMI)主任 Aideen Long 教授说:“SEARCH 为加速研究和临床创新提供了无与伦比的机会。
“通过提供模仿真实世界医疗保健数据的高质量、FAIR 合成数据集,我们可以使研究人员、临床医生和行业能够以前所未有的方式进行合作。这为更快的药物发现、更个性化的治疗以及创建新的、基于证据的医疗保健政策打开了大门 - 所有这些都不会损害患者的隐私。
“作为一名教育工作者,我认为合成数据集是用于培训的宝贵工具,允许学生和专业人士在保持患者最高机密标准的同时提高他们的数据分析技能。”
希腊塞萨利大学的 Dimitris Iakovidis 教授说:“SEARCH 通过在不同的医疗保健用例中实现强大合成数据的生成和共享,代表了医疗保健的范式转变。
“我们的方法利用联合学习和先进的 SDG 方法的力量来创建合成数据集,复制真实世界数据的统计属性,同时确保患者隐私。这将为医疗保健提供者和研究人员提供高质量的数据,以推动下一代人工智能和精准医疗工具。”
结合数据清洁室和联合学习允许多个机构进行合作,从分散的数据源中获取见解,同时确保患者数据安全地存储在其来源处。SEARCH 的创新合成数据生成技术不仅将使医疗保健数据的访问民主化,还将为基于人工智能/机器学习的新诊断和治疗工具奠定基础。
关键目标和创新
- 下一代合成数据:SEARCH 利用深度生成模型创建医疗保健数据(电子健康记录、基因组学、医疗信号和放射成像)的逼真合成副本,在保持隐私的同时复制真实世界数据的性能;
- 联合学习和数据清洁室以保护隐私和规模:通过将患者数据安全地保留在其原始位置,SEARCH 的保护隐私框架增强了跨医疗保健部门的协作,同时保护敏感信息。这促进了人工智能模型的开发和新医疗保健工具的更广泛采用;
- 加速人工智能创新:SEARCH 将通过为基准生物医学人工智能解决方案提供黄金标准的合成数据集,推动前沿的人工智能驱动的决策支持工具的开发,促进更快的诊断工具,并创建新的个性化医疗保健方法。
开创性的影响
SEARCH 将在医疗保健的变革中发挥关键作用,有助于更快的创新、缩短新数字健康干预措施的上市时间和更好的个性化治疗。通过合成数据方法,SEARCH 将揭示心血管、胃肠道和妇科疾病的见解,同时确保患者隐私的保护。
SEARCH 的努力将通过临床研究验证合成数据集来补充现实世界的医疗保健。这种合成数据和保护隐私架构的独特组合有可能推动人工智能/机器学习创新,改善患者结果,改进诊断,并为医疗保健中的新公私合作铺平道路。

