莫纳什大学正在开发一款医疗AI基础模型,据称这是澳大利亚同类项目中的首创,能够大规模分析多模态患者数据。
上月底,莫纳什大学信息技术学院副教授葛宗源博士成为2025年维特尔高级医学研究奖学金获得者之一。该奖学金由西尔维娅和查尔斯·维特尔慈善基金会提供,用于支持创新性医学研究项目。
葛宗源副教授同时也是首位获得医学研究奖学金的AI科学家,他正带领研究团队开发一套AI系统,该系统可连接影像扫描、临床笔记和长期患者病历,帮助医生早期发现疾病、改善预后并支持个性化医疗。
《医疗IT新闻》与葛副教授深入探讨了其团队研发的统一表型基础模型(UPFM),内容涵盖多模态设计、安全数据训练环境、早期试点合作以及为澳大利亚医院未来部署培养临床医生AI技能的培训路径。
问:首先,统一表型基础模型(UPFM)是什么?它旨在弥补当前医疗AI领域的哪些空白?如今许多AI模型专为窄域单任务应用设计,UPFM有何不同?您希望为澳大利亚医疗生态系统构建何种“统一”能力?
答:当前大多数医疗AI高度专业化。它可能擅长分析眼底扫描或皮肤病变,却无法识别二者间的关联。问题在于医学实践并非孤立存在。患者是整体的人,而非单一器官。
统一表型基础模型(UPFM)正是为弥合这一空白而设计。
该模型不局限于孤立数据点,而是通过整合患者随时间积累的全部信息——从眼底扫描、皮肤图像到脑电信号、实验室结果及电子健康记录——学习人类健康的底层规律。目标是为临床医生打造协作型“伙伴”;一款能洞察全局的AI。这种统一视角将实现主动式医疗,帮助临床医生更早发现疾病、更精准预测风险,并为心血管疾病、皮肤癌和癫痫等重大疾病提供真正个性化的治疗方案。
问:贵团队计划整合高度多样化的患者数据,如放射影像、病理扫描、临床文本和长期健康记录。在澳大利亚分散化的医疗体系中,协调如此多样的数据源面临哪些主要技术或治理挑战?您将如何解决医院系统间的互操作性问题,并确保公共和私营医疗机构的数据在模型中得到公平体现?
答:这是最大的技术挑战之一。您需要训练模型在完全不同的信息类型间发现有意义的关联——医生的文本记录、眼底扫描的像素点和脑电波形。我们团队的专业优势在于设计能将这些异构数据流“融合”为统一认知的AI架构。
在治理与互操作性方面,核心挑战在于连接本不互通的系统(公私机构)。我们通过构建高安全性、高稳健性的数据管道来应对:模型将基于大规模去标识化公共数据集、临床合作伙伴数据及高质量医学教育资源进行训练。工作重点是确保所有数据和谐统一且公平表征,使模型惠及全体澳大利亚人。
问:目前项目进展如何?是否已构建UPFM的原型或概念验证版本?能否分享早期见解或验证结果?
答:我们已在特定且极其复杂的皮肤病学领域成功构建并验证了该方法的“蓝图”。
我们近期发表在《自然医学》上的皮肤疾病专用模型PanDerm是同类首创。该模型基于11个临床站点的200多万张图像训练,在28项不同诊断任务中树立了新标准。最重要的是,在临床读者研究中,它将医生皮肤癌诊断准确率提升11%,对早期黑色素瘤的检测能力显著优于传统方法。
PanDerm的成功让我们充满信心。它证明整合多源数据的方法切实可行且能产生真实临床影响。UPFM是逻辑演进,将这一经过验证的概念从单一器官系统扩展至人体全身。
问:您的奖学金附带重大资金支持。计划如何分配项目资源(例如用于计算基础设施、数据合作或临床协作)?未来三年设定哪些里程碑?
答:资金的很大比例将用于人才培养。我坚信需要培养新一代“临床科学家”——兼具深厚AI专业知识的医生。该奖学金将支持已获医学学位的候选人在AI领域攻读博士,打造能弥合医学与技术鸿沟的领军人才。
其余资金将分配至三大核心支柱:第一,构建模型,需强大算力支持,莫纳什大学MAVERIC超级计算设施将提供关键支撑;第二,验证模型对真实临床结果的预测能力;第三,实施部署,核心在于数据合作与临床协作。
未来三年主要目标包括:建成UPFM核心架构、在重点疾病领域验证其预测能力,并启动首批人机协作临床研究以证明其实际价值。
问:模型最初的临床聚焦领域或疾病方向是什么?首批部署将集中于早期诊断、纵向风险预测还是个性化治疗规划?
答:我们初期聚焦三大高负担领域,这些领域拥有强大的临床数据与合作基础:
- 心血管疾病,如中风和心脏病发作;
- 神经退行性疾病,包括癫痫和痴呆;
- 皮肤疾病,特别是黑色素瘤。
我们的路线图遵循临床逻辑:先从早期诊断和预后预测(评估患者风险)入手;继而利用模型发现新型生物标志物——即数据中隐含的疾病预测信号;最终推进到个性化治疗规划,该阶段将依据项目进展纳入前瞻性新数据。
问:是否计划在特定医院网络或研究联盟中试点UPFM?若已确定早期合作者,试点场景中的成功标准是什么?
答:是的,深度临床协作对此工作至关重要。数据收集及初期概念验证研究的主要临床合作伙伴是阿尔弗雷德医疗集团,包括保拉·福克斯黑色素瘤与癌症中心。
但我们的优势源于广泛的国内外专家网络。临床协作网络包括维多利亚·马尔教授、彼得·索耶教授、莫妮卡·詹达教授、哈拉尔德·基特勒教授;朱玲卓副教授;何明光教授;扎卡里·谭博士;多米尼克·达耶副教授;帕特里克·夸恩教授、特伦斯·奥布莱恩教授;沃伊切赫·詹姆斯·戈斯辛斯基教授;克里斯托夫·哈格迈尔教授;安东·佩勒格教授;孟律教授;以及詹姆斯·惠斯托克教授。
这种协作不仅关乎数据获取,更让全球顶尖临床专家共同参与,确保所构建的AI能解决医患面临的实际问题。
问:大规模处理敏感健康数据必然引发知情同意与隐私问题。团队如何应对患者数据治理——从匿名化协议到数据共享框架——以实现大规模训练同时符合澳大利亚健康数据法规?
答:这是我们不可妥协的优先事项,已建立高度稳健的系统:
首先,所有患者数据在研究团队访问前均经过严格去标识化处理;
其次,数据存储与处理均在莫纳什安全电子研究平台(SeRP)这一超安全数字保险库环境中进行。
该平台遵循严格治理协议及国际数据安全标准,实质构成闭环系统:数据输入后,我们在安全环境中构建训练模型,私有数据永不外泄,仅输出匿名聚合洞察。患者隐私是整个项目的基石。
问:您将如何衡量并缓解数据集中的潜在偏见,特别是在澳大利亚多元人口和区域医疗背景下?
答:这是医疗AI最关键的问题之一,我们通过三重策略应对:
- 数据采集:主动收集澳大利亚多元区域数据,避免仅依赖一两个主要城市,确保训练集真实反映国家人口构成;
- 模型训练:设计模型特别关注数据中的弱势群体,防止其仅从“多数群体”学习而对“少数群体”患者失效;
- 公平性评估:不仅测量总体准确率,更建立特定基准严格测试模型在不同年龄、性别和族裔群体中的公平性与性能表现。若无法普惠所有人,则视为整体失效。
问:展望未来,您认为UPFM将如何融入更广泛的数字健康生态?它能否未来连接“我的健康记录”等国家平台,或支撑澳大利亚AI赋能的精准医疗计划?
答:这正是我们的愿景。我视UPFM为“引擎”——理解人类健康深层复杂模式的核心智能。
下一步是构建该引擎的“仪表盘”,即能将此智能安全接入真实临床工作流的系统,例如医院电子病历系统,或可能对接“我的健康记录”等国家平台。
但最令我振奋的是发现能力。通过追踪人类无法处理的海量数据关联,该模型将化身“发现代理”,助力我们找到新型生物标志物及理解疾病的革命性方法。本项目旨在确立澳大利亚在医疗AI领域的领导地位,为临床医生打造可信赖的协作工具,最终惠及全体澳大利亚人。
【全文结束】

