谷歌发布了MedGemma,这是一款全新系列的开源人工智能模型,专为医疗保健和生命科学领域量身打造。作为公司“健康AI开发者基础(HAI-DEF)”计划的一部分,此次发布的目的是通过为研究人员和开发者提供强大且灵活的工具,从而加速各类医学应用的创新。
MedGemma基于先进的Gemma 3框架构建,包含能够同时处理文本和医学图像的多模态模型。这些模型提供多种规模,包括40亿参数和270亿参数版本,在性能与计算效率之间实现了良好平衡。这种灵活性使模型能够在本地运行,让机构在处理敏感患者信息时对数据隐私拥有更强的控制力——这一点在医疗领域至关重要。
MedGemma的一项关键能力在于其高效处理复杂现实医疗数据的能力。这些模型可以解读纵向电子健康记录(EHR),根据胸部X光等影像生成详细的医疗报告,并回答复杂的医学问题。在一次演示中,MedGemma 4B模型生成的胸部X光报告在81%的情况下被认为足以替代原始报告进行患者管理。
更大的27B模型在诸如MedQA等医学知识和推理基准测试中表现出色,其性能可与更大规模的专有模型相媲美,但计算成本却低得多。这使得它们成为各类医疗机构极具吸引力的选择。
通过将MedGemma开源,谷歌为全球医疗社区提供了基于其研究成果进一步开发的机会。开发者可以针对高度特定的任务微调这些模型,从而在医学报告生成和视觉问答等领域实现最先进的性能。模型的开放性还确保了可重复性和稳定性,因为底层参数固定不变,不会出现意外更改——这一特性对于需要一致性的临床应用至关重要。
早期采用者已经在利用MedGemma开展多样化应用,从改进胸部X光分诊流程到分析中文传统医学文献,充分展现了该平台的多功能性及其在全球健康AI领域推动重大进步的潜力。
谷歌此前已针对特定用途发布了多款基于设备运行的Gemma模型。今年早些时候,它推出了SignGemma,这款模型可帮助翻译手语;此外还发布了DolphinGemma,用于将海豚声音转化为人类可理解的文字。
(全文结束)

