谷歌医疗AI新突破：MedGemma 1.5与MedASR详解——医学影像与语音识别双模型解析What is MedGemma 1.5 & MedASR? Google’s AI for Medical Imaging & Speech — Explained

环球医讯 / AI与医疗健康来源：www.outlookbusiness.com美国 - 英语2026-01-16 09:34:17 - 阅读时长2分钟 - 609字

谷歌近日推出两款开源医疗AI模型MedGemma 1.5和MedASR，其中MedGemma 1.5专注于医学影像与文本的多模态分析，可处理放射学扫描等临床图像并支持医学报告生成，而MedASR则针对医疗场景优化语音识别能力，能精准转录带专业术语和不同口音的临床对话；两款模型均采用开放获取策略供全球研究者自由调用，但谷歌明确强调其仅限于研发用途，禁止用于实际诊断或治疗决策，此举旨在推动医疗AI技术的透明化发展，同时规避临床应用风险，凸显科技巨头在医疗健康领域的战略布局。

谷歌医疗AI新突破：MedGemma 1.5与MedASR详解——医学影像与语音识别双模型解析

医疗AI发布

谷歌已推出两款专注于医疗保健的人工智能模型——MedGemma 1.5和MedASR，此举强化了其向研究者和开发者开放医疗AI技术的承诺。

开放获取策略

与其他提供付费企业医疗工具的竞争对手不同，谷歌公开发布了这两款模型，允许更广泛的研究和开发社区自由探索、调整并基于其进行创新。

MedGemma 1.5是什么

MedGemma 1.5是谷歌最新研发的医学视觉语言模型，专为分析医学影像并结合文本处理设计，旨在辅助涉及视觉医疗数据的研究型任务。

模型能力提升

据谷歌研究团队介绍，MedGemma 1.5在多模态推理能力上表现更优，对复杂医学影像的处理更为精准，同时支持针对特定数据集和研究需求进行微调。

医学影像应用场景

该模型可处理放射学扫描及其他临床图像，适用于视觉问答、医学报告生成和结构化数据提取等研究任务。

仅限研究用途

谷歌强调，MedGemma 1.5不得用于诊断或治疗决策，应仅作为研究与开发的支持工具，不可直接应用于患者护理。

MedASR概述

除MedGemma外，谷歌还同步推出MedASR——一款专注医疗领域的语音识别模型，旨在精准转录临床对话，同时准确识别医学术语和不同地区口音。

开发者支持

谷歌表示，MedGemma和MedASR已通过Hugging Face和Vertex AI平台开放获取，相关文档与教程可通过MedGemma GitHub仓库查阅。

【全文结束】

本文内容由家庭大健康团队所原创或整理，未经授权不得转载、摘编或利用其它方式使用。欢迎分享至朋友圈。
本文仅代表作者观点，不代表本站立场，如有侵权请联系我们删除。

AI内容声明：本页内容撰写过程部分涉及AI（包括且不限于题材，素材，提纲的搜集与整理），请注意甄别。

猜你喜欢

代理型AI在医疗保健领域日益重要的作用
人工智能与机器学习在药物发现与开发中的整合应用
医疗人工智能研发的热点
从Watson到ChatGPT Health：为何如今AI的医疗时刻看起来不同了
最后的馈赠
早期自动化集成重塑药物从实验室到生产的流转方式
斯坦福研究人员利用人工智能监测罕见癌症
礼来与英伟达联手打造AI实验室加速药物发现进程
三位约翰斯·霍普金斯大学生物医学工程研究人员获美国心脏协会奖学金
自主人工智能代理开发用于检测认知能力下降早期迹象

热点资讯

全站热点

全站热文