谷歌医疗AI新突破:MedGemma 1.5与MedASR详解——医学影像与语音识别双模型解析What is MedGemma 1.5 & MedASR? Google’s AI for Medical Imaging & Speech — Explained

环球医讯 / AI与医疗健康来源:www.outlookbusiness.com美国 - 英语2026-01-16 09:34:17 - 阅读时长2分钟 - 609字
谷歌近日推出两款开源医疗AI模型MedGemma 1.5和MedASR,其中MedGemma 1.5专注于医学影像与文本的多模态分析,可处理放射学扫描等临床图像并支持医学报告生成,而MedASR则针对医疗场景优化语音识别能力,能精准转录带专业术语和不同口音的临床对话;两款模型均采用开放获取策略供全球研究者自由调用,但谷歌明确强调其仅限于研发用途,禁止用于实际诊断或治疗决策,此举旨在推动医疗AI技术的透明化发展,同时规避临床应用风险,凸显科技巨头在医疗健康领域的战略布局。
医疗AIMedGemma1.5MedASR医学影像语音识别医学视觉语言模型临床对话转录医学术语研究用途开放获取
谷歌医疗AI新突破:MedGemma 1.5与MedASR详解——医学影像与语音识别双模型解析

医疗AI发布

谷歌已推出两款专注于医疗保健的人工智能模型——MedGemma 1.5和MedASR,此举强化了其向研究者和开发者开放医疗AI技术的承诺。

开放获取策略

与其他提供付费企业医疗工具的竞争对手不同,谷歌公开发布了这两款模型,允许更广泛的研究和开发社区自由探索、调整并基于其进行创新。

MedGemma 1.5是什么

MedGemma 1.5是谷歌最新研发的医学视觉语言模型,专为分析医学影像并结合文本处理设计,旨在辅助涉及视觉医疗数据的研究型任务。

模型能力提升

据谷歌研究团队介绍,MedGemma 1.5在多模态推理能力上表现更优,对复杂医学影像的处理更为精准,同时支持针对特定数据集和研究需求进行微调。

医学影像应用场景

该模型可处理放射学扫描及其他临床图像,适用于视觉问答、医学报告生成和结构化数据提取等研究任务。

仅限研究用途

谷歌强调,MedGemma 1.5不得用于诊断或治疗决策,应仅作为研究与开发的支持工具,不可直接应用于患者护理。

MedASR概述

除MedGemma外,谷歌还同步推出MedASR——一款专注医疗领域的语音识别模型,旨在精准转录临床对话,同时准确识别医学术语和不同地区口音。

开发者支持

谷歌表示,MedGemma和MedASR已通过Hugging Face和Vertex AI平台开放获取,相关文档与教程可通过MedGemma GitHub仓库查阅。

【全文结束】

猜你喜欢
    热点资讯
    全站热点
    全站热文