AI医疗诊断竞赛加剧:OpenAI、谷歌和安索匹克推出竞争性医疗工具Medical AI Diagnostics Race: OpenAI, Google, Anthropic Launch Tools

环球医讯 / AI与医疗健康来源:www.artificialintelligence-news.com美国 - 英语2026-01-23 17:20:03 - 阅读时长5分钟 - 2154字
本月,OpenAI、谷歌和安索匹克在短短数日内相继推出医疗AI工具,包括ChatGPT Health、MedGemma 1.5和Claude医疗版,这些工具聚焦于医疗工作流程优化而非直接诊断,主要应用于预先授权审核、理赔处理和临床文档记录等领域。尽管性能基准测试显示显著提升,但这些工具均未获得FDA医疗设备认证,监管框架仍不明确,实际部署多集中于行政工作流程而非临床决策,凸显了技术发展速度已超过医疗机构应对监管、责任和工作流程整合复杂性的能力,而每月20美元的订阅服务虽提供了先进的医疗推理工具,但能否真正改变医疗保健交付方式仍取决于这些联合公告未解决的关键问题。
AI医疗诊断OpenAI谷歌安索匹克ChatGPTHealthMedGemma1.5Claude医疗版医疗AI工具监管基准性能行政工作流程HIPAAICD-10临床验证
AI医疗诊断竞赛加剧:OpenAI、谷歌和安索匹克推出竞争性医疗工具

本月,OpenAI、谷歌和安索匹克在短短几天内相继宣布了专业的医疗AI能力,这种密集发布表明是竞争压力而非巧合。然而,尽管营销语言强调医疗保健转型,但这些发布的产品均未被批准为医疗设备、未获准用于临床使用,也不可用于直接患者诊断。

OpenAI于1月7日推出了ChatGPT Health,允许美国用户通过与b.well、苹果健康、Function和MyFitnessPal的合作连接医疗记录。谷歌于1月13日发布了MedGemma 1.5,将其开放的医疗AI模型扩展至可解读三维CT和MRI扫描以及全切片组织病理学图像。

安索匹克于1月11日紧随其后推出了Claude医疗版,提供符合美国健康保险流通与责任法案(HIPAA)的连接器,可连接至美国医疗保险和医疗补助服务中心(CMS)覆盖数据库、国际疾病分类第十版(ICD-10)编码系统和国家提供者标识符注册表。

这三家公司都针对相同的工作流程痛点——预先授权审核、理赔处理和临床文档记录——采用相似的技术方法但不同的市场策略。

开发者平台,而非诊断产品

这些系统的架构相似性值得关注。每个系统都使用在医学文献和临床数据集上微调的多模态大语言模型。每家公司都强调隐私保护和监管免责声明。每家都将自己定位为支持而非取代临床判断。

差异在于部署和访问模式。OpenAI的ChatGPT Health作为面向消费者的服务运营,欧盟经济区、瑞士和英国以外的ChatGPT免费、Plus和Pro订阅用户需等待列表。谷歌的MedGemma 1.5通过其健康AI开发者基础计划作为开放模型发布,可通过Hugging Face下载或通过谷歌云Vertex AI部署。

安索匹克的Claude医疗版通过Claude企业版集成到现有企业工作流程中,主要面向机构买家而非个人消费者。所有三家公司对监管的定位保持一致。

OpenAI明确表示Health"不用于诊断或治疗"。谷歌将MedGemma定位为"开发者评估和适应其医疗用例的起点"。安索匹克强调其输出"不用于直接指导临床诊断、患者管理决策、治疗建议或任何其他直接临床实践应用"。

基准性能与临床验证

所有三个版本的医疗AI基准测试结果都有显著提升,但测试性能与临床部署之间的差距仍然很大。谷歌报告称,MedGemma 1.5在斯坦福医学院任务完成基准MedAgentBench上达到92.3%的准确率,而之前的Sonnet 3.5基线仅为69.6%。

在内部测试中,该模型在MRI疾病分类上提高了14个百分点,在CT结果上提高了3个百分点。安索匹克的Claude Opus 4.5在启用Python代码执行的情况下,在MedCalc医疗计算准确性测试中得分为61.3%,在MedAgentBench上得分为92.3%。

该公司还声称在与事实幻觉相关的"诚实度评估"方面有所改进,但未披露具体指标。

OpenAI尚未发布ChatGPT Health的具体基准比较数据,而是指出"基于现有使用模式的匿名分析,全球每周有超过2.3亿人向ChatGPT提出与健康和保健相关的问题"。

这些基准测试测量的是在精心策划的测试数据集上的表现,而非实际临床结果。医疗错误可能带来危及生命的后果,将基准准确率转化为临床效用比其他AI应用领域更为复杂。

监管路径仍不明确

这些医疗AI工具的监管框架仍然模糊。在美国,FDA的监管取决于预期用途。"支持或向医疗保健专业人员提供有关疾病预防、诊断或治疗建议"的软件可能需要作为医疗设备进行上市前审查。宣布的工具均未获得FDA批准。

责任问题同样未解决。当Banner Health的首席技术官迈克·里金表示该医疗系统"被安索匹克对AI安全的关注所吸引"时,这涉及技术选择标准,而非法律责任框架。

如果临床医生依赖Claude的预先授权分析而患者因延迟护理而受到伤害,现有判例法对责任分配的指导有限。

监管方法在不同市场差异显著。虽然FDA和欧洲医疗器械法规为作为医疗器械的软件提供了既定框架,但许多亚太地区监管机构尚未就生成式AI诊断工具发布具体指导意见。

这种监管模糊性影响了医疗基础设施差距可能加速实施的市场中的采用时间表——在临床需求和监管谨慎之间创造了紧张关系。

行政工作流程,而非临床决策

实际部署仍经过谨慎规划。诺和诺德内容数字化总监路易丝·林德·斯科夫表示,他们使用Claude进行"制药开发中的文档和内容自动化",专注于监管提交文档而非患者诊断。

中国台湾地区健康保险署应用MedGemma从3万份病理报告中提取数据用于政策分析,而非治疗决策。

这种模式表明机构采用集中在错误风险较低的行政工作流程上——计费、文档、协议起草——而非医疗AI能力对患者结果影响最大的直接临床决策支持。

医疗AI能力的发展速度已超过部署机构应对监管、责任和工作流程整合复杂性的能力。技术已经存在。每月20美元的订阅服务提供了先进的医疗推理工具。

这是否能转化为变革性的医疗保健交付方式,取决于这些协调一致的公告未解决的问题。

【全文结束】

猜你喜欢
  • FDA推动扩大临床研究中真实世界证据的采纳范围FDA推动扩大临床研究中真实世界证据的采纳范围
  • 医疗保健领域真正需要的人工智能医疗保健领域真正需要的人工智能
  • JPM 2026:FDA专家小组强调加速审批、国家安全、人工智能等优先事项JPM 2026:FDA专家小组强调加速审批、国家安全、人工智能等优先事项
  • 人工智能在医疗保健中的应用人工智能在医疗保健中的应用
  • 桑福德健康为何创建专注于技术的高管新职位桑福德健康为何创建专注于技术的高管新职位
  • CMS希望加速技术创新和人工智能在患者护理中的应用 为2026年设定重大目标CMS希望加速技术创新和人工智能在患者护理中的应用 为2026年设定重大目标
  • 盖茨基金会与OpenAI启动5000万美元计划 为撒哈拉以南非洲医疗工作者提供AI工具盖茨基金会与OpenAI启动5000万美元计划 为撒哈拉以南非洲医疗工作者提供AI工具
  • 肠道微生物组在健康中的作用:亟需诊断工具肠道微生物组在健康中的作用:亟需诊断工具
  • 追踪人工智能将如何影响医疗器械行业与医疗健康领域追踪人工智能将如何影响医疗器械行业与医疗健康领域
  • OpenAI与盖茨基金会启动5000万美元项目推动非洲医疗人工智能应用OpenAI与盖茨基金会启动5000万美元项目推动非洲医疗人工智能应用
热点资讯
全站热点
全站热文