在经典科幻系列《星际迷航》中,人类常常依靠他们的三录仪——一种能够在几秒钟内诊断几乎任何疾病的手持设备。人们长期以来一直梦想着一个机器能够确切地识别我们医疗问题的世界。虽然这样的技术仍在遥远的未来,但人工智能的最新进展使这一愿景看起来不再那么奇幻。
例如,大型语言模型(LLMs)最近兴起,如为 ChatGPT 等聊天机器人提供动力的那些模型。这些模型不仅已经证明能够通过美国医疗执照考试,而且进步迅速。在 2021 年 9 月,顶级的 LLMs 在该测试中只能获得 38%的分数,远低于通过测试所需的 60%。但到 2023 年 11 月,顶级语言模型的得分达到了 90%,甚至超过了人类专家的表现。
Medical Technology Schools 研究了学术研究和新闻文章,以了解人工智能如何帮助医疗专业人员诊断患者。
AI 在现实世界中
AI 模型不仅在医学考试中被证明是有效的。今年早些时候,科学家报告称使用 AI 分析患者的血液样本,以确定与帕金森病相关的特定蛋白质水平。研究人员表示,他们使用的算法可以帮助他们在任何症状出现之前七年预测帕金森病的发作。
与此同时,谷歌正在开发一种技术,将分析智能手机录制的人们咳嗽的声音,以检测如结核病或慢性阻塞性肺疾病(通常称为 COPD)等疾病。加州大学戴维斯分校的研究人员最近建立了一个机器学习模型,根据人口特征和医疗历史来识别有肝病风险的人群。
多年来,一直有人猜测 AI 将取代某些医疗专业人员,特别是放射科医生,他们的工作需要解读如 X 光等图像以识别异常并诊断疾病。然而,就像自动驾驶汽车一样,尽管有快速的进步和快速的部署,机器尚未取代人类。
问题的一部分是放射学很复杂。虽然当前的 AI 系统已经表明它们在特定任务上可以胜过人类医生,但没有 AI 系统能够承担医疗专业人员所做的所有任务。医疗保健是一个受到高度监管的行业。医生和立法者可能不会满意,直到机器发展到显然应该由它们带头的程度。其他技术进步,如自动驾驶汽车,在变得更加普遍时也面临类似的关注和监管。
理解 AI 在医疗领域的限制
构建机器人医生这一问题极具挑战性的部分原因是研究人员仍然不完全理解 AI 模型的思考方式。它们通过从大量数据中提取模式来工作,但无法解释其推理过程,这在它们犯错的敏感领域会造成问题。此外,基于 LLM 的模型容易出现“幻觉”,即它们自信地做出看似符合上下文但完全错误的陈述。当被要求提供其主张的证据时,LLMs 经常编造来源,包括不存在的期刊文章。
尽管存在挑战,AI 技术在医疗保健领域,特别是在诊断方面,具有巨大的前景。医生常常不堪重负,医疗保健费用昂贵。经济合作与发展组织的数据显示,经济更发达的国家通常在医疗保健上花费其国内生产总值的约 10%,而美国则接近 17%。
整合 AI 可以提高生产力,帮助更早地识别疾病,改善患者的治疗结果。早期检测对于许多疾病的治疗至关重要,AI 快速准确地分析大型数据集的能力有助于及时诊断,从而提供更好的护理并降低成本。
在不久的将来,一条前进的道路是人类医生与 AI 系统合作。这样的系统可以帮助医生综合大量数据,为诊断提供背景。AI 系统还可以提供第二意见,特别是在复杂的病例中。它们甚至可以帮助人类医生在与患者进行困难的对话时更具同理心。最近的研究表明,并非所有放射科医生都能从 AI 辅助中平等受益。这表明,虽然 AI 系统正在迅速改进,但医生也将不得不继续磨练他们的技能,并利用新技术来利用其发展。

