在美国和澳大利亚进行的一项新研究表明,相比人类医生,人工智能(AI)在回答复杂的医疗问题时可能提供更为准确的答案。然而,在对患者至关重要的情感连接方面,AI仍有不足。
研究人员比较了来自美国和澳大利亚医疗系统的AI生成回复与人类医生的回答,发现AI提供的信息普遍更为准确和专业。尽管如此,AI在情感连接和同理心这一关键领域表现不佳,而这是患者非常需要的。
这项发表于《健康组织与管理杂志》的研究,分析了超过7000个医疗查询,以了解AI是否能在处理敏感和复杂的医疗案例时达到人类专家的水平。结果揭示了数字医疗未来的巨大潜力以及令人担忧的局限性。
研究团队使用了一个名为MEDIQA-QA的数据集,其中包含来自AI系统和人类医生的医疗问题及专家答复。他们根据准确性、专业性、信息完整性及语言清晰度等多个标准对每个答复进行了评分,并采用1到10的评分制。
科学家们还分析了美国和澳大利亚医疗系统中的答复,以理解AI在不同医疗环境和文化背景下的表现差异。通过先进的分析技术,他们比较了从答复长度、情绪到实际使用的医学术语等各个方面。
AI得分高,但缺乏情感
结果显示,AI答复的总体质量平均约为8分(满分10分),大多数得分在7到9之间。这表明AI系统在提供事实准确的信息方面基本符合专家医疗标准。
然而,AI和人类答复之间的差异揭示了患者真正需要的内容。虽然AI答复始终保持中立且专业的语气,但人类答复则表现出更广泛的情感表达,这很可能更能引起寻求治疗的患者的共鸣。
这种情感范围对于有效的患者护理至关重要。当人们担心不明症状或应对慢性病时,他们需要的不仅是临床事实,还需要安慰、理解和关怀的感觉。
“医护人员提供的治愈基于人与人之间的联系,包括视觉、触觉、存在感和沟通——这些是AI无法复制的体验,”没有参与此项研究的缅因大学的Kelley Strout说道。
沟通风格的差异
词汇分析显示,AI系统频繁使用诸如“治疗”和“管理”之类的临床术语,这强化了其医学相关性。然而,人类的答复更多地包含诸如“人们”、“孩子”和“健康”之类的词汇,表明一种更广泛、以人为中心的医疗沟通方式。
AI答复在长度上也明显比人类答复更为一致,而人类医生的答复长度变化幅度更大。虽然这种一致性可能表明AI遵循结构化的方法来回答问题,但人类医生往往会根据问题的复杂性和他们认为患者需要了解的内容调整答复的长度和深度。
该研究将先前关于美国和澳大利亚医疗系统的医疗指标研究进行了对比,提供了AI在不同医疗环境中表现不同的背景。澳大利亚患者报告的满意度更高(85% 对比 美国的78%),并且更容易获得专科医生(85% 对比 美国的75%)。
两国之间的医疗费用差异显著,美国每次就诊平均花费200美元,而澳大利亚仅为50美元。等待时间在澳大利亚也较短(15分钟 对比 美国的30分钟),尽管两国的治疗效果评分都约为90%。
这些差异很重要,因为它们表明AI系统可能需要针对不同的医疗环境和患者期望进行定制。
信任和偏见问题
先前的研究表明,医疗专家如何沟通会极大影响患者是否信任并遵循他们的建议。这对AI系统来说可能是一个挑战。虽然它们擅长提供一致且准确的信息,但在适应个体患者的需求、教育水平或情感状态方面可能会遇到困难。
“技术只是解决方案的一部分,”缅因大学的C. Matt Graham博士在一份声明中表示。“我们需要监管标准、人类监督和包容性的数据集。目前,大多数AI工具都是在有限的人群中训练的。如果我们不小心,我们可能会建立反映甚至放大现有不平等的系统。”
研究人员发现,大多数AI和人类答复对在内容上的相似度较低,这表明两种方法在处理相同医疗问题时往往有所不同。这并不一定是坏事;它可能意味着AI和人类医生在互相补充而不是竞争。
合作而非替代
全球医疗系统面临着老龄化人口、人员短缺和成本上升的压力。AI可能成为提高效率和减轻医生职业倦怠的工具。
“这不是要取代医生和护士,”Graham说。“而是要增强他们的能力。AI可以充当第二双眼睛;它可以帮助临床医生筛选大量数据、识别模式并实时提供基于证据的建议。”
AI系统可以处理常规医疗咨询,让人类医生专注于需要情感智慧和细致决策的复杂病例。它们还可以为专科医生资源有限的欠发达地区提供一致且高质量的信息。
然而,医疗的情感和关系层面仍然是独特的人类特质。面对严重诊断、慢性疼痛或心理健康问题的患者需要的不仅仅是医学专业知识,还需要同情、理解和希望。
“技术应该增强医学的人性化,而不是削弱它,”Graham说。“这意味着设计支持临床医生提供护理的系统,而不是完全取代他们。”
医疗系统需要谨慎整合AI工具,同时保留使医学成为一门在人们最脆弱时刻关爱他们的艺术的人文元素。
(全文结束)

