哈佛医学院和贝斯以色列女执事医疗中心的研究人员进行的一项研究表明,现代人工智能模型可以在某些类型的临床决策中超越医生,特别是在紧急情况下,根据Euronews.com的报道。
该分析比较了医生与先进语言模型(LLM)在任务中的表现,如确定可能的诊断、选择必要的检查或基于有限信息在急诊室做出决策。
结果表明,人工智能系统在多个这些场景中表现更好。
"我们在几乎所有相关标准上评估了该模型,它不仅超过了早期版本,还超过了参与研究的医生水平,"主要作者之一Arjun Manrai表示。
然而,研究人员警告说,这些结果并不自动意味着患者护理的改善。
这类系统应如何整合到医疗实践中仍不明确,专家们呼吁进行在真实条件下进行的额外研究。
人工智能在哪里表现出色
在测试过程中,研究人员使用了包括实验性OpenAI o1-preview模型,为其提供了真实的临床案例和复杂的医疗场景。
AI在以下方面表现尤为出色:
- 临床和管理推理
- 病例记录
- 信息不完整的紧急情况
最大的差异出现在分诊阶段,医生必须使用有限数据快速做出决策。
医生和AI模型在获得更多信息后都提高了准确性。
"模型变得越来越强大。经典测试已不足以区分它们,因为分数已经接近最高值,"Peter Brodeur解释道。
然而,专家们也指出了风险。例如,AI系统可能正确识别诊断,但可能推荐对患者不必要的或有风险的检查。
需要规则和实践测试
研究报告作者强调,人工智能的正确使用可以减少诊断错误和相关成本。
他们呼吁投资基础设施并开发明确的框架,以便将这些技术整合到医院中。
该研究也有局限性:主要分析了模型的初步版本,该版本已被更新的系统(如OpenAI o3)所超越。
研究人员认为,在这些新版本中性能可能更好,但需要进行额外评估。
总体结论是,尽管人工智能在医学中正成为一个越来越有能力的工具,但医生的角色仍然至关重要,特别是在验证决策和确保患者安全方面。
【全文结束】

