人工智能工具和大语言模型在传染病和重症监护领域的部署速度已经超过了其安全性的证据基础。在这些环境中的临床医生经常会遇到AI生成的输出——诊断建议、抗菌药物推荐、脓毒症风险评分——这些系统的性能很少被评估是否符合他们必须应用的指南。在临床决策时间紧迫且直接影响患者安全的情况下,这一差距对患者安全有着直接的影响。
传染病和重症监护具有一些特点,使得AI评估既特别重要又特别具有挑战性:病情表现经常复杂、非典型且不断变化;指南需要与当地耐药模式和患者特定因素整合;而错误或过度自信的建议——如漏诊耐药微生物、不适当的抗菌药物选择、延误升级治疗——的后果非常严重。这些正是AI故障模式既最严重又研究最少的情况。
尽管有大量工作将AI和LLM应用于这些领域,但对这些工具是否按照临床标准执行的严格评估——基于当前指南的基准测试、在不同人群中的测试、以及对故障模式的透明度——仍然不足。这个研究主题解决了这一差距,重点关注AI和LLM在临床实践中的系统性能、可靠性和安全性评估,以及确定何时可以和不可以采取AI输出所需的框架。
这个研究主题不是为临床医生提供AI工具使用的培训,也不是孤立的模型开发或算法基准测试,而是面向需要严格方法来评估工具在特定环境中是否安全运行的执业临床医生和临床研究人员——以及当工具不安全时适当的临床响应框架。
我们邀请的投稿包括但不限于:
- LLM和AI在传染病中的性能评估:诊断准确性、指南一致性、幻觉、过度自信和故障模式分析
- AI和LLM在重症监护和脓毒症中的评估:在时间紧迫决策中的性能、预后评分和升级支持
- 抗菌药物管理与AI:支持处方、降阶梯和耐药性管理的工具的性能、局限性和可靠性
- AI和基因组学方法对抗菌药物耐药性:临床使用的功能、局限性和评估框架
- AI证据的批判性评估:研究设计、数据泄漏、外部有效性和在不同人群和环境中的普遍性
- 临床点的信任度:校准、不确定性量化以及确定何时应采取AI输出的框架
- 真实世界实施:工作流程整合、临床医生覆盖模式、人机分歧以及AI在高急性环境中的局限性
- 法律、伦理和专业责任:当AI影响临床决策时的治理、责任和机构责任
- 基于案例的分析:AI输出与临床判断、当地指南或患者特定背景冲突的场景
关键词: 人工智能, 大语言模型, 重症监护医学, 抗菌药物管理, 临床验证, 脓毒症, 生成式AI, 真实世界证据, 幻觉, 指南一致性, LLM评估, 临床决策支持, AI安全, 传染病, 抗菌药物耐药性
重要说明: 所有对本研究主题的贡献必须符合其提交的期刊和部分的范围,如其使命声明中所定义的。Frontiers保留在同行评审的任何阶段将超出范围的稿件引导至更适合的部分或期刊的权利。
【全文结束】

