哥伦比亚大学生物医学信息学教授乔治·赫里普萨克(George Hripcsak)指出:"我们正在用错误的指标评价科学价值。"当生成式AI生产的医学论文大量涌入学术期刊时,学界开始反思速度与质量的关系。
作为OHDSI(观察性健康数据科学与信息学)合作项目的创始主席,赫里普萨克教授认为问题需要重新定义。关键不在于论文发表速度,而在于研究是否具备确保结果可信的结构与透明度。他通过实证研究证明,当科学方法结构化时,研究不仅更可靠,反而能加速科学发现进程。
OHDSI是什么?
OHDSI国际合作网络致力于改进真实世界医疗数据(如电子病历、保险理赔和公共卫生数据库)的证据生成方法。该平台提供统一的数据结构标准、开源分析工具和可靠性验证体系,使全球研究人员能用相同方法开展研究,验证发现的普适性。其核心目标是建立可验证、可复现、可操作的医学研究体系。
关于AI带来的挑战
《自然》杂志近期报道显示,大量模板化生物医药论文涌现,许多疑似由AI生成。赫里普萨克指出这个问题早已存在,AI只是加速了进程。观察性研究始终存在矛盾结论:"今年咖啡致癌,明年咖啡抗癌"的乱象,往往源于研究方法的非结构化特征。
"如果伽利略时代就有生成式AI,我们可能还在信奉地心说。"赫里普萨克强调,开放数据和生成式AI分别降低了研究实施和论文写作的门槛,但核心问题始终是方法论的结构性缺陷。
结构化研究的优势
OHDSI采用的十大研究原则核心在于开放性和可验证性:
- 预先制定分析方案
- 使用开源软件
- 发布诊断结果预验证
- 多数据库/人群验证
- 建立终止机制(诊断失败即停止)
- 允许发布非显著结果
这种体系既能避免发表偏倚,又能确保科学证据的可靠性。"我们的目标不是每次都有新发现,而是建立可信赖的证据基础。"赫里普萨克解释道。
期刊政策的局限性
某些期刊禁止在观察性研究中使用因果表述,但这种做法治标不治本。"禁止使用'导致'这个词并不能阻止人们做因果解读。"赫里普萨克主张通过结构化方法支持因果推断,包括预设设计、诊断工具和透明化处理。
AI应用的边界
赫里普萨克团队谨慎使用AI:"LLMs擅长生成看似合理的陈述,而非真理发现。"他们将AI用于变量提取和文献综述,但所有结果必须经过验证。OHDSI始终坚持使用经过验证的模型和透明推理机制。
改革的可行性
现有方法已足够成熟,关键在于建立行业标准。"如果期刊要求提供诊断验证,审稿人检查预设方案,出版方接受非'轰动'结果,就能建立更可信的证据体系。"这种结构化转型不仅能提升可靠性,反而能加速科学发现进程。
【全文结束】