精准医疗需要精准诊断
我对AI辅助或AI增强诊断路径领域尤为关注。医疗影像和电子健康记录中存在大量环境信息,临床医生通常无暇全面审查,而AI恰好能提供高价值的机会性筛查和偶发性筛查。面对当前众多开发中的AI工具,我提出以下疾病与检测项目的筛选框架:
- 高通量处理
这是理想的起点,筛查工具应具备广泛部署能力和高通量处理特性。理想情况下,输入数据需标准化采集流程并具备清晰工作流,以便开发自动化软件方案。若需人工步骤(如前往病理科数字化切片),则难以实现高通量;若需跨系统无API通信,技术门槛亦过高。
- 数据格式一致性
与高通量标准相呼应,输入数据必须标准化、可复现且一致。大胆观点:我倾向于避开电子健康记录(EHR)或文本类方法。仅在两家医院工作过就能发现,EHR记录和病历书写模式在机构间、科室间及个人间差异巨大。顶尖学术机构的培训生偏好详尽优美的行文,而社区医生则普遍采用简洁、以计费优化的模板。在此情况下,AI模型在单一机构训练后难以泛化至其他机构数据,严重限制应用前景。相比之下,医学影像虽存在获取差异,但标准视角、技术规范及设备制造商使其输入数据变异度显著降低。
- 低偏差风险
计算机科学家自然希望获取更多数据——这通常能提升模型性能(冗余数据可被忽略)。但训练数据集构建至关重要:患者接受影像检查并非随机事件,常规检测的链式操作会导致人群样本偏差,使结果过于乐观且集中,难以落地临床。
例如心电图(ECG)和超声心动图均为心血管常规检查,但同时具备两项数据的患者仅占总体的25%-40%。ECG患者未必接受超声心动图检查,反之亦然。这种筛选后的交叉数据集使患者病情更重、疾病流行率更高,引发诸多泛化性质疑。因此,尽管多模态模型在研究层面极富吸引力,我们的AI部署策略仍聚焦单一模态。
- 明确监管框架
美国FDA迄今未批准任何多模态软件即医疗器械(SaMD),但已有1100余款单一模态AI模型获认证。单一影像模态在缺失数据处理、临床工作流时序衔接、数据可用性及不确定性缓解方面具备更清晰的监管路径。FDA对疾病检测领域拥有成熟监管经验,若需开展诊断类临床试验,明确的框架对算法临床应用至关重要。
- 高价值干预匹配
诊断测试的价值取决于后续干预措施。若治疗选择有限,完美诊断的增量价值微弱;若存在显著改善生存质量的疗法,即便基础诊断工具亦大有裨益。我们正从高效疗法反向推导诊断机会。
基于此开发了两款超声AI工具:心脏淀粉样变性检测(获FDA 510(k)认证)及肝病检测(正进行临床试验)。这两类疾病均处于治疗突破期,关键临床试验证实其可降低死亡率及心血管并发症。在此背景下,早期识别可受益于下游疗法的患者,将显著放大AI诊断的价值。
我们致力于使每个AI项目同时满足五大标准,并期待其在临床工作流中的应用。特别是心脏淀粉样变性和肝病算法,均源于我在超声实验室遇到的实际临床需求:作为繁忙的超声心动图医师,我极少能在解读检查前查阅患者完整病历,而低电压心电图等特征将助我更准确诊断心脏淀粉样变性。同时作为心脏病专家,我虽未受训评估肝脏(常规下腔静脉评估中常获取肝影像),但肝回声纹理的轻微异常极可能被严重低估——而减重与药物治疗对这些患者或大有裨益。
【全文结束】

