第二部分表明,通过重新思考行业如何选择模型、测量结果和整合系统,可以解决预测有效性危机。Vertex、Regeneron和阿斯利康的成功案例展示了如何通过协调生物学、测量和战略来逆转数十年来的生产力下降。
预测有效性危机并非不可克服,但要克服它,需要从根本上改变行业处理疾病模型选择和结果测量的方式。Vertex、Regeneron和阿斯利康等公司提供了如何做到这一点的范例。
Vertex和Regeneron专注于杰克·斯卡内尔博士所描述的"问题选择"。这些公司优先考虑具有异常强人类基因验证的疾病,通常是治疗机制已明确的单基因疾病。当生物学因果关系明确时,设计可能预测人类结果的模型系统就容易得多。
阿斯利康采取了不同的方法,即"五个R":正确的目标、正确的组织、正确的安全性、正确的患者和正确的商业潜力。
Vertex在囊性纤维化方面的工作是一个经典的成功案例。这种疾病是由囊性纤维化跨膜传导调节因子(CFTR)氯离子通道功能缺陷引起的,与健康状态的区别在于一个明确定义的分子缺陷。当Vertex在实验室条件下恢复患者来源细胞的氯离子通道活性时,他们对这种疗法将使患者受益充满信心——假设治疗没有毒性。关键的是,参与肺部病理的相同氯离子通道也调节汗液中的盐分。这种生物学联系使得实用的测量成为可能:几天内汗液氯化物的减少预示着肺功能的长期改善。Vertex将其模型系统(患者细胞)、治疗机制(CFTR校正)和测量方法(汗液氯化物测试)整合为一个连贯的预测系统。
不良结果测量降低预测有效性
在某些情况下,可能可以产生合理的人类疾病临床前模型,但我们难以以允许模型具有预测性的方式来测量人类疾病。一个传闻中的例子来自一种进行性神经疾病的药物试验。在这种情况下,药物疗效是通过比较治疗组和未治疗组患者在六分钟内能行走的距离来评估的。一位神经学家指出,他们无法分辨哪些患者接受了药物或安慰剂,但六分钟步行测试结果似乎取决于测试进行的时间。
早到的患者可以把车停在诊所附近,在六分钟步行测试中表现良好,而晚到的患者不得不把车停在500米外,难以完成测试。这是一个极端的例子,但嘈杂或人为的测量困扰着许多治疗领域,特别是在神经和精神疾病方面。
人类疾病的不良测量可能迫使即使是有效的治疗方法也需要进行规模庞大、昂贵的试验,以证明具有统计学意义的益处。一种药物可能有效,但如果试验不涉及数千名患者并持续多年,测量系统中的噪音可能会掩盖其效果。
超越传统模型选择
目前行业中的模型选择往往更多地依赖于历史偶然性而非科学原理。正如斯卡内尔直言不讳地指出的:"选择特定临床前模型的主要原因要么是CRO(合同研究组织)有这个模型,要么是你的博士导师使用了这个模型。"这种方法使行业使用了不起作用的模型——这些不成功的模型不会因为成功而使自己在商业上变得多余,因此会无限期地继续使用。
系统思维方法从终点出发,向后工作:我们希望在患者身上实现什么?我们如何可靠地测量这一结果?哪些模型系统可以预测成功?这种从终点到模型的思维方式逆转,可以识别出当前科学工具可行的问题。
算法方法中的创新悖论
行业对计算创新的方法往往反映了困扰模型选择的同样问题。公司经常将复杂的算法应用于根本有缺陷的数据集,创造出进步的假象,同时强化现有局限性。重点从数据质量和生物学相关性转移到编码效率和数学复杂性上。
药物发现中的真正算法创新需要将计算方法与基础生物学被充分理解和可测量的问题相结合。因果推断贝叶斯方法和高级机器学习技术等方法可以提供真正的见解——但只有在应用于高质量、可预测的数据集时才行。
监管和文化障碍
有趣的是,监管机构对模型要求的态度可能比制药公司所假设的更为开放。例如,在癌症领域,动物模型对人类结果的预测能力众所周知很差,但公司经常投入大量资金生成积极的临床前数据,并非因为监管机构要求,而是因为临床医生和患者在参与试验前期望看到这些数据。
这就创造了一种扭曲的情况:公司花费数百万美元进行非预测性研究,以满足那些知道模型不能预测人类结果的利益相关者。打破这一循环需要文化变革与科学创新并行。
前进的道路
解决预测有效性危机需要综合思维:选择具有强大人类验证的目标,使用反映人类生物学的模型,应用能够捕捉有意义临床变化的结果测量方法,以及将算法与高质量数据集匹配。成功不会来自简单地改进单个组件——更快的筛选、更好的化学、更复杂的AI——而是来自设计连贯的系统,其中每个元素都能增强其他元素的预测能力。那些掌握这种整合的公司,遵循Vertex的榜样,可能最终扭转制药业数十年来的生产力下降。
行业的未来不在于加速现有方法,而在于重建生成关于人类治疗反应的预测性见解的基本系统。只有这样,技术进步才能转化为真正的医疗进步。
【全文结束】

