人工智能驱动的药物开发,凭借先进的模型和不断扩大的数据访问,正在成为现实。了解如何应对监管障碍和掌握生物学固有的复杂性对于充分发挥其潜力至关重要。
从数据到成果的规划
未来的人工智能赋能药物开发将受益于多模态和临床基因组学的持续进步,重点在于整合、效率和个人化,以变革护理和研发。这些不断发展的技术具有巨大的潜力来克服当前领域的局限性。先进的AI模型将处理复杂的数据集,改善对药物-靶点相互作用的理解。将可解释的AI(xAI)工具应用于小型语言模型,可以提高输出的透明度、可靠性和准确性,这将显著促进监管接受。xAI的操作影响是巨大的,尤其是考虑到37%的市场认为GenAI算法结果的解释是一个超越监管合规的战略优先事项。AI的采用将增长,但需要强大的基础设施、流程标准化和培训。行业、学术界和监管机构之间的不信任到合作的转变将加速整合,减少临床失败并提高经济可持续性。
数据增强的格局仍然充满活力,关于最佳数据访问政策和共享策略的讨论仍在进行中。平衡监管政策(例如,美国食品药品监督管理局(FDA)和欧洲药品管理局(EMA))与患者隐私和商业保密性仍然是关键。然而,OpenAI的Ilya Sutskever在NeurIPS上表示,数据增强有其局限性:“数据没有增长,因为我们只有一个互联网。你甚至可以说数据是AI的化石燃料。它是以某种方式创建的,我们现在正在使用它。我们已经达到了数据峰值,不会再有更多——我们必须利用现有的数据。”然而,药物和医疗保健领域为AI的采用提供了一片沃土,由源源不断的新数据源驱动。
药物发现的数据生成不仅限于互联网,还包括来自实验室仪器的数据、放射组学输出的增加以及临床环境中的真实世界证据(RWE)。值得注意的是,估计美国电子健康记录数据为150拍字节,目前仅利用了其中的5%。正在进行大量努力以解锁这些电子健康记录的巨大潜力。Elnora AI通过直接从学术研究人员那里收集“负面数据”展示了创新的数据增强策略,重点关注详细的实验室协议。负面数据通常比已发布的数据大得多,因为它包括失败实验的原始数据、无显著效果的临床试验和零结果的研究。AI驱动的数字孪生是另一种不受患者隐私常见限制的数据增强来源。调查(例如2024年生物制药技术状态报告)预测2025年的研发数据将每年翻倍,突显了可用数据的持续增长。随着更多的数字和数据能力上线,投资重点将如何转移?
以数据驱动的方法提高成功率
在长开发周期、高成本和低成功概率(PoS)之间做出选择时,药物开发中最宝贵的杠杆是PoS。如果没有令人信服的证据表明AI能带来更高的PoS,至少改进速度和降低成本显示了通往更快更便宜地获得高质量药物的路径。这条路径似乎是由数据增强推动的,结合了临床基因组学和多模态方法,共同承诺加速开发并改善结果。科技生物公司已经开始采取这种方法。现在即使是非AI本土的大制药公司也采取类似的观点,使用临床基因组学和集成多模态。
监管、技术和方法学变化之间的协同作用对整个药物开发周期产生了积极影响。通过更准确的目标选择和更好的患者分层,可以预防许多以前在临床阶段发生的失败。针对遗传定义的患者亚群开发的靶向药物显著提高了治疗效果,同时降低了不良反应的风险。
一个关键方面是在开发速度和候选药物质量之间的平衡。虽然AI可以显著加快发现过程,但重要的是速度不应损害数据的稳健性和临床成功的可能性,以便最终使有效的治疗方法到达患者手中。因此,关键问题不仅是新药可以多快开发出来,还有多少额外时间将投入到优化AI模型中以提高临床阶段的成功率。
数据驱动的AI正在改进药物开发。扩展数据访问,结合先进的模型和技术,如多模态和临床基因组学,能够更精确地选择目标、进行患者分层和个性化治疗,有望提高成功率并带来更高的投资回报。
尽管取得了这些进展,仍存在重大挑战。这些挑战包括管理生物复杂性、数据集成困难和监管要求。目标分子的日益复杂性以及先进治疗模式(如双特异性抗体和细胞疗法)的探索,需要不断改进AI算法和模型。然而,当前的格局凸显了AI、多模态和临床基因组学的结合不仅代表了未来的希望,而且已经在重新定义药物发现和开发的范式。
尽管AI模型显示出巨大潜力,但它们的泛化能力仍然有限。依赖高质量和平衡的训练数据可能会在模型中引入偏差,从而降低结果的可靠性,尤其是在治疗罕见疾病或研究不足的目标时。此外,AI预测的可解释性仍然是一个未解决的问题,使得监管机构难以采纳这些技术。
目前的监管机构,如FDA,尚未授权任何大型语言模型(LLMs)用于医学,并且尚未完全适应药物发现和开发中的AI驱动和多模态数据驱动方法。缺乏标准化的指南来验证和批准AI驱动的流程是一个重大障碍,特别是对于使用敏感基因组和临床数据的模型。此外,在不同的临床阶段证明AI预测的稳健性和可靠性可能减缓新药的批准。
仅通过开发方法(AI vs. 传统)来区分药物变得越来越困难。这是一个随着技术进步而演变的连续过程。药物发现本质上是复杂且耗时的,通常需要十多年才能推进足够数量的候选药物进行严格分析。这对投资者来说是一个重大障碍,因为可靠的基准来评估投资机会可能有限。投资者应定义一个决策矩阵,资助那些拥有数据访问权限、拥有强大且经过验证的AI平台、由在药物发现或相关领域有丰富经验的团队领导的公司,并保持多样化的投资组合以降低风险。纵向结果跟踪对于验证AI驱动的药物发现的有效性并确定其在未来领域挑战中的战略角色至关重要。
本文及其他深入分析将在我们即将于2025年3月21日发布的《超越实验室——人工智能》报告中呈现。请务必下载该报告,探索AI驱动药物开发的更多突破性进展,并了解人工智能如何继续塑造医疗创新的未来。
(全文结束)

