一种预测小分子药物化合物在不同反相高效液相色谱柱上保留时间的新型机器学习方法A Novel Machine Learning Method for Predicting Retention Time of Small Molecule Pharmaceutical Compounds Across Reversed-phase HPLC Columns | LCGC International

环球医讯 / AI与医疗健康来源:www.chromatographyonline.com美国 - 英语2025-12-31 13:52:47 - 阅读时长8分钟 - 3686字
基因泰克公司的杰西卡·林和石振奇(皮特)提出了一种突破性机器学习方法,能够准确预测小分子药物化合物在不同反相高效液相色谱柱上的保留时间,该技术克服了传统单柱定量结构保留关系模型的局限性,通过整合分析物结构、色谱柱选择性描述符和流动相条件进行预测,无需目标色谱柱的预存数据,显著提升了药物化学制造与控制过程中的方法转移效率和杂质谱追踪能力,减少了70%以上的方法开发时间与资源消耗,对加速药品研发周期和确保质量一致性具有革命性意义,特别适用于多实验室协作和工艺变更场景。
小分子药物反相高效液相色谱保留时间预测机器学习药物CMC方法开发杂质谱追踪方法转移生物制药分析色谱柱选择性
一种预测小分子药物化合物在不同反相高效液相色谱柱上保留时间的新型机器学习方法

一种预测小分子药物化合物在不同反相高效液相色谱柱上保留时间的新型机器学习方法

核心要点

  • 传统QSRR模型仅限于单柱预测,难以适应制药环境中多样的液相色谱设置。
  • 这种新型基于机器学习的方法利用分析物结构、色谱柱选择性描述符和流动相条件预测保留时间,显著提升适应性。
  • 该框架改善了方法转移性和杂质谱追踪能力,大幅减少方法开发所需的资源和时间。
  • 选择性数据的公开获取补充了基于机器学习的方法,有助于在方法优化和转移中做出明智决策。

在药物色谱分析中,哪些具体挑战或未满足的需求促使您开展这项研究项目?

在药物化学、制造和控制(CMC)中使用反相高效液相色谱(RP-HPLC)通常涉及在同一项目的药物物质(DS)和药物产品(DP)上,不同实验室开发多种方法,以及随着工艺变化进行重新开发,这需要频繁的方法衔接。现有的计算工具通常无法准确预测不同固定相(SPs)和流动相(MPs)下的保留时间(Rts)。

这在简化方法开发、生命周期管理和提高药物CMC效率方面构成了主要瓶颈。我们发现了这一未满足的需求,并通过创建一个能够在这些不同的液相色谱(LC)设置中泛化保留时间预测的计算框架来解决它,从而实现方法衔接并简化色谱工作流程。

为什么在药物方法开发的背景下,超越传统的单柱定量结构保留关系(QSRR)模型进行保留时间预测很重要?

传统QSRR模型通常局限于单柱保留预测,限制了它们在药物环境中的实用性,因为在药物环境中,方法通常需要在不同的固定相和流动相之间进行调整。单柱QSRR无法考虑色谱柱选择性的多样性和溶剂相互作用。超越单柱模型并确保预测保持稳健和可泛化,最终减少实验负担并实现在实验室和设备之间的无缝采用,是药物CMC中的一个重要课题。

在使用传统QSRR模型预测保留时间时,您遇到了哪些限制?您认为这种多柱机器学习(基于ML)方法如何解决这些问题?

传统QSRR模型在选定的分析物和固定相数据库上进行训练,使其高度受限且特定。它们缺乏在训练数据库之外的新固定相和流动相上预测保留时间的灵活性,特别是当分析物的电离状态随pH变化,以及新的固定相与原始模型中的固定相性质显著不同时。我们的方法使用固定相选择性描述符来考虑不同性质的固定相,并利用可重新训练的机器学习模型框架。这使得它能够在不需要新固定相和流动相上的保留数据的情况下预测保留时间,使其更能适应新的液相色谱条件。

您的方法与先前发表的保留时间转移模型有何不同?是什么使它在不同色谱柱和条件下更具泛化性?

我们的方法采用先进的机器学习技术,仅基于分析物结构、色谱柱选择性描述符和流动相条件预测保留时间,而不是依赖现有的保留时间数据库和这些数据库之间的保留时间相关性。这使得它在不同的固定相和流动相中具有高度适应性。这些特点共同使其更加多功能和可泛化。

这种方法消除了对目标色谱柱上现有保留时间数据的需求。这对于在不同实验室或药物开发阶段开发或转移方法来说,可能有多大的变革性?

消除对现有保留时间数据的需求大大减少了方法开发或转移所需的资源和时间。它消除了获取目标色谱柱数据的要求,因此能够预测更多色谱柱,并提高方法开发的成功率。

在药物CMC环境中,方法稳健性和重现性至关重要。该框架如何改善开发阶段之间的方法转移性和杂质谱追踪?

所提出的框架允许多个固定相和流动相之间稳健的保留时间预测/转移。在CMC环境中,这有助于在方法变更的情况下保持杂质识别的一致性。预测能力减少了杂质谱中的差异,确保研究/开发结果与大规模制造之间有更大的一致性。这降低了风险并提高了开发阶段之间的分析一致性。

在将这种预测框架纳入已验证的分析程序时,您是否预见到监管或质量控制方面的挑战?

我们将其视为用于简化方法开发和促进不同实验室之间方法转移的开发工具。基于其预测能力,它可以预测哪些色谱柱值得研究,哪些不值得。再次强调,其预测能力需要通过实验验证。因此,我们不认为在将预测的保留时间用于任何符合药品生产质量管理规范(GMP)和/或质量决策方面会存在任何监管和质量控制挑战。

随着色谱柱选择性数据在hplccolumns.org等网站上公开可获取,这种透明度对您在实验室中选择或切换色谱柱有多大的价值?

选择性数据的公开获取是无价的。它使研究人员能够快速评估和选择最适合其分析物的色谱柱,从而民主化获取关键色谱特性。这种透明度补充了基于机器学习的方法,即使在资源有限的实验室中,也能在方法优化/转移方面做出明智的决策。

该模型侧重于小分子药物。您认为该框架是否可以适应或扩展到涵盖生物制药模式,如肽或小极性代谢物?

将此框架扩展到生物制药是可能的,但需要额外的定制以考虑肽或小极性代谢物的独特理化性质。对于肽或代谢物,需要将二级结构稳定性、疏水性和翻译后修饰等因素纳入机器学习模型。

什么会使您或您的实验室采用像这样的预测保留时间模型?是否存在特定的障碍,例如集成、监管验证或数据格式,需要解决?

一个重要的驱动因素将是与现有实验室工作流程和色谱平台的无缝软件集成。目前没有监管方面的担忧,因为机器学习模型的预期用途是用于开发。此外,确保与各种液相色谱仪器使用的不同数据格式的兼容性将消除采用障碍并促进广泛使用。

您对机器学习在生物制药分析实践中的使用有何预测?

作者一致认为,机器学习在生物制药分析中具有巨大潜力,从加速复杂生物制品的纯化开发到优化生物治疗药物中的杂质谱分析。机器学习驱动的工具可以与分析质量源于设计(QbD)工作流程集成,预测应激条件下的产品稳定性,甚至基于结构数据预测免疫原性。随着该领域的发展,对高级结构如何影响这些分子描述符的更好理解将成为机器学习在生物制药领域进一步发展的关键环节。

参考文献

(1) Shi, Z. Q.; Yi, Y, Y.; Madrigal, E.; 等. 一种预测小分子药物化合物在不同反相高效液相色谱柱上保留时间的通用方法. J. Chromatogr. A 2025, 1742, 465628.

(2) Bouwmeester, R.; Martens, L.; Degroeve, S. 液相色谱设置的通用校准用于小分子保留时间的通用预测. Anal. Chem. 2020, 92 (9), 6571–6578

(3) Fedorova, E. S.; Matyushin, D. D.; Plyushchenko, I. V.; Stavrianidi, A. N.; Buryak, A. K. 深度学习在反相液相色谱中保留时间预测的应用. J Chromatogr. A 2022, 1664, 462792

(4) Stanstrup, J.; Neumann, S.; Vrhovsek, U. PredRet: 通过多个色谱系统间的直接映射预测保留时间. Anal. Chem. 2015, 87 (18), 9421–9428

(5) Wiczling, P.; Kamedulska, A. 使用贝叶斯多级模型比较色谱固定相. Anal. Chem. 2024, 96 (3), 1310–1319

(6) Wiczling, P.; Kubik, L.; Kaliszan, R. 通过有限实验次数的色谱参数最大后验贝叶斯估计. Anal. Chem. 2015, 87 (14), 7241–7249

(7) Zhang, Y.; Liu, F.; Li , X. Q.; 等. 通过后投影校准在液相色谱中进行通用且准确的保留时间预测. Commun. Chem. 2024, 7 (1), 54

(8) Domingo-Almenara, X.; Guijas, C.; Billings ,E.; 等. 用于机器学习保留时间预测的METLIN小分子数据集. Nat. Commun. 2019, 10 (1), 5811

(9) HPLC色谱柱选择性数据

杰西卡·林 于2013年在美国密歇根大学安娜堡分校获得分析化学博士学位。她从CMC分析科学家开始她的行业生涯,在安进和吉利德积累了宝贵的经验,然后于2016年加入基因泰克。在基因泰克,她的职业生涯通过多种角色发展,包括担任临床项目的CMC分析负责人,并牵头分析方法和技术开发。最近,她的工作集中在科学和技术的交叉点上,她领导CMC数字化和数据科学的计划。

石振奇(皮特) 于2009年从杜肯大学毕业,获得药学科学学位。在博士后之后,他加入了礼来,倡导在药物物质和产品开发中使用实时传感和机器学习进行工艺优化。他领导了为Verzenio交付实时监测和实时放行测试的团队,这是礼来首个用于药品的连续制造工艺。2021年,他加入基因泰克担任分析CMC负责人,还负责建立早期阶段的过程分析技术计划。到目前为止,他已经发表了50多篇同行评审的文章,并一直是ETC等专业研讨会和非营利组织中过程分析技术和机器学习相关活动的关键领导者。在业余时间,石喜欢木工、露营和与家人共处。

【全文结束】

猜你喜欢
    热点资讯
    全站热点
    全站热文