2026年01月20日,一项利用人工智能(AI)加速药物发现的新型全球公私合作项目正式启动,伦敦大学学院(UCL)作为核心学术合作伙伴参与其中。
这一为期五年的项目预算超过6000万欧元,由欧洲联盟和产业合作伙伴通过创新健康倡议计划(Innovative Health Initiative, IHI)共同资助。
LIGAND-AI联盟汇集了来自九个国家的18家合作伙伴,致力于生成大规模开放、高质量的分子(配体)与蛋白质结合数据集,并利用这些数据训练人工智能模型,使其能够预测适合作为数千种人类蛋白质结合分子的候选化合物,用于药物研发。
在辉瑞(Pfizer)和结构基因组学联盟(Structural Genomics Consortium, SGC)的领导下,该联盟集合了学术界、生命科学产业、技术公司和研究机构的专家团队,将针对现有及未满足医疗需求疾病领域(包括罕见病、神经疾病和肿瘤学/癌症病症)相关的数千种蛋白质开展研究,规模化生成开放可及、高质量且适用于人工智能的公共数据资源。
早期药物发现是一个漫长、昂贵且充满不确定性的过程。科学家往往需要耗费数年时间测试数千种分子,才能找到一种与疾病相关蛋白质结合的分子。LIGAND-AI项目旨在通过将先进实验技术与计算方法相结合,建立从实验到预测的无缝流程,从而改变这一现状。联盟将利用互补性筛选技术生成数十亿数据点,使全球研究人员能够开发、训练和评估预测分子相互作用的人工智能模型。
伦敦大学学院(UCL)是英国方面的核心学术合作伙伴,与加拿大和德国的大学协同合作。由马修·托德教授(Matthew Todd)和尼古拉·伯吉斯-布朗教授(Nicola Burgess-Brown,两位均来自UCL药学院)领导的UCL团队,将主导该开放科学项目的社区建设工作,面向全球征集蛋白质样本和机器学习模型捐赠,并推动这些研究者网络的创建与扩展。
托德教授表示:“机器学习将加速新药发现进程,但要实现这一目标,我们需要非常庞大、高质量的公共数据集,以有效训练算法。本项目通过实验室实验方式,帮助生成描述数十亿分子如何与人类蛋白质结合的数据集。这将助力所有人开发更优的药物发现预测模型,包括UCL在国王十字区(King's Cross)的众多产业合作伙伴。作为一项全球性开放科学项目,我们诚邀潜在合作伙伴特别是蛋白质科学和机器学习领域的专家积极联系。”
多伦多大学阿莱德·爱德华兹教授(Aled Edwards),作为结构基因组学联盟首席执行官兼项目协调人,表示:“本项目汇集了开放科学生态系统中跨学科的科学家与企业。令人欣慰的是,这些多元化的科学界正凝聚在共同愿景下,向世界公开生成并共享宝贵的化学数据。”
除数据生成外,LIGAND-AI还将通过开放挑战赛和基准测试活动,邀请科学界共同开发和优化预测模型,从而培育开放式发现生态系统。LIGAND-AI产生的所有数据将确保全球科学界可查找、可访问、可互操作且可重复使用。通过整合蛋白质科学、结构生物学、化学和机器学习领域的专业知识,该项目将构建一个动态网络,使实验发现与计算发现协同发展,确保研究进展具有累积性、透明度和可及性。
通过建立人工智能驱动药物发现的共享开放式科学基础设施,LIGAND-AI不仅将推进早期研究,还将培养新一代精通计算与实验的跨学科科学家。该项目代表了结构基因组学联盟“2035目标”的重大进展——旨在2035年前为所有人蛋白质发现化学调控剂。
【全文结束】

