人工智能(AI)深度学习正在迅速改变生物技术和制药行业。许多行业垂直领域中出现了基于ChatGPT类算法的新AI模型。波恩大学研究人员在《细胞报告物理科学》上发表的一项新研究表明,一个类似ChatGPT的AI模型可以预测双靶点药物,这种药物可以同时抑制两个酶,用于治疗复杂疾病并加速多药理学的发展。
波恩大学教授Jürgen Bajorath博士及其合著者Sanjana Srinivasan写道:“具有明确多靶点活性的化合物是治疗多因素疾病的候选药物。” 多药理学是指设计或使用可以同时作用于多个药物靶点的药物。大多数疾病都是复杂的或由多种因素引起的多因素疾病,这些因素包括基因、生活方式和环境因素。多因素疾病的例子包括双相情感障碍、精神分裂症、躁郁症、偏头痛、癫痫、常见癌症、2型糖尿病、阿尔茨海默病、帕金森病、类风湿关节炎、骨质疏松症、哮喘、肾病、多发性硬化症、自身免疫性疾病等。
人工智能正在制药和生物制药行业中取得重大进展,特别是在研发领域。根据Statista的数据,到2032年,全球用于药物发现的人工智能市场预计将达到130亿美元的收入。“在这里,我们介绍了基于变压器的化学语言模型变体,用于生成双靶点化合物的设计,”研究团队写道。
大型语言模型(LLMs)如OpenAI的ChatGPT是一种具有变压器深度学习架构的人工神经网络。ChatGPT中的“T”代表变压器。变压器可以通过识别大量文本中的模式进行预测,并具有自注意力机制,使其能够在查看序列的不同部分时更关注最相关的部分。谷歌在2017年的论文《注意力就是你所需要的》中首次介绍了变压器,该论文由Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones、Aidan N. Gomez、Lukasz Kaiser和Illia Polosukhin撰写。
在这项研究中,Bajorath和Srinivasan创建了一个化学语言模型,该模型接受了一对称为简化分子输入行输入系统(SMILES)字符串的化学符号文本训练。这些SMILES字符串是一种通过字母和符号序列表示分子的紧凑方法。他们的化学语言模型接受了超过75,000对目标字符串的训练,其中每个字符串代表一个作用于一个目标蛋白的分子,另一个字符串代表一个既作用于同一目标蛋白又影响不同目标蛋白的化合物。然后,AI模型通过字符串对进行了微调,以便“学习”与各种蛋白质类别的可靶向化合物。
科学家们报告说:“最终模型能够精确重现被排除在模型推导之外的已知双靶点化合物。”
这项研究表明,AI变压器模型可以预测能够同时针对两个蛋白质的化学化合物。这一概念验证是加速许多复杂疾病药物设计并缩短整体药物开发周期的重要一步。
(全文结束)

