一种经过人类细胞复杂数据训练的人工智能(AI)模型,有望为新药研发竞赛提供捷径。
该方法于10月23日发表在《科学》杂志上,延续了药物发现领域的最新趋势:利用AI加速繁琐的筛选过程——即从海量化学化合物集合中搜寻潜在突破性疗法。
“这是一个面向未来的强大蓝图,”未参与此项研究的北京大学细胞生物学家邓宏魁表示,“它创建了一套能从自身实验中学习的‘智能’筛选系统。”
繁琐的方法
数十年来,研究人员通过逐一筛查大型化学化合物库,测试每种化合物对实验室培养细胞的影响来寻找药物。该方法已取得成功,例如发现了能杀死癌细胞的药物。
如今,研究人员越来越渴望开发更复杂的筛选方法,以利用过去十年从单个细胞收集的爆炸式增长的基因组数据。理论上,此类方法可评估化合物如何扰动整个基因活性网络——这一测试能为药物发现开辟新途径。
但麻省理工学院剑桥分校的生物医学工程师亚历克斯·沙莱克指出,药物发现通常需筛查数万种甚至更多化合物,将如此大规模筛选与复杂检测相结合既昂贵又费力。
为找到切实可行的基因组数据应用方案,沙莱克与麻省萨默维尔市生物技术公司Cellularity(沙莱克亦担任该公司付费顾问)及其他研究人员合作。团队利用近9600种化学化合物在50余类细胞中扰动基因活性的公开数据,训练了一种名为DrugReflector的深度学习模型。
他们使用DrugReflector筛选出能影响血小板和红细胞生成的化学物质——这一特性对治疗某些血液疾病具有潜在价值。随后,团队测试了其中107种化学物质以验证其预测效果。
总体而言,DrugReflector在寻找相关化合物方面的效率比依赖随机筛选化学库的传统暴力筛选方法高出17倍。当研究人员将首轮筛选数据重新纳入模型进行迭代优化后,其成功率更是翻倍提升。
【全文结束】

