靶点识别与信息学和数据挖掘
信息学与数据挖掘如何揭示最具成功潜力的靶点与靶点类别
什么是药物可开发性?
药物研发过程的核心在于识别合适的有效靶点,以及新型类药物化合物与该靶点结合并修饰它的能力。一个成功的药物靶点需要展示两个关键特性:
- 它必须具有能够结合类药物分子的位点,即具有药物可开发性的位点;以及
- 它必须与疾病过程存在因果关系。历史上的药物靶点按定义都具有这两种特性,对其特征的分析有助于指导和降低未来药物研发的风险。
药物可开发性通常以家族形式呈现
对已知药物靶点数据库的整理和分析使它们能够被分类为蛋白质家族,其中包含四个主要的"药物可开发"特权家族——视紫红质样G蛋白偶联受体配体、离子通道、核受体和蛋白激酶。大约53%的历史药物靶点和70%的已批准药物调控这4类靶点中的一个,因此投资于这些蛋白质的系统生物学和信号传导的筛选技术、化合物库和专业知识,以及使用信息学收集目标靶点的数据,有助于支持药物研发过程。
使用这些数据库,如ChEMBL数据库,显示已知药物靶点如G蛋白偶联受体配体能提供良好的投资回报——在先导化合物优化研究中发表的化合物有18%是G蛋白偶联受体配体,而市场上30%的已批准药物是G蛋白偶联受体药物。因此,尽管识别新型药物靶点在科学上既引人入胜又令人兴奋,但发现生产力会较低,需要投入大量时间和资源,这是较高新颖性的明确成本。
通过遗传学进行前瞻性预测
虽然了解靶点的药物可开发性至关重要,但功效成分也同样重要。孟德尔随机化可以提供靶点与疾病之间因果关系的证据,并提供一种预测靶点可能成功的途径。预先验证这些靶点成功的真实好处是,可以在大规模、昂贵的2期试验之前完成。
利用现有资源
在考虑用于分析、分选等的药物靶点时,使用在线资源可以支持这些决策。例如Open Target——这是一个由多家行业合作伙伴、欧洲生物信息学研究所和桑格研究所合作的项目,他们发布了一个丰富整理和集成的数据集合。"照亮可药物基因组"是一个全球项目,旨在识别和提供关于常见药物靶向蛋白质家族中研究较少的蛋白质的信息。最后,癌症研究所的CanSAR平台为体细胞疾病提供数据。
作者简介
John Overington教授于2017年加入Medicines Discovery Catapult担任首席信息官,在此领导信息学方法的开发和应用,通过应用研发社区内的合作项目,促进和支持创新、快速将药物带给患者的药物研发。
John参与了药物化学数据库StARLite的开发——这是ChEMBL的前身。最近,工作扩展到大规模专利信息学,建立了开放专利数据库SureChEMBL。John拥有巴斯大学的化学学位和伦敦大学伯贝克学院的博士学位。他是伦敦大学学院和曼彻斯特大学的客座教授。
【全文结束】

