靶点识别与信息学和数据挖掘

靶点识别与信息学和数据挖掘Target Identification with informatics and data mining - Medicines Discovery Catapult

环球医讯 / 创新药物来源：md.catapult.org.uk英国 - 英语2026-05-15 18:13:34 - 阅读时长3分钟 - 1173字

本文深入探讨了如何运用信息学与数据挖掘技术识别最具成功潜力的药物靶点和靶点类别，系统阐述了"药物可开发性"的核心概念及其在药物研发中的关键作用，分析了药物靶点通常以家族形式呈现的特性规律，详细介绍了利用孟德尔随机化进行前瞻性预测的方法，以及Open Target、照亮可药物基因组计划和CanSAR平台等重要资源的应用价值，强调了在药物研发过程中结合历史数据与新兴技术的重要性，有助于显著降低研发风险并提高成功率，为医药研发领域的专业人士提供了科学依据和实用工具，对推动创新药物研发具有重要的实践指导意义。

信息学与数据挖掘如何揭示最具成功潜力的靶点与靶点类别

什么是药物可开发性？

药物研发过程的核心在于识别合适的有效靶点，以及新型类药物化合物与该靶点结合并修饰它的能力。一个成功的药物靶点需要展示两个关键特性：

它必须具有能够结合类药物分子的位点，即具有药物可开发性的位点；以及
它必须与疾病过程存在因果关系。历史上的药物靶点按定义都具有这两种特性，对其特征的分析有助于指导和降低未来药物研发的风险。

药物可开发性通常以家族形式呈现

对已知药物靶点数据库的整理和分析使它们能够被分类为蛋白质家族，其中包含四个主要的"药物可开发"特权家族——视紫红质样G蛋白偶联受体配体、离子通道、核受体和蛋白激酶。大约53%的历史药物靶点和70%的已批准药物调控这4类靶点中的一个，因此投资于这些蛋白质的系统生物学和信号传导的筛选技术、化合物库和专业知识，以及使用信息学收集目标靶点的数据，有助于支持药物研发过程。

使用这些数据库，如ChEMBL数据库，显示已知药物靶点如G蛋白偶联受体配体能提供良好的投资回报——在先导化合物优化研究中发表的化合物有18%是G蛋白偶联受体配体，而市场上30%的已批准药物是G蛋白偶联受体药物。因此，尽管识别新型药物靶点在科学上既引人入胜又令人兴奋，但发现生产力会较低，需要投入大量时间和资源，这是较高新颖性的明确成本。

通过遗传学进行前瞻性预测

虽然了解靶点的药物可开发性至关重要，但功效成分也同样重要。孟德尔随机化可以提供靶点与疾病之间因果关系的证据，并提供一种预测靶点可能成功的途径。预先验证这些靶点成功的真实好处是，可以在大规模、昂贵的2期试验之前完成。

利用现有资源

在考虑用于分析、分选等的药物靶点时，使用在线资源可以支持这些决策。例如Open Target——这是一个由多家行业合作伙伴、欧洲生物信息学研究所和桑格研究所合作的项目，他们发布了一个丰富整理和集成的数据集合。"照亮可药物基因组"是一个全球项目，旨在识别和提供关于常见药物靶向蛋白质家族中研究较少的蛋白质的信息。最后，癌症研究所的CanSAR平台为体细胞疾病提供数据。