Google DeepMind发布AI工具助力识别疾病遗传驱动因素
AlphaGenome可一次分析多达100万个DNA代码字母,有望为新疗法铺平道路
伊恩·桑普尔 科学编辑
Google DeepMind的研究人员发布了他们最新的人工智能工具,并声称该工具将帮助科学家识别疾病的遗传驱动因素,最终为新疗法铺平道路。
AlphaGenome预测突变如何干扰基因的控制方式,包括基因何时开启、在身体的哪些细胞中开启,以及其生物表达调控是设置为高还是低。许多家族性常见疾病,包括心脏病和自身免疫性疾病,以及心理健康问题,都与影响基因调控的突变有关,许多癌症也是如此,但确定哪些遗传故障是罪魁祸首远非易事。
"我们认为AlphaGenome是一个理解基因组中功能元素作用的工具,我们希望这将加速我们对生命密码的基本理解,"DeepMind研究员娜塔莎·拉蒂舍娃(Natasha Latysheva)在关于这项工作的新闻简报中表示。
人类基因组包含30亿对字母——即构成DNA代码的G、T、C和A。基因组的约2%告诉细胞如何制造蛋白质,即生命的构建模块。其余部分则协调基因活动,承载着关键指令,决定单个基因在何处、何时以及以多大程度开启。
研究人员在人类和小鼠遗传学的公共数据库上训练了AlphaGenome,使其能够学习特定组织中突变与基因调控影响之间的联系。该人工智能可以一次分析多达100万个DNA代码字母,并预测突变将如何影响不同的生物过程。
DeepMind团队相信,该工具将帮助科学家绘制出哪些遗传代码链对特定组织(如神经和肝细胞)的发育最为关键,并确定驱动癌症和其他疾病的最重要突变。它还可能通过允许研究人员设计全新的DNA序列来支持新的基因疗法——例如,在神经细胞中开启某个基因,但在肌肉细胞中不开启。
加拿大不列颠哥伦比亚大学(University of British Columbia)的研究员卡尔·德布尔(Carl de Boer)没有参与这项工作,他说:"AlphaGenome可以确定突变是否影响基因组调控、哪些基因受到影响以及如何影响,以及在哪些细胞类型中影响。然后可以开发一种药物来抵消这种影响。"
"最终,我们的目标是拥有如此优秀的模型,以至于我们不必通过实验来确认其预测。虽然AlphaGenome代表了一项重大创新,但实现这一目标需要科学界的持续努力。"
一些科学家已经开始使用AlphaGenome。伦敦大学学院(UCL)儿科血液肿瘤学临床教授马克·曼索(Marc Mansour)表示,这在他的寻找癌症遗传驱动因素的工作中标志着"一步变革"。
埃克塞特大学(University of Exeter)的统计遗传学家加雷斯·霍克斯(Gareth Hawkes)说:"非编码基因组占我们30亿碱基对基因组的98%。我们对2%的部分了解得相当好,但我们拥有AlphaGenome这一事实,即它可以预测另外29.4亿碱基对区域在做什么,对我们来说是一个巨大的进步。"
【全文结束】

