AI 辅助基因组研究充满错误AI-Assisted Genome Studies Are Riddled with Errors

环球医讯 / AI与医疗健康来源:www.the-scientist.com美国 - 英语2024-11-14 05:00:00 - 阅读时长4分钟 - 1567字
研究人员利用人工智能在大型基因组学研究中填补患者信息空白并改进预测,但新研究揭示了假阳性和误导性相关性
AI辅助基因组研究错误假阳性误导性相关性全基因组关联研究人工智能偏差疾病预测基因变异
AI 辅助基因组研究充满错误

研究人员利用人工智能在大型基因组学研究中填补患者信息空白并改进预测,但新的研究揭示了假阳性和误导性相关性。Sahana Sitaraman 博士是一名科学记者,目前在《The Scientist》担任实习生,背景包括神经科学和微生物学。她曾为 Live Science、Massive Science 和 eLife 撰稿。

基因组作为身体的蓝图,影响着从面部形状到脚弓的每一个特征,甚至某些疾病的发展。虽然一些疾病,如囊性纤维化,与单个基因相关联,可以根据个人的遗传数据可靠预测,但许多其他疾病(如自闭症谱系障碍、阿尔茨海默病、抑郁症和肥胖)并非如此。过去15年来,科学家们通过全基因组关联研究(GWAS)比较大量人群的基因组,识别出数十万个与特定特征或疾病相关的基因变异。这种方法帮助科学家揭示了复杂疾病的潜在生物学机制和风险因素,还发现了新的药物靶点。尽管取得了这些进展,GWAS 研究仍存在局限性,科学家们试图借助人工智能(AI)来解决这些问题。然而,在《Nature Genetics》上发表的两项研究中,威斯康星大学麦迪逊分校的研究人员发现,这些新方法在处理大型但不完整数据集时会引入普遍的偏差。

GWAS 依赖于包含大量患者数据的大型生物样本库。然而,这些存储库可能缺乏从血液报告、扫描、患者历史到家庭数据的各种信息。即使进行了彻底的调查,如年轻参与者队列中缺乏晚发性疾病的数据等问题也会给研究计划带来麻烦。为了解决数据缺口,科学家们开发了两种方法:机器学习和 GWAS-by-proxy(GWAX),后者依赖家庭历史数据作为晚发性疾病的风险预测指标。许多研究人员结合 GWAS 和 GWAX 来提高预测的统计能力。然而,威斯康星大学麦迪逊分校的研究团队发现,这些“解决方案”可能会错误地将基因变异与疾病联系起来。“近年来,利用机器学习的进步变得非常流行,因此我们现在有了先进的机器学习 AI 模型,研究人员可以使用这些模型在有限的数据下预测复杂的特征和疾病风险,”威斯康星大学麦迪逊分校的生物统计学家吕琼石(Qiongshi Lu)在新闻发布会上说。

在 AI 辅助的 GWAS 中,吕琼石和他的同事们注意到基因变异与二型糖尿病之间的虚假关联。例如,在 AI 辅助的 GWAS 中,四个基因变异显示出与该疾病的高度相关性,但在使用传统 GWAS 方法时却没有这种相关性。然而,先前的研究表明,尽管这些基因作用于一个间接与血糖水平相关的细胞通路,但它们对血糖水平的影响并不强烈。在所有样本都有遗传数据但只有部分样本有所需表型数据的队列中,AI 辅助的 GWAS 算法会尝试基于学习到的模式填补空白。但如果不了解生理细节,这种方法可能会引导研究人员走向错误的方向。“问题在于,如果你信任机器学习预测的糖尿病风险作为实际风险,你会认为所有这些基因变异都与实际糖尿病相关,即使它们实际上并不相关,”吕琼石说。

用代理信息补偿数据银行中的空白也是有问题的。例如,在分析多个特征与阿尔茨海默病风险的相关性时,吕琼石观察到与基于实际数据的 GWAS 结果的偏离。一个关键的差异是教育程度与阿尔茨海默病风险之间的关联。多个研究小组报告称,这两个变量之间存在负相关,这一结果得到了 GWAS 的支持。然而,当使用 GWAX 方法时,吕琼石观察到了正相关。代理信息方法也没有显示出疾病与晚年认知能力下降之间的联系,这与先前的数据和 GWAS 发现相反。研究团队提出了新的统计方法,研究人员可以使用这些方法来纠正这些偏差,提高其发现的可靠性。他们敦促研究界透明地报告发现,并在从这些方法得出结论时采取更严格和谨慎的态度。“我们小组最近的研究提供了令人谦卑的例子,强调了在生物样本库规模的研究中统计严谨性的重要性,”吕琼石说。


(全文结束)

大健康

猜你喜欢

  • 美国国立卫生研究院向史蒂文斯理工学院和哥伦比亚大学拨款200万美元用于监测神经肌肉疾病美国国立卫生研究院向史蒂文斯理工学院和哥伦比亚大学拨款200万美元用于监测神经肌肉疾病
  • 日本推进医疗AI:药物设计与机器人领域的创新日本推进医疗AI:药物设计与机器人领域的创新
  • nference与Parabilis Medicines建立结直肠癌AI研究合作伙伴关系nference与Parabilis Medicines建立结直肠癌AI研究合作伙伴关系
  • 解锁焦虑根源:跨物种研究中发现杏仁核内的不同细胞类型解锁焦虑根源:跨物种研究中发现杏仁核内的不同细胞类型
  • 用代理型AI解锁复杂生物系统的奥秘用代理型AI解锁复杂生物系统的奥秘
  • 全球研究揭示老年人新冠疫苗接种覆盖率不平等现象全球研究揭示老年人新冠疫苗接种覆盖率不平等现象
  • 克利夫兰诊所CEO:人工智能和量子计算在医疗保健领域的未来克利夫兰诊所CEO:人工智能和量子计算在医疗保健领域的未来
  • Medeloop 获得1550万美元用于AI驱动的医疗研究平台Medeloop 获得1550万美元用于AI驱动的医疗研究平台
  • 应对监管挑战:Fayazoddin Mohamad 论 AI 在药房合规中的作用应对监管挑战:Fayazoddin Mohamad 论 AI 在药房合规中的作用
  • 生姜是一种抗衰老强效成分,可针对12个衰老标志,据新科学综述生姜是一种抗衰老强效成分,可针对12个衰老标志,据新科学综述
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康