研究人员警告:AI辅助基因组研究存在持续性问题Persistent problems plague AI-assisted genomic studies, researchers warn

环球医讯 / AI与医疗健康来源:medicalxpress.com美国 - 英语2024-11-05 01:00:00 - 阅读时长3分钟 - 1459字
威斯康星大学麦迪逊分校的研究人员警告称,AI工具在基因组研究中可能导致错误结论,尤其是在预测基因与疾病风险之间的关联时。
AI辅助基因组研究全基因组关联研究基因与疾病关联错误结论假阳性统计方法数据空白健康访问
研究人员警告:AI辅助基因组研究存在持续性问题

威斯康星大学麦迪逊分校的研究人员警告称,近年来在遗传学和医学领域越来越受欢迎的人工智能工具可能导致关于基因与身体特征(包括糖尿病等疾病的风险因素)之间联系的错误结论。这些错误预测与研究人员使用AI协助全基因组关联研究有关。此类研究会扫描许多人的数十万个基因变异,以寻找基因与身体特征之间的联系,特别是基因变异与某些疾病之间的可能联系。

基因与疾病的关联并非总是简单直接

基因在许多健康状况的发展中起着重要作用。虽然某些个别基因的变化直接与囊性纤维化等疾病的风险增加有关,但基因与身体特征之间的关系往往更为复杂。全基因组关联研究已经帮助解开了一些这些复杂性,通常使用大型数据库,如美国国立卫生研究院的“我们所有人”项目和英国生物银行,这些数据库包含个体的基因谱型和健康特征。然而,这些数据库通常缺乏研究人员试图研究的健康状况的数据。

“一些特征要么非常昂贵,要么劳动密集型测量,因此你根本没有足够的样本量来得出其与基因关联的有意义的统计结论,”威斯康星大学麦迪逊分校生物统计学和医学信息学系副教授、全基因组关联研究专家吕琼石说。

使用AI填补数据空白的风险

研究人员越来越尝试通过使用越来越复杂的AI工具来解决这一问题。“近年来,利用机器学习的进步变得非常流行,我们现在有了这些高级的机器学习AI模型,即使在数据有限的情况下也能预测复杂的特征和疾病风险,”吕琼石说。现在,吕琼石和他的同事们展示了依赖这些模型而不防止它们可能引入的偏差所带来的危险。他们在最近发表于《自然遗传学》杂志的一篇论文中描述了这个问题。在这篇论文中,吕琼石和他的同事们展示了全基因组关联研究中常用的一种机器学习算法可能会错误地将多个基因变异与个体患2型糖尿病的风险联系起来。

“问题是,如果你信任机器学习预测的糖尿病风险作为实际风险,你会认为所有这些基因变异都与实际糖尿病相关,尽管它们并不是,”吕琼石说。这些“假阳性”不仅限于这些特定的变异和糖尿病风险,而是AI辅助研究中的普遍偏差。

新的统计方法可以减少假阳性

除了指出过度依赖AI工具的问题外,吕琼石和他的同事们还提出了一种统计方法,研究人员可以使用该方法保证其AI辅助全基因组关联研究的可靠性。这种方法有助于消除机器学习算法在基于不完整信息进行推理时可能引入的偏差。“这种新策略在统计上是最优的,”吕琼石说,他指出团队使用这种方法更好地确定了基因与个体骨密度之间的关联。

AI并非全基因组关联研究中唯一的问题

虽然该小组提出的统计方法可以帮助提高AI辅助研究的准确性,但吕琼石和他的同事们最近还发现了使用代理信息而非算法填补数据空白的类似研究中的问题。在另一篇最近发表于《自然遗传学》杂志的论文中,研究人员对过度依赖代理信息以建立基因与某些疾病之间联系的研究发出了警报。例如,像英国生物银行这样的大型健康数据库拥有大量人口的基因信息,但关于晚年发病的疾病(如大多数神经退行性疾病)的发病率数据却很少。对于阿尔茨海默病,一些研究人员试图通过家庭健康史调查收集的代理数据来弥补这一差距,这些调查中个人可以报告父母的阿尔茨海默病诊断。威斯康星大学麦迪逊分校的研究团队发现,这样的代理信息研究会产生“高度误导性的基因关联”,即高认知能力与阿尔茨海默病风险之间的关联。

“如今,基因组科学家经常处理包含数十万个体的生物银行数据集,然而,随着统计能力的提高,这些大规模数据集中的偏差和错误概率也会放大,”吕琼石说。“我们小组的近期研究表明,统计严谨性在生物银行规模的研究中至关重要。”


(全文结束)

大健康

猜你喜欢

  • 加拿大如何在AI辅助手术中领先全球加拿大如何在AI辅助手术中领先全球
  • 墨尔本默多克儿童研究所与旧金山格拉德斯通研究所合作,利用干细胞、基因组学和人工智能研究先天性心脏病墨尔本默多克儿童研究所与旧金山格拉德斯通研究所合作,利用干细胞、基因组学和人工智能研究先天性心脏病
  • CalIT2研讨会展望健康与医学的未来CalIT2研讨会展望健康与医学的未来
  • 威斯康星大学麦迪逊分校:人工智能基因组研究面临持续问题威斯康星大学麦迪逊分校:人工智能基因组研究面临持续问题
  • 威斯康星大学麦迪逊分校研究人员发现人工智能辅助基因组研究中的持续问题威斯康星大学麦迪逊分校研究人员发现人工智能辅助基因组研究中的持续问题
  • 麦肯锡:AI如何应对心理健康危机麦肯锡:AI如何应对心理健康危机
  • Alimetry 获得1800万美元融资以推进可穿戴肠道健康监测设备Alimetry 获得1800万美元融资以推进可穿戴肠道健康监测设备
  • 德克萨斯科技公司在推进医疗技术中的作用德克萨斯科技公司在推进医疗技术中的作用
  • 50年谜团解开:研究人员揭开干细胞移植的“黑箱”50年谜团解开:研究人员揭开干细胞移植的“黑箱”
  • 从德班到牛津:库梅伦·戈文德在AI驱动的医学研究中取得突破性博士学位从德班到牛津:库梅伦·戈文德在AI驱动的医学研究中取得突破性博士学位
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康