AI机器人精准分析大数据集预测早产
在计算机科学家已有的妊娠数据工作基础上,年轻研究人员利用AI构建有效的预测模型
玛丽娜·西罗塔(Marina Sirota)博士在加州大学旧金山分校(UCSF)Mission Bay校区的实验室中。西罗塔及其团队利用人工智能分析妊娠数据,使一名硕士生和一名高中生能够识别预测早产的模式——这项工作通常需要规模大得多的团队才能完成。
在AI解码海量健康数据的早期测试中,加州大学旧金山分校和韦恩州立大学的研究人员发现,生成式AI工具的处理速度能快出数个数量级——在某些情况下甚至优于花费数月时间分析数据的计算机科学团队。
科学家团队与AI辅助团队被赋予相同任务:基于1000多名孕妇的数据预测早产。
即使是加州大学旧金山分校的硕士生鲁本·萨瓦尔(Reuben Sarwal)和高中生维克多·塔尔卡(Victor Tarca)组成的初级研究组合,在AI协助下也构建出了有效的预测模型。他们几分钟内就生成了可运行的计算机代码——这项任务若由经验丰富的程序员完成,至少需要数小时甚至数天。
AI的优势在于能根据简短但高度专业化的提示编写代码来分析健康数据。并非所有AI都有用——团队测试的8款AI聊天机器人中,仅4款能生成可用代码。但它们无需大量专家协助即可完成任务。
这使初级科学家能快速运行实验、验证结果正确性,并在短短几个月内将发现撰写成文提交期刊。
“这些AI工具可以缓解数据科学中最大的瓶颈之一:构建我们的分析流程,”加州大学旧金山分校儿科学教授、巴卡尔计算健康科学研究所(BCHSI)代理主任、美国早产儿协会(March of Dimes)早产研究中心首席研究员玛丽娜·西罗塔博士表示,“对于急需帮助的患者而言,这种加速来得再及时不过。”
西罗塔是发表于《Cell Reports Medicine》期刊2月17日论文的共同资深作者。
这类工作只有通过开放数据共享才能实现——汇集众多女性的经历和众多研究人员的专业知识。
汤米科·T·奥斯科茨基(Tomiko T. Oskotsky)医学博士
大数据能否让妊娠更安全?
从数据到发现的更快路径,有望带来更可靠的早产诊断测试——早产是新生儿死亡的首要原因,也是儿童长期运动和认知障碍的主要诱因。美国每天约有1000名婴儿过早出生。
科学家对早产成因仍知之甚少。为寻找线索,西罗塔团队汇集了来自约1200名孕妇的微生物组数据,这些孕妇的分娩结果在九项研究中被追踪。
“这类工作只有通过开放数据共享才能实现——汇集众多女性的经历和众多研究人员的专业知识,”美国早产儿协会早产数据仓库联合主任、加州大学旧金山分校巴卡尔计算健康科学研究所副教授、该论文共同资深作者汤米科·T·奥斯科茨基医学博士表示。
但海量数据仍难以分析。因此,团队通过名为DREAM(逆向工程评估与方法对话)的竞赛,向数据科学家众包求助。
西罗塔共同领导了三项妊娠DREAM挑战之一,专注于分析阴道微生物组数据。全球100多个团队竞相创建机器学习算法,以识别指示早产的数据模式。多数团队在挑战设定的三个月内达成目标,但汇总结果并发表论文耗时近两载。
AI为妊娠数据分析带来显著提升
西罗塔团队希望验证AI能否更快完成任务。他们与由底特律韦恩州立大学分子医学与遗传学中心教授阿迪·L·塔尔卡(Adi L. Tarca)博士领导的团队合作——后者主导了另两项DREAM挑战,旨在优化妊娠阶段估算方法。
双方共同指导8款AI工具,使用三场DREAM挑战的相同数据构建妊娠评估算法,全程无需人工干预。
AI聊天机器人通过自然语言提示完成此任务。其运作方式类似ChatGPT,但提示经过精心设计,引导AI以DREAM团队的方式评估人类健康数据。
目标与DREAM挑战一致:分析阴道微生物组数据以发现早产迹象;分析血液或胎盘组织样本以确定妊娠阶段。妊娠阶段几乎总是估算值,它决定孕妇在妊娠过程中的护理类型;若估算日期有偏差,将难以准备分娩。
科学家将AI生成的代码应用于DREAM挑战数据。8款AI工具中仅4款产出的预测模型性能与DREAM团队相当,但有时AI表现更优。整个生成式AI项目——从构思到论文提交——仅耗时六个月。
科学家仍需警惕误导性结果(这一顽疾持续存在),并在AI失效时介入干预。该技术无法替代人类专业知识,但其能力能让科学家快速解析海量数据——从而腾出精力进行更深入思考。
“多亏生成式AI,数据科学背景有限的研究人员不再总是需要组建广泛合作或花费数小时调试代码,”塔尔卡表示,“他们可以专注于解答正确的生物医学问题。”
作者:加州大学旧金山分校作者包括鲁本·萨瓦尔(Reuben Sarwal)、克莱尔·杜宾(Claire Dubin)、桑奇塔·巴塔查里亚(Sanchita Bhattacharya)理学硕士以及阿图尔·巴特(Atul Butte)医学博士、哲学博士;其他作者包括密歇根州安娜堡休伦高中的维克多·塔尔卡(Victor Tarca)、纽约大学的尼古拉斯·卡拉夫罗斯(Nikolas Kalavros)和古斯塔沃·斯托洛维茨基(Gustavo Stolovitzky)哲学博士、韦恩州立大学的高拉夫·巴蒂(Gaurav Bhatti)、以及美国国立儿童健康与人类发育研究所(NICHD)的罗伯托·罗梅罗(Roberto Romero)医学博士、医学博士科学博士。
资助:本工作由加州大学旧金山分校美国早产儿协会早产研究中心和ImmPort资助。研究使用数据部分获得NICHD妊娠研究分部支持。
相关研究:
《iScience》期刊关于血液检测方法的论文
《Cell Reports Medicine》期刊关于胎盘组织检测方法的论文
主题分类
- 儿科与儿童健康
- 定量生物科学
- 生殖健康
- 技术与人工智能
- 妇女健康
【全文结束】

