肠道细菌是许多健康相关问题的关键因素。然而,它们的数量和种类繁多,与人体化学和其他细菌的相互作用方式也极其复杂。东京大学(University of Tokyo)的研究人员首次利用一种名为贝叶斯神经网络的特殊人工智能,分析了一个肠道细菌数据集,以寻找现有分析工具无法可靠识别的关系。
人体大约由30万亿到40万亿个细胞组成,但你的肠道中却含有约100万亿个肠道细菌。从技术上讲,你身上携带的非自身细胞比自身细胞还要多,这真是个值得思考的问题。说到食物,这些肠道细菌当然负责某些消化方面的工作,令人惊讶的是,它们还与人类健康的许多其他方面有关。这些细菌种类繁多,并且能够产生和改变大量不同的化学物质,称为代谢物。这些代谢物像分子信使一样,在你的身体中渗透,影响从免疫系统、新陈代谢到大脑功能和情绪的一切。不用说,了解肠道细菌有着巨大的潜在价值。
“问题在于,我们才刚刚开始了解哪些细菌会产生哪些人体代谢物,以及这些关系在不同疾病中如何变化,”生物科学系Tsunoda实验室的项目研究员唐东(Tung Dang)表示。“通过准确绘制这些细菌与化学物质之间的关系图,我们有可能开发出个性化治疗方案。想象一下,能够培养特定细菌以产生有益的人体代谢物,或者设计针对这些代谢物的靶向疗法来治疗疾病。”
这听起来不错,那么问题是什么呢?正如前面提到的,细菌和代谢物的数量和种类众多,因此它们之间的关系也更加复杂。仅收集这些数据便是一项艰巨的任务,而从中找出可能揭示某些有用功能的有趣模式则更具挑战性。为此,唐东及其团队决定探索使用最先进的AI工具。
“我们的系统VBayesMM能够自动区分显著影响代谢物的关键参与者与海量不相关微生物的背景信息,同时还能承认预测关系中的不确定性,而不是提供过于自信但可能错误的答案,”唐东解释道。“在对睡眠障碍、肥胖症和癌症研究的真实数据进行测试时,我们的方法始终优于现有方法,并识别出与已知生物过程相符的特定细菌家族,从而增强了其发现真实生物学关系而非无意义统计模式的信心。”
由于VBayesMM可以处理并传达不确定性问题,因此相较于无法做到这一点的工具,它让研究人员更有信心。尽管该系统经过优化以应对繁重的分析工作负载,但挖掘如此庞大的数据集仍然需要高昂的计算成本;然而,随着时间推移,这对希望使用它的人来说将变得越来越不成问题。目前的其他限制包括系统需要更多关于肠道细菌的数据,而不是它们产生的代谢物;当细菌数据不足时,准确性会下降。此外,VBayesMM假设微生物独立运作,但实际上,肠道细菌之间的相互作用方式极其复杂。
“我们计划与涵盖更全面化学数据集合作,这些数据集能够捕捉细菌产品的完整范围,但这带来了新挑战,即如何确定这些化学物质是来自细菌、人体还是外部来源,如饮食,”唐东补充道。“我们还旨在使VBayesMM在分析多样化患者群体时更加稳健,结合细菌‘家谱’关系以做出更好的预测,并进一步减少分析所需的计算时间。对于临床应用而言,最终目标是识别可用于治疗或饮食干预的特定细菌靶点,从而帮助患者,将基础研究推向实际医疗应用。”
(全文结束)

