一项开创性的算法揭示了你食物中隐藏了多少糖分——并展示了哪些国家和产品符合健康的碳水化合物标准。
研究:预测全球包装食品数据库中的碳水化合物质量。图片来源:New Africa / Shutterstock
碳水化合物约占全球人均日常能量摄入量的70%;然而,碳水化合物的质量往往被其数量所掩盖。在最近发表于《营养前沿》期刊上的一项研究中,一个欧洲研究团队开发了一种算法,用于预测包装食品中的游离糖含量,从而在全球范围内提供了有关碳水化合物质量的见解。
饮食中的碳水化合物
碳水化合物是重要的能量来源,在全球营养中起着关键作用。虽然饮食讨论通常集中在碳水化合物的数量上,但碳水化合物的质量对于保持良好的健康同样重要。科学证据表明,碳水化合物的质量影响代谢功能和慢性疾病的风险。
评估碳水化合物质量的一个工具是碳水化合物质量比(CQR),它评估食品中的总碳水化合物、膳食纤维和游离糖之间的平衡。该比率规定每10克总碳水化合物至少应含有1克膳食纤维,且每1克纤维不应超过2克游离糖。这一比率有助于区分营养有益的食物和可能对健康产生不良影响的食物。
然而,准确确定包装食品中的游离糖含量仍然是一个挑战。很少有国家要求明确标注添加糖,这限制了消费者和研究人员的透明度。世界卫生组织(WHO)定义的游离糖包括添加糖以及蜂蜜、糖浆和果汁中的天然糖,而美国食品药品监督管理局(FDA)将添加糖定义为仅在加工过程中添加的糖。这种信息的缺乏阻碍了有效评估碳水化合物质量的努力,使人们难以做出明智的饮食选择并研究碳水化合物消费对健康的影响。
关于研究
该算法优先考虑标签上列出的第一项成分,因为食品制造商通常按重量顺序排列成分,这为产品组成中的糖分主导性提供了线索。
在本研究中,研究人员开发了一种算法,用于预测全球包装食品中的游离糖含量,解决了碳水化合物质量的关键知识空白。他们使用了Mintel全球新产品数据库(GNPD),该数据库包含来自86个国家的大量包装食品信息,包括营养成分和成分列表。
在分析之前,研究团队仔细清理和标准化了数据以确保一致性。一个关键步骤是手动整理和标记成分,使用正则表达式将其分类为添加糖或天然存在的糖——这对于准确估计游离糖含量至关重要。
为了构建预测模型,研究人员采用了机器学习技术。他们使用来自美国的数据训练模型,并在14个选定国家正式测试其性能,同时将模型应用于另外81个国家的产品。模型分析了产品标签,考虑了前六种被归类为添加糖、水果或乳制品的成分,以及详细的营养信息,如能量含量、脂肪、碳水化合物、纤维、蛋白质、糖和钠。
该流程包括三个二元分类器来检测添加糖的存在,并使用堆叠树回归模型来估计其数量。此外,预测的添加糖值被用作游离糖的估计值,但对于某些特定食品类别(如果汁饮料和糖果),直接使用总糖含量,因为它们具有独特的糖分特征。
最后,这些模型被应用于没有明确添加糖声明的产品,以预测其碳水化合物组成。碳水化合物质量通过预定义的10:1到1:2的碳水化合物、纤维和游离糖比率进行评估。
主要发现
植物基牛奶替代品(例如燕麦或杏仁饮料)在全球范围内表现出令人惊讶的高碳水化合物质量标准合规性,优于许多基于乳制品的产品。
研究发现,机器学习模型在预测包装食品中的游离糖含量方面表现出高度准确性。测试集的平均绝对误差计算为0.96 g/100g,表明预测值与声明值之间的平均差异相对较小。
此外,该模型在预测值和声明值之间实现了0.98的高R²值,并且优于之前的模型(如k-近邻模型),后者显示出更高的误差率,证实了预测的可靠性。值得注意的是,该模型的预测能力不仅限于美国。研究人员发现,该模型在14个国家正式测试时表现准确,并在另外81个国家应用,突显了其全球适用性。
该研究还检查了符合目标碳水化合物质量比率的食品产品的比例,揭示了不同食品类别和国家之间的显著差异。在美国,符合碳水化合物质量比率的产品从热谷物的相对较高的60%到调味牛奶和麦芽饮料的0%不等。这一广泛的范围凸显了即使在一个国家内,碳水化合物质量也存在多样性。
巧克力味产品(如谷物或零食棒)是最严重的违规者之一,由于过高的游离糖和低纤维含量,95%未能达到目标比率。
当考虑所有食品类别时,符合目标比率的产品百分比从英国的67%(代表相对较高的质量标准遵守率)到马来西亚的9.8%(表示符合所需碳水化合物质量的产品比例显著较低)不等。
值得注意的是,植物基饮料——与大多数饮料类别不同——在各国中表现出相对较高的碳水化合物质量比率,这是由于其较高的纤维含量和较低的添加糖水平。
然而,研究人员承认,某些国家的预测准确性可能受到小样本量的限制,这可能会影响这些特定地区的发现的普适性。
此外,作者对美国18个食品类别中的预测和声明游离糖值进行了z检验,发现没有统计学上的显著差异,进一步证实了模型的稳健性。
结论
总之,该研究成功开发并验证了一种基于机器学习的方法,利用大规模全球数据库预测包装食品中的游离糖含量。这种完全自动化且可扩展的方法在多个国家和食品类别中表现出强大的准确性,并可以扩展到其他数据库和其他需要游离糖估计的营养指标。
预测的游离糖值还可以增强目前依赖总糖含量的营养评分系统,如Nutri-Score,由于标签要求有限,这些系统目前只能使用总糖含量。
这种创新的方法为监测和评估全球食品供应中的碳水化合物质量提供了一个有价值的强大工具,为公共卫生倡议和饮食指导提供了关键见解。
(全文结束)

