AI驱动的聊天机器人,包括ChatGPT 4.0、Gemini和Microsoft Copilot,在创建减肥餐计划方面的能力得到了评估。尽管所有聊天机器人都展现出一定的潜力,但在实现宏量营养素平衡和卡路里精确度方面的挑战突显了当前算法的局限性。
一项研究由土耳其的阿马西亚大学和匈牙利的佩奇大学共同进行,比较了不同AI驱动聊天机器人在设计个性化饮食方案方面的效率。该研究发表在《Nutrients》期刊上。
背景
AI驱动的应用程序在全球范围内医疗、营养和教育领域的受欢迎程度显著增加。在营养学和饮食学中,AI驱动的聊天机器人因其能设计个性化饮食方案而受到欢迎。AI聊天机器人是先进的系统,利用自然语言处理和机器学习等人工智能技术模拟人类交互,提供动态和个性化的沟通平台,生成特定情境下的回应。
考虑到其便捷性和提供个性化支持的潜力,人们越来越依赖AI聊天机器人来获得饮食指导。然而,AI聊天机器人生成的个性化饮食方案在现实世界中实施而不借助人工帮助的发展和应用引发了担忧,需要深入评估这些饮食方案的质量。
本研究中,科学家们评估了不同AI聊天机器人在设计不同卡路里水平和性别减肥饮食方案方面的能力。
研究设计
该研究分析并比较了三个AI聊天机器人(Gemini、Microsoft Copilot和ChatGPT 4.0)设计的减肥餐计划的饮食质量。每个聊天机器人为男性和女性定制独特的饮食方案,卡路里范围为每天1400至1800千卡。
研究使用国际饮食质量指数(DQI-I)系统分析AI聊天机器人生成的饮食方案的各种维度,包括多样性、充足性、适度性和平衡性。DQI-I是广泛使用的营养质量评估工具,用于确定饮食是否符合既定指南并支持整体健康。研究结果显示,所有聊天机器人的总DQI-I得分都很高,其中ChatGPT 4.0得分为71.20 ± 5.2,Microsoft Copilot得分为72.30 ± 4.1,Gemini得分为71.90 ± 4.1。统计分析显示三者之间DQI-I得分没有显著差异(p > 0.05)。
卡路里准确性通过计算与请求目标的百分比偏差并分类到定义的范围内确定。
重要观察结果
研究表明,所有测试的AI聊天机器人都获得了较高的总DQI-I得分,表明其生成的餐计划整体饮食质量令人满意。在不同的饮食质量维度中,Gemini和Microsoft Copilot设计的餐计划在食物种类多样性方面得分最高;对于蛋白质来源多样性,Microsoft Copilot和ChatGPT 4.0设计的餐计划得分最高。值得注意的是,女性餐计划的食物种类多样性和蛋白质来源多样性得分高于男性(p < 0.05)。
关于餐计划的平衡性,即宏量营养素和脂肪酸比例,所有测试的AI聊天机器人一致表现出最低得分,这指出了AI算法的关键局限性。研究人员将这一局限归因于在减肥饮食中分配有限卡路里到宏量营养素(碳水化合物、蛋白质和脂肪)之间的复杂性。
在满足请求卡路里目标的精确度方面,ChatGPT 4.0表现出最高的精度。ChatGPT 4.0设计的餐计划偏离请求卡路里水平不超过20%。相比之下,Gemini生成的50%餐计划偏离请求卡路里目标超过20%,显示出其在卡路里依从性方面的显著局限。
研究意义
研究表明,AI驱动的聊天机器人在设计营养充足且多样的减肥餐计划方面非常有效。在三项AI聊天机器人中,ChatGPT 4.0在卡路里依从性方面表现出最高的精度。
研究还发现,AI算法在设计减肥餐计划中的宏量营养素和脂肪酸分布方面存在关键局限,这可能是由于编程算法难以解决宏量营养素之间的复杂相互作用及个体的独特饮食需求。
本研究中,AI聊天机器人用于设计低卡路里餐计划。这些计划要求在所有宏量营养素(碳水化合物、蛋白质和脂肪)之间仔细分配有限能量,同时保持整体营养充足,这可能是未能实现最佳宏量营养素分布的原因。
基于性别的分析显示,为男性和女性设计的餐计划在食物种类多样性和蛋白质来源多样性得分方面存在差异,这可能反映了训练数据中的潜在偏见或嵌入聊天机器人算法中的文化假设。
脂肪酸(多不饱和、单不饱和和饱和脂肪酸)的最优分布对维持能量平衡、细胞膜完整性和心血管健康至关重要。高饱和脂肪、反式脂肪、精制碳水化合物和低蛋白质及多不饱和脂肪酸的饮食已知会导致严重的健康问题。
鉴于宏量营养素和脂肪酸分布对饮食规划的重要作用,科学家建议营养师在使用AI聊天机器人生成的饮食方案前进行专业评估,以避免与饮食相关的健康问题。换句话说,AI聊天机器人应被用作增强而非替代营养专业人士的工具。
(全文结束)

