纽约大学的研究人员开发了一种新的AI工具,可以通过分析食物照片来计算营养成分,从而简化了跟踪饮食的过程。这项技术在第六届IEEE移动计算和可持续信息国际会议上进行了详细介绍,使用深度学习算法识别图像中的食物项目,估计份量大小,并计算营养值,包括卡路里、蛋白质、脂肪和碳水化合物。该技术设计为一个移动友好的网络工具,消除了猜测工作,可以帮助数百万人管理体重、糖尿病和其他与饮食相关的健康问题。
克服食物识别的挑战
尽管实际操作简单,但自动食物跟踪长期以来一直是一个挑战,因为餐食的外观差异极大。同一道菜可以以无数种方式摆盘、准备和呈现,这使得AI难以识别。Sunil Kumar是该论文的合著者,也是纽约大学阿布扎比分校机械工程教授和纽约大学坦登分校全球网络教授,他解释说:“食物的视觉多样性令人震惊。与具有标准化外观的制造物品不同,同一道菜在不同人的制作下看起来可能会大不相同。一家餐厅的汉堡与另一家餐厅的汉堡几乎没有相似之处,而自制版本又增加了另一层复杂性。”
为了克服这一问题,纽约大学团队开发了一种先进的识别模型,将类似的食物项目分类,并优化训练数据以提高准确性。该系统接受了95,000张图片的训练,涵盖了214种食物类别,确保能够在广泛的菜肴中可靠地进行识别。
另一个主要挑战是准确估计份量大小,这对于精确计算卡路里至关重要。纽约大学的系统结合了体积分析,利用图像处理技术测量盘子上食物的实际面积,并将其与营养数据相关联。这一创新使系统能够准确计算卡路里,而无需用户手动输入份量细节。
任何设备上的实时分析
与早期需要云处理的模型不同,纽约大学团队优先考虑效率,使AI工具轻便且快速。通过集成YOLOv8图像识别技术和ONNX Runtime,他们开发了一个可以直接通过网页浏览器运行的系统,无需应用程序。用户只需在其智能手机上访问网站,拍摄他们的餐食照片,即可立即获得营养成分分析。
在实际测试中,该系统提供了高度准确的结果。例如,一片披萨被计算为317卡路里、10克蛋白质、40克碳水化合物和13克脂肪。当应用于印度南部的一道菜Idli Sambhar时,它估计为221卡路里、7克蛋白质和46克碳水化合物,这些数值与参考标准非常接近。
Prabodh Panindre是该论文的主要作者,也是纽约大学坦登分校的助理研究教授,他说:“我们的目标之一是确保该系统适用于各种菜肴和食物呈现方式。我们希望它在热狗(根据我们的系统为280卡路里)和中东糕点Baklava(根据我们的系统为310卡路里和18克脂肪)等食物上都能同样准确。”
在健康和营养方面的未来潜力
该系统实现了0.7941的平均精度得分,即使食物重叠或部分遮挡,也能以约80%的准确率正确识别和分析食物项目。
虽然目前只是一个概念验证,但这种基于AI的工具可能对医疗保健、健身和食品服务行业产生重大影响。通过与健康追踪应用程序集成,它可以为用户提供一种几乎无需努力就能监测饮食摄入的方式。
Panindre补充说:“传统的食物摄入追踪方法严重依赖自我报告,这是非常不可靠的。我们的系统消除了人为错误。”
通过任何智能手机都可以访问的基于网页的应用程序意味着,只需点击一下按钮,基于AI的营养追踪很快就可以提供给消费者。
(全文结束)

