医学互联网研究杂志-使用自然口语与自我报告的食物摄入到食物成分数据的自动映射，用于低负担实时饮食评估:方法比较研究

原始论文

¹美国农业部人类营养衰老研究中心，塔夫茨大学，波士顿，马萨诸塞州，美国

²美国麻省理工学院计算机科学与人工智能实验室

^3.美国塔夫茨大学弗里德曼营养科学与政策学院，马萨诸塞州波士顿

这些作者的贡献相同

通讯作者:

苏珊·罗伯茨博士

Jean Mayer，美国农业部人类营养衰老研究中心

塔夫斯大学

华盛顿街711号

波士顿，马萨诸塞州，02111

美国

电话:1 617 556 3238

电子邮件:susan.roberts@tufts.edu

背景:自我监测食物摄入量是国家健康建议的基石，但现有的用于此目的的应用程序对用户和研究人员来说是负担，这限制了使用。

摘要目的:我们开发并试点测试了一款新的应用程序(COCO Nutritionist)，该应用程序将语音理解技术与将食物映射到国家数据库中适当的食物成分代码的技术相结合，为自我报告的饮食摄入量提供更低负担和自动化的营养分析。

方法:将COCO与多次通过的、由访谈者管理的24小时回忆法进行比较，以评估能量摄入。COCO连续使用5天，其中2天进行24小时饮食召回。参与者为35名女性和男性，平均年龄28岁(范围20-58岁)，平均BMI为24(范围17-48)kg/m²．

结果:在使用两种方法的天数中，COCO和24小时回忆法获得的能量摄入值之间没有显著差异(平均2092,SD 1044 kcal与平均2030,SD 687 kcal，P= 2)。蛋白质、碳水化合物和脂肪的能量百分比也没有显著差异。P= 0.27 - 0.89)，在整个5天的研究期间，COCO获得的能量摄入没有变化趋势(P= .19)。

结论:这是使用自然口语将所报告的食物映射到食物成分代码的饮食评估方法的首次演示，展示了一种有希望的自动评估饮食摄入量的新方法。

[J] .中国医学信息学报，2011;23(12):563 - 568

doi: 10.2196/26988

关键字

能量摄入；大量营养素摄入量； 24小时的回忆；机器学习；卷积神经网络；营养；饮食；应用程序；自然语言处理

国家建议鼓励自我监测能量摄入，以支持健康的体重管理[1-3.]。基于手机的应用程序很普遍，包括食物成像和份量指南等功能[4-6]。然而，与以前的方法相比，没有一个可用的应用程序看起来更准确或减少用户负担[7]，高用户负担加上有限的准确性是常规使用的主要障碍。此外，较高的使用者负担与日常饮食习惯的改变有关，导致测量期间的能量和营养摄入不典型[8]。

使用语音理解技术来评估食物摄入量尚处于起步阶段，但在减少饮食评估负担和提高方法准确性方面具有巨大的潜力，特别是当与将报告的食物映射到适当的食物成分代码以进行自动营养分析时。我们开发了一款叫做COCO(对话式卡路里计数器)的应用9]，它将自然口语与机器学习相结合，以增强对自我报告饮食摄入量的捕获，并将其映射到广泛使用的食品数据库中的食品代码。本研究的主要目标是进行可行性研究，评估COCO测量能量摄入的方法与推荐方法的比较[10]。

概述

本文描述了COCO对自动自我报告膳食摄入量的首次评估。该评估由马萨诸塞州波士顿塔夫茨大学Jean Mayer美国农业部人类营养衰老研究中心的营养研究人员进行，数据收集和分析由与COCO发展无关的个人执行。

可可营养师

COCO主要由研究小组的两名成员(JG和MK)与营养研究人员(SBR, SKD和CG)合作开发。中提供了该应用程序开发的详细描述多媒体附录1．简而言之，COCO使用机器学习，特别是深度卷积神经网络(CNN) [9]，以完成两项任务:(1)将用户对饮食事件的自然语言描述中的每个单词标记为特定的食品/饮料，其数量和品牌名称和/或描述[11];(2)将每种食品映射到几个国家食品数据库中的一个匹配实体[12]。使用的数据库是美国农业部标准参考和品牌食品[13]，明尼苏达大学数据库[14]，从餐馆网站上抓取的食物，以及Nutritionix数据库[15]。前端iOS应用[16调用后端Python Flask [17运行训练过的CNN模型的服务器。

食品数据库测量单位(如杯)和数量单位(如1、2)使用字符串匹配进行排序。例如，如果用户输入“cup”，它会将“cup”列为最匹配项。如果没有精确匹配，则默认为用户之前最常登录的食品单位;如果用户以前从未吃过这种食物，那么它默认为所有用户记录的最受欢迎的单位。每个用户的饮食日志都存储在PostgreSQL数据库中。18] Amazon Web Services上的数据库[19]。因此，用户的后续日志是定制的，这样配对的食物代码和用户描述的他们之前吃过的食物的数量排名更高或在顶部。输入是口头或书面的食物描述(例如，“晚餐，我吃了一碗切达奶酪辣椒”)。输出是每个标签食品的前15个匹配数据库食品的列表(根据表示用户所吃食物描述的向量与表示每个食品数据库条目的向量之间的点积相似度评分进行排名)，以及它们的排名数量(根据关键字匹配排名)，预测数量(例如，1，如果用户记录“一杯”)，以及从所选营养数据库中计算出的每种食品的相应营养成分。如果在不同的数据库中有重复的食物，当前的系统将同时返回，并根据数据库中的措辞与用户语言的匹配进行排名。

通过不做任何改变，参与者隐含地确认了COCO建议的排名第一的食品代码和食物量，或者如果排名第一的食品代码不正确匹配，他们会从数据库中选择更合适的食品代码，通过滚动15个选项的列表。如果提供的选项都不匹配，参与者可以删除食物并重复。食物量也采用了类似的方法。

参与者的评估和知情同意

参与者和知情同意

新COCO应用程序评估的研究方案由塔夫茨健康科学机构审查委员会审查和批准，并在入组前获得每位参与者的知情同意。总共有35名参与者通过传单、口口相传和电子邮件的方式被招募到一个邮件列表中，这些邮件列表中的个人要求联系营养研究学习机会或表达对该应用程序的兴趣。要符合条件，参与者必须年满18岁，身体健康。如果个人没有iOS 10.2或更高版本的iPhone，不愿意连续5天记录他们的食物摄入量并完成两次饮食召回，或者拥有营养学研究生学位，则不符合资格。入学时间为2018年6月至2019年6月。

评估协议

我们为COCO原型制定了一套评估方案，该方案与开发新的食物摄入评估工具的建议一致[20.]。参与者参加了为期5天的研究，并远程完成了所有组件。他们获得了一份研究的书面概述，包括如何下载和使用COCO应用程序的说明，以及一段提供使用技巧的短视频。参与者被要求连续5天使用COCO记录所有消耗的食物和饮料的数量和类型。摄入的记录可以使用自然的口语话语或手动文本输入完成。如果错过了一天的记录，他们被要求再记录一天，以完成总共5天的记录。营养小组(ST)的一名成员要求参与者在第三天及以后安排两次24小时食品召回电话(每天一次)。如果错过了前一天的食物记录，则重新安排饮食召回。每一次24小时的饮食召回大约需要一个小时来完成。在完成两项饮食回顾后，参与者被指示在研究的剩余时间内完成食物记录。

饮食回顾采用了推荐的多次访谈法[10]，然后让参与者不间断地列出前一天吃过的所有食物和饮料。此外，采访者浏览了一份被遗忘的食物清单，询问被记录为经常被遗忘的食物类别，然后是最后的调查，列出了所有被消耗的食物，确认食物的细节和份量。标准食物量小册子[21]被用来帮助估计食物的份量。它有八个部分:(1)被遗忘的食物清单，(2)玻璃杯和马克杯，(3)碗，(4)土墩，(5)圆圈，(6)网格和厚度块，(7)楔子，(8)形状和鸡块。使用Food Processor (version 10.13.1;ESHA研究公司)。

参与者还完成了人口统计问题，包括年龄、性别、种族、民族、教育程度、体重和身高。在研究结束时，研究人员向参与者发送了一份关于使用该应用程序的研究满意度调查，并将一张价值20美元的礼品卡邮寄到他们的家庭住址。

分析

麻省理工学院的开发团队在没有访问24小时饮食回忆数据的情况下，获取了COCO在研究日期间的能量和常量营养素摄入量数据、通过文本和语音数据捕获收集的信息量，以及COCO提出并经参与者修改的食物代码的百分比，并将其提供给塔夫茨大学的团队，用于对两种方法进行统计比较。

采用两种方法时两天的数据取每种方法的平均值。报告的平均能量摄入量和来自蛋白质、脂肪、碳水化合物和酒精的能量百分比使用成对样本在两种方法之间进行了比较t检验和Pearson相关性此外，对于5天内获得的COCO数据，利用Bonferroni校正的多重两两均值比较，评估了能量消耗的时间分布效应与召回顺序和星期几的关系。对于召回次数的比较，我们还使用了多重均值比较，以及简单的线性回归，无论是否调整工作日与周末的影响，来检查执行的召回次数的平均能源消耗的时间序列趋势。

所有试验均为生物学上合理的观察结果，先验定义为2天平均能量消耗<5000千卡(1名参与者因不可信而被排除在外)。使用STATA (release 15;StataCorp LLC)。显著性水平设为α≤0.05。

参与者为25名女性和9名男性，平均年龄28岁(范围20-58岁)，平均BMI为24(范围17-48)kg/m²(表S1多媒体附录1)。当比较COCO的2天平均值和24小时回忆时，我们发现能量摄入没有显著差异(平均2092,SD 1044与平均2030,SD 687 kcal/d;P= 0.70)或蛋白质能量的百分比(平均16,SD 3 vs平均17,SD 5;P=.54)，脂肪(平均35,SD 9，平均36,SD 11;P= 0.27)或碳水化合物(平均50,SD 11 vs平均50,SD 9;P=.89)，与24小时回忆法比较(表1)。

表1。通过COCO营养师和24小时召回报告的能量和常量营养素摄入量和饮食事件数量(每种方法相同两天的平均值)。^一个

变量	24小时回忆率(N=34)，均值(SD)	COCO营养师(N=34)，平均(SD)	P价值
能量摄入，千卡/天	2030 (687)	2092 (1044)	2
来自蛋白质的能量百分比	17日(5)	16日(3)	54
来自脂肪的能量百分比	36 (11)	35 (9)	低位
来自碳水化合物的能量百分比	50 (9)	50 (11)	.89
正餐和零食的数量	4 (1)	4 (1)	.37点

^一个配对t试验用于比较不同方法的能量和常量营养素摄入量。

两种方法的平均值非常相似，报告的饮食事件(正餐和零食)的数量也非常相似。平均而言，24小时召回中有4个项目未在COCO中报告(复合食品项目和饮料的成分)，2个项目在COCO中未在24小时召回中报告(零食，糖果和饮料)，部分反映了复合食品(例如，由肉，面包和其他项目组成的汉堡包)被两种方法加工的不同方式。2天COCO平均值与24小时蛋白质能量百分比回忆之间也存在显著的Pearson相关性(ρ=0.66;P< 0.001)，碳水化合物(ρ=0.58;P< 0.01)，脂肪(ρ=0.38;P= 03)R²值为0.119-0.438(图S1 in多媒体附录1)。

如图所示图1， COCO报告的总能源并无明显趋势(P=.69)，在控制周末与工作日的影响(P= =收)。我们还评估了参与者如何输入数据，以及将食物映射到适当的食物代码的准确性。大多数食物都是通过打字而不是说话来记录的。表2)。口头和书面描述中提到品牌或制备技术的比例相似，比例相对较低，约为15%。口头用餐描述更有可能提到食物的单位(36.1%对24.4%)。此外，由于COCO的编辑功能允许参与者修改食品类型、品牌或描述和单位数量(即1杯、2杯或3杯)，因此还跟踪了参与者修改COCO建议选项的频率(食品名称/描述/品牌的时间为8.1%，单位数量的时间为27.9%)。

图1所示。通过COCO营养师报告连续5天的能量摄入(n=34)。报告的能量摄取量没有明显趋势(P= .19)。

表2。在COCO营养学家中使用口语和书面自然语言记录的食品实体的比较。^一个

变量	口语	写
每人每天记录的平均食物数量	1.38	7.06
所有被记录的食物的总数，%	28.4	71.6
指定品牌/制作方法的食物的平均百分比	15.6	15.0
有数量的食物，%	30.7	22.1
在默认选项%中正确识别食品代码	One hundred.	99.9
在默认选项%中正确识别食物测量单位(如杯)	83.5	84.1
在默认选项%中正确识别的食物量单位(如1、2)	74.5	84.7

^一个第一次尝试正确测量的食品代码、单位和数量被定义为用户不更改默认值。

主要研究结果

这项研究表明，一款使用自然口语来捕捉参与者自我报告的应用程序，可以将已识别的食物与国家数据库中食物成分信息的自动映射相结合，从而产生自我报告的平均能量和大量营养素摄入量的估计值，以及吃的正餐和零食的数量，这些估计值与使用黄金标准的多次通过、采访者管理的24小时回忆法获得的结果没有显著差异。此外，在5天的研究期间，新的COCO应用程序报告的能量摄入没有任何负面趋势，这是一个积极的迹象，表明参与者能够在没有不必要负担的情况下完成他们的报告。据我们所知，这是第一份使用自然口语来收集饮食数据的报告，该过程允许将收集到的信息映射到食品代码中，以支持自动营养分析。虽然这些数据是初步的，但他们表明，这种新方法可能会促进准确、低成本和低负担的饮食跟踪方法，以实现健康和体重管理。

与前期工作比较

这项工作的一个关键方面是证明用自然口语收集的数据可以自动映射到国家食品数据库中合适的食品代码，这是以前没有做过的事情，允许自动和即时计算膳食摄入量。COCO的这一新颖功能将降低膳食评估的成本和用户负担，并将其与以前使用自然口语的工作区分开来，即由营养师为每种消耗的食物分配食物代码[22]。我们所展示的将收集到的信息默认映射为食品编码和份量大小的修改比例相对较低，这表明将语音识别和书写相结合的系统允许参与者使用的灵活性，这反过来可能提高接受度和可持续使用。

限制

这项研究的局限性包括，与包括食物摄影在内的完全开发的应用程序相比，COCO应用程序中的功能相对较少。此外，比较者方法是通过24小时回忆自我报告饮食摄入量，这被认为是饮食报告的黄金标准，但可能无法反映绝对的饮食摄入量。在第一项研究中，人口样本相对较小，并且由于不可信的报告，一名参与者被排除在数据分析之外。需要进一步完善COCO，并将收集到的数据与已知来源的膳食摄入量进行比较。

关于COCO的未来改进，重点是使系统尽可能地有用和低负担，下一步将是实现一个更复杂的聊天机器人，可以提供个性化的食物推荐[23]。例如，如果用户问“一杯牛奶有多少卡路里?”或者“我今天吃了多少克脂肪?”，并根据用户缺少的营养素和他们的饮食偏好推荐食物。如果用户的铁含量较低，系统可以根据之前的食物选择，推荐菠菜或牛排(这两种食物的铁含量都很高)。此外，对一些用户来说，拍摄食物的照片比口头记录更简单，可以为自然语言提供补充信息。多任务学习研究表明，在多个输入源和预测任务上训练的神经网络(例如，一边可能接受输入图像，而另一边可能接受输入句子)在两种模式上都比单独使用每一种模式有更好的性能[24]。减肥应用已经使用了计算机视觉;然而，据我们所知，还没有人将语言理解与计算机视觉结合起来。

总结

自我监测食物摄入是体重管理生活方式干预的基础建议。然而，目前的应用程序对食物摄入进行自我监控是一项繁重的工作，而且往往不准确。这是第一次使用自然口语将食物摄入报告映射到国家食品数据库中的食物成分代码并生成膳食摄入量自动评估的演示，展示了一种有希望的新方法，可以在支持报告数据准确性的同时，大大减少用户和研究者在评估饮食摄入方面的负担。

致谢

我们感谢与会者的参与，以及所有为COCO系统开发做出贡献的麻省理工学院学生，包括James Allen、Elizabeth Zhou、Zachary Collins、Rupayan Neogy、Elizabeth Weeks、Liana Reilly、Jiahao Li、Matt McEachern和Yada Pruksachatkun。

利益冲突

MK宣布已获得口头饮食跟踪算法商业化的专利。所有其他作者声明无利益冲突。

‎

多媒体附录1

补充表、图和方法。

DOCX文件，3177 KB

谁能成功地保持减肥效果?与减肥维持和体重恢复相关因素的概念性回顾。肥胖症评论2005 Feb;6(1):67-85。［CrossRef］
Carter MC, Burley VJ, Cade JE。使用手机应用程序“我的餐伴”进行不同模式的自我监测与减肥相关。JMIR mHealth uHealth 2017年3月02日;5(2):e8 [j]免费全文] [CrossRef] [Medline］
Ross KM, Wing RR。更新的自我监测技术和简短的电话干预对减肥的影响:一项随机试点研究。肥胖症杂志(Silver Spring) 2016年8月1日;24(8):1653-1659 [j]免费全文] [CrossRef] [Medline］
Ngo J, Engelen A, Molag M, Roesle J, García-Segovia P, Serra-Majem L.信息和通信技术在饮食评估中的应用综述。中国生物医学工程学报，2009;31(2):582 - 582。［CrossRef] [Medline］
Griffiths C, Harnack L, Pereira MA。评估五种流行的营养跟踪应用程序的营养计算的准确性。中华卫生杂志2018;21(8):1495-1502。［CrossRef] [Medline］
Winzer E, Luger M, Schindler K.在临床环境中使用数码摄影:一种有效、准确和适用的方法来评估食物摄入。中华临床医学杂志，2018;21(6):879-887。［CrossRef] [Medline］
Rollo ME, Williams RL, Burrows T, Kirkpatrick SI, Bucher T, Collins CE。他们到底在吃什么?膳食摄入评估与验证新方法综述当代营养学杂志2016年10月15日;5(4):307-314。［CrossRef］
李建军，李建军，李建军，等。解决当前关于自我报告饮食数据价值的批评。中国生物医学工程学报，2015;33 (2):349 - 349 [J]免费全文] [CrossRef] [Medline］
李建军，李建军。基于深度学习的数据库映射与对话系统提问。IEEE/ACM跨音频语音语言处理2019;27(8):1321-1334。［CrossRef］
Lytle LA, Nicastro HL, Roberts SB, Evans M, Jakicic JM, Laposky AD，等。积累数据以最佳地预测肥胖治疗(采用)核心措施:行为领域。肥胖(Silver Spring) 2018年4月25日;26日增刊2:S16-S24 [免费全文] [CrossRef] [Medline］
王志强，王志强。一种营养对话系统的口语理解方法。IEEE/ACM Trans Audio Speech Lang Process 2017;25(7):1450-1461。［CrossRef］
张建军，张建军。基于卷积神经网络的自然语言输入到数据库的语义映射。2017年发表于:IEEE声学、语音和信号处理国际会议(ICASSP);2017年3月5日;新奥尔良p. 2017。［CrossRef］
FoodData中央。美国农业部。URL:https://fdc.nal.usda.gov/[2021-11-01]访问
数据库授权。明尼苏达大学。URL:http://www.ncc.umn.edu/food-and-nutrient-database/[2021-11-01]访问
Nutritionix数据库。Nutritionix。URL:https://www.nutritionix.com/database[2021-11-01]访问
张建军，张建军，张建军，等。一种基于自然语言的食物记录系统[j] .中文信息学报(自然科学版)(英文版)。营养最新进展2019;3(增刊1):nzz036。p13 - 035 - 19所示。［CrossRef］
Flask web开发，一次一滴。托盘。URL:https://flask.palletsprojects.com/en/1.1.x/[2021-11-01]访问
PostgreSQL:世界上最先进的开源关系数据库。PostgreSQL全球开发组。URL:https://www.postgresql.org/[2021-11-01]访问
亚马逊网络服务。URL:https://aws.amazon.com/[2021-11-01]访问
李建军，李建军，李建军，等。基于新技术的膳食摄入评估工具的评估- ILSI欧洲膳食摄入和暴露工作组评估。《营养通报》2018年12月28日;11(1):55。［CrossRef］
rapaper N, Perloff B, Ingwersen L, Steinfeldt L, Anand J.美国农业部膳食摄入量数据系统综述。食品成分与分析2004年6月;17(3-4):545-555。［CrossRef］
Rollo ME, Ash S, Lyons-Wall P, Russell a .用手机记录成人2型糖尿病患者饮食摄入量的试验:评估及其对未来应用的影响。[J] .中国电信，2011;17(6):318-323。［CrossRef] [Medline］
雷思克P，瓦里安HR。推荐系统。通信ACM 1997年3月;40(3):56-58。［CrossRef］
多任务学习。机器学习1997;28(1):41-75。［CrossRef］

‎

有线电视新闻网:卷积神经网络

可可:会话式卡路里计数器

农业部:美国农业部

R库卡夫卡编辑;提交27.01.21;经Fernandez-Granero先生、Majurul Ahsan先生、C Ochoa-Zezzatti先生同行评议;对作者的评论15.04.21;收到修订版本02.06.21;接受10.11.21;发表06.12.21

©Salima Taylor, Mandy Korpusik, Sai Das, Cheryl Gilhooly, Ryan Simpson, James Glass, Susan Roberts。原载于医学互联网研究杂志(//www.mybigtv.com)， 06.12.2021。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品首次发表在《医学互联网研究杂志》上，并适当引用。必须包括完整的书目信息，到//www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

本文内容如下e-collection /主题问题:

使用自然口语和自动映射自我报告的食物摄入量到食物成分数据的低负担实时膳食评估:方法比较研究