JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v25i1e40789 36826990 10.2196/40789 审查 审查 基于人工智能的聊天机器人促进健康行为改变:系统综述 Eysenbach 冈瑟 Mavragani 孤挺花 Sathish Thirunavukkarasu 。维内特 莉娜 Linwei Aggarwal 阿布 英航 1 2 https://orcid.org/0000-0002-9808-8084 Tam Cheuk气 博士学位 1 2 https://orcid.org/0000-0003-2612-0564 Dezhi 博士学位 3. 4 https://orcid.org/0000-0002-3554-1136 小明 博士学位 1 2 3. https://orcid.org/0000-0002-5555-9034 博士学位 1
健康促进、教育和行为司 阿诺德公共卫生学院 南卡罗莱纳大学 格林街915号 哥伦比亚,南卡罗来纳州,29201 美国 1 803 777 6844 SHANQIAO@mailbox.sc.edu
2 3. https://orcid.org/0000-0003-1834-1834
健康促进、教育和行为司 阿诺德公共卫生学院 南卡罗莱纳大学 哥伦比亚,SC 美国 SC SmartState医疗质量中心(CHQ) 南卡罗莱纳大学 哥伦比亚,SC 美国 大数据健康科学中心 南卡罗莱纳大学 哥伦比亚,SC 美国 综合信息技术系“, 工程与计算学院 南卡罗莱纳大学 哥伦比亚,SC 美国 通讯作者:乔杉 SHANQIAO@mailbox.sc.edu 2023 24 2 2023 25 e40789 5 7 2022 21 10 2022 3. 1 2023 10 1 2023 ©Abhishek Aggarwal, Cheuk Chi Tam,吴德智,李晓明,乔珊。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2023年2月24日。 2023

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

基于人工智能(AI)的聊天机器人可以提供个性化、迷人和按需的健康促进干预措施。

客观的

这项系统综述的目的是评估人工智能聊天机器人促进健康行为改变的可行性、有效性和干预特征。

方法

在7个书目数据库(PubMed、IEEE Xplore、ACM数字图书馆、PsycINFO、Web of Science、Embase和JMIR出版物)中进行了全面搜索,以检索1980年至2022年发表的评估人工智能聊天机器人改变行为的可行性或有效性的实证文章。卡塔尔世界杯8强波胆分析根据PRISMA(系统评价和元分析首选报告项目)指南对确定的文章进行筛选、提取和分析。

结果

在纳入的15项研究中,有几项研究证明了人工智能聊天机器人在促进健康生活方式(n= 6,40%)、戒烟(n= 4,27%)、治疗或药物依从性(n= 2,13%)和减少药物滥用(n= 1,7%)方面的高效。然而,在可行性、可接受性和可用性方面有不同的结果。选择的行为改变理论和专家咨询用于开发人工智能聊天机器人的行为改变策略,包括目标设置、监控、实时强化或反馈以及按需支持。在聊天机器人平台上收集用户与聊天机器人的实时交互数据,如用户偏好和行为表现,以确定提供个性化服务的方式。人工智能聊天机器人展示了通过可访问的设备和平台(如智能手机和Facebook Messenger)部署的可扩展性潜力。参与者还报告说,人工智能聊天机器人为交流敏感信息提供了一个非评判的空间。然而,报告的结果需要谨慎解释,因为内部有效性存在中度到高度的风险,对AI技术的描述不足,以及可泛化性的限制。

结论

人工智能聊天机器人已经证明了在大规模和多样化人群中进行健康行为改变干预的有效性;然而,未来的研究需要采用可靠的随机对照试验来建立明确的结论。

聊天机器人 人工智能 人工智能 健康行为改变 订婚 功效 干预 可行性 可用性 可接受性 移动电话
介绍 背景

人工智能(AI)驱动的聊天机器人(AI chatbots)是一种会话代理,通过与用户进行书面、口头和视觉形式的交流来模拟人类互动[ 1 2]。随着越来越多的技术设备(如智能手机和电脑)和互联网的使用,人工智能聊天机器人有可能提供可访问的、自主的和引人入胜的健康相关信息和服务,这对技术促进的干预很有希望。现有的具有教学成分的数字治疗和远程医疗干预措施,使医疗保健提供者能够通过数字平台(如电子邮件和视频电话)与患者沟通,但遇到了一些挑战,包括依从性相对较低、不可持续性和缺乏灵活性[ 3. 4]。人工智能聊天机器人提供了灵活的按需支持、个性化支持和内容以及一致的连接(可持续性),有助于解决远程医疗服务的不足。整体 会话的灵活性人工智能聊天机器人在随时随地交流方面提供了一个安全的空间,以促进在寻求医疗服务时感到或经历耻辱的患者的互动[ 5]。

人工智能聊天机器人通过健康相关对话中的关键数据处理步骤(数据输入、数据分析和数据输出)展示了其有效改变行为的潜力。首先,人工智能聊天机器人可以从不同的来源收集数据集:电子健康记录、非结构化临床记录、使用额外传感器(眼动跟踪、面部识别、运动跟踪和心跳)的实时生理数据点,以及用户交互[ 5 6]。其次,AI算法使用机器学习(ML)和自然语言处理(NLP)技术来识别临床有意义的模式并了解用户需求[ 7]。第三,人工智能聊天机器人可以通过提供服务来模拟现实生活中的人类支持,帮助用户实现他们的健康行为目标[ 6]。总体而言,通过承认用户需求,展示理解,并根据用户偏好及时提供定制服务(例如,目标设置、行为监测和信息或知识提供),人工智能聊天机器人有可能有效地提供干预措施,促进不同的健康行为(例如,戒烟、体育活动和药物依从性)。人工智能聊天机器人还可以集成到具体功能(例如虚拟现实)中,提供额外的好处,例如沉浸式体验,这可以促进健康行为改变的过程[ 8]。

之前的工作

在过去十年中,关于人工智能聊天机器人在提供医疗保健服务方面的可行性和有效性的证据集中在不同的健康环境和技术角度,大多数聊天机器人的目标是改善心理健康结果。在现有的关于人工智能聊天机器人的系统综述中,有6篇文章针对 评估人工智能聊天机器人在增强心理健康结果方面的效果 1 7 9- 12, 2检查 可行性人工智能聊天机器人在医疗保健领域的应用[ 8 13], 1描述了用于慢性疾病的AI聊天机器人的技术架构和特征[ 14]。

鉴于人工智能聊天机器人在健康促进方面的优点,最近的文献越来越关注人工智能聊天机器人在健康行为改变方面的应用。哦等[ 2)进行了一项系统评估,评估了人工智能聊天机器人的功效 生活方式的修改(例如,体育活动、饮食和体重管理)。然而,本综述的范围和纳入标准有一些局限性。首先,这篇综述没有区分人工智能驱动的聊天机器人和其他聊天机器人。例如,执行任务的AI聊天机器人 基于规则的 限制谈话也包括在内。其次,所选的研究只针对有限的一系列行为,包括体育活动、饮食和体重管理。第三,这篇综述没有涵盖所有可能部署人工智能聊天机器人的平台,这些新兴的技术平台。例如,这篇综述排除了集成到虚拟现实、增强现实、具身代理和治疗机器人中的AI聊天机器人。因此,为了提供对人工智能聊天机器人的最先进的理解,以促进健康行为的改变,我们有动力进行系统的审查,涵盖人工智能聊天机器人的最新发展,即它们被集成到不同的设备(机器人、智能手机和计算机)和不同的平台(信使和短信短信),它们执行“不受约束的”对话,它们针对广泛的行为结果(戒烟、治疗或药物依从性,健康的生活方式,以及相关的健康行为领域)。因此,本研究旨在对已发表的实证研究进行批判性评估,这些研究描述了AI聊天机器人的干预特征、组件或功能,并调查它们在传统和新兴平台上促进广泛健康行为的可行性和有效性。

方法 数据源和搜索算法

本系统文献综述的研究方案遵循PRISMA (Preferred Reporting Items for systematic Reviews and meta - analysis)指南[ 15]。2022年6月,3位作者(CCT、SQ和AA)在PubMed、IEEE Xplore、ACM数字图书馆、PsycINFO、Web of Science、Embase和JMIR出版物7个书目数据库中进行了全面检索。卡塔尔世界杯8强波胆分析

该搜索使用了来自3个类别的各种关键词的组合。第一类包括与基于人工智能的聊天机器人相关的关键字,包括 聊天机器人 聊天机器人 聊天机器人 人工智能 会话的人工智能 会话机构 虚拟代理 会话代理, 机器人。第二类与健康行为相关,包括关键词 健康促进 健康行为 行为改变 物质使用 使用酒精 香烟使用 吸烟 药物滥用 吸毒障碍 危险行为 生活方式 锻炼 营养行为 睡眠 依从性 体重 体育活动 饮食 危险的行为 寻求医疗保健行为 处方药治疗 烟草的使用, 特许经销商。第三类侧重于干预研究,包含1个关键词: 干预

关键字的组织方法如下:(1)一个类别内的关键字使用OR运算符(例如, 聊天机器人 会话的人工智能)和(2)跨不同类别的关键字使用and操作符连接(例如, 聊天机器人 健康行为 干预 多媒体附件1)。

纳入和排除标准

本文选取了基于人工智能聊天机器人技术的健康行为干预的实证研究,纳入标准如下:(1)以健康行为为重点的干预研究;(2)利用聊天机器人进行实证研究;(3)基于现有AI平台(如IBM Watson Assistant [IBM Corp])或AI算法(如ML、深度学习、自然语言理解和NLP)开发的聊天机器人;(4)报告干预措施定性或定量结果的研究;(5) 1980年至2022年(截至2022年6月2日)期间发表的英文文章。如果文章不是全文的实证研究(如会议摘要或提案),那么它们将被排除在外;(2)基于非人工智能方法的聊天机器人干预研究,如基于规则的方法;(3)没有阐明其人工智能算法的研究;或者(4)只关注心理健康而不关注健康行为的研究。

基于这些标准初步检索和筛选了共1961篇文章。最后,有15篇文章符合纳入标准并被选为本次综述( 图1)。选择上的分歧通过团队讨论解决。

资格筛选程序。AI:人工智能。

数据提取与质量评估

使用几个摘要表从所选文章中提取信息,包括研究特征(即作者、出版年份、研究设计、参与者、样本年龄、样本量、国家和目标健康行为)、基于聊天机器人的干预特征(即聊天机器人类型、聊天机器人组件或功能、设置、现有AI技术、输入数据源、平台、理论基础和AI算法)和干预结果(即:健康行为结果或主要结果,可行性,可用性,可接受性和参与度)。

可行性、可接受性和可用性在研究中没有一致的定义。因此,为了便于理解和系统表示,作者根据其定义对数据进行了可行性、可接受性和可用性分类。可行性被定义为 需求的干预,即实际使用的干预和是否干预 可行的在某种情况下[ 16]。例如,与聊天机器人交换的消息数量和参与者的参与率。可接受性被定义为人工智能聊天机器人的用户体验质量[ 17,例如,与AI聊天机器人互动的满意度得分或点赞数。可用性被定义为干预对用户实现预定目标的贡献程度[ 18],例如AI聊天机器人提供的内容在实现健康行为目标方面的可用性。

根据美国国立卫生研究院的受控干预研究质量评估工具,对所选研究进行质量评估[ 19]。该评估工具建议对6种类型的偏倚风险进行评估。具体地说,(1) 报告结果的风险根据预先指定的结果评估了特设分析;(2) 随机化过程中的偏倚风险基于随机治疗分配、分配顺序的隐匿性(盲法)和基线组的相似性进行评估;(3) 由偏差引起的偏差风险根据对参与者、实施者和评估者隐藏指定的干预措施对预期干预措施进行评估;(4) 来自意外来源的风险根据避免其他干预措施影响的措施和对干预方案的忠实度进行评估;(5) 测量结果时的偏倚风险基于对评估人员的干预措施的隐瞒以及结果测量的有效性和可靠性进行评估;(6) 分析中偏误的风险基于退出率、功率计算和治疗意向分析进行评估。除了对所有研究的每种风险类型进行评估外,所有研究都按照以下量表进行评级:1=符合,0=不清楚,0=不符合,0=未报告或不适用。计算每项研究的总分。

针对AI聊天机器人干预的AI技术也使用了针对AI研究的consortium -AI(报告试验综合标准-人工智能)扩展指南进行了评估[ 20.]。我们使用了四个领域的清单:(1)是否通过在临床路径的背景下使用AI来指定使用AI的基本原理,(2)是否指定了输入数据层面的纳入和排除标准以及处理不可用输入数据的方法的描述,(3)是否描述了输入数据采集过程和输入数据收集中人-AI交互的规范,(4)是否描述了人工智能算法的输出及其在研究结果背景下的意义。数据提取和质量评估由CCT和AA两位作者独立进行。CCT、AA和SQ通过充分讨论解决了所有分歧。

结果 被回顾研究的特点

所综述研究的特点总结在 表1。纳入的期刊文章(N=15)发表年份为:2021年2篇(13%),2020年3篇(20%),2019年6篇(40%),2018年、2017年、2013年和2011年各1篇(7%)。在15项研究中,13项(87%)报告了它们的地理位置。所有13项研究都分布在低收入国家,其中4项(31%)来自美国,2项(15%)来自澳大利亚,1项(8%)来自其他国家(即韩国、西班牙、英国、日本、法国、瑞士和荷兰)。研究的样本量从20到99,217人不等,中位数为116人,平均值约为7224人(SD为25,495.82人)。总体而言,40%(6/15)的研究有>200名参与者,其次是27%(4/15)的研究有100至200名参与者,13%(2/15)的研究有50至100名参与者,20%(3/15)的研究有<50名参与者。

在报告参与者平均年龄的14项研究中,大多数成年参与者的年龄为18 - 30岁(n= 2,14%)、30 - 40岁(n= 3,21%)、40 - 50岁(n= 5,36%)、50 - 60岁(n= 1,7%)和>60岁(n= 1,7%),只有2项(14%)研究的参与者年龄<18岁。所选研究包括有不同既往病史的参与者:体育锻炼和健康饮食水平较低的个体(4/ 15,27 %)、吸烟者(4/ 15,27 %)、肥胖患者(2/ 15,13 %)、乳腺癌患者(1/ 15,7 %)、物质使用障碍患者(1/ 15,7 %)、普通人群(2/ 15,13 %)和医疗保险受益人(1/ 15,7 %)。回顾研究的目标健康行为包括促进健康的生活方式(体育锻炼和饮食;5/ 15,33%),戒烟(4/ 15,27%),坚持治疗或药物治疗(3/ 15,20%),减少有问题的物质使用(1/ 15,7%)。只有27%(4/15)的研究采用了随机对照试验(rct),大多数研究(9/ 15,60 %)采用了不设对照组的准实验设计(即前测和后测),其次是7%(1/15)的研究采用横断面设计,7%(1/15)的研究采用实验后研究方法。

回顾研究的特征(N=15)。

研究 研究设计 参与者 平均(SD)或中位年龄(年) 样本大小 国家 针对健康行为或目的
朴等[ 21] 个随机对照试验一个 办公室工作人员 35

N = 106

N =57(干预组)

对照组49例

韩国 健康的生活方式(体育活动)
Maher等人[ 22] 张后研究b 不符合澳大利亚体育活动指南,不遵循地中海饮食模式的澳大利亚人 56.2 (sd 8)

N = 31

澳大利亚 健康的生活方式(体育活动和健康饮食)
卡拉斯科-埃尔南德斯等人[ 23] 个随机对照试验 门诊的吸烟者 49.655

N = 240

N =120(干预:聊天机器人+药物治疗)

N =120(对照:药物治疗)

西班牙 戒烟
斯蒂芬斯等[ 6] 张后研究b 有肥胖症状的青少年在儿童保健系统 15.20

N = 23

美国 治疗依从性(肥胖)
Perski等[ 24] 个随机对照试验 购买了无烟应用程序的吸烟者 N/Ac

N = 6111

n=1061(干预:聊天机器人+无烟应用程序)

n=5050 (control: Smoke Free app)

联合王国 戒烟
正木等[ 25] 张后研究b 有尼古丁依赖的成年吸烟者 43.5 (sd 10.5)

N = 55

日本 戒烟
Chaix等[ 26] 张后研究b 乳癌患者 48

N = 958

法国 药物依从性
Calvaresi等[ 27] 张后研究b 来自Facebook社区的吸烟者 N/A

N = 270

瑞士 戒烟
Galvão戈梅斯·达·席尔瓦等[ 5] 定性研究 来自心理学院的志愿者 23

N = 20

联合王国 健康的生活方式(体育活动)
斯坦因及布鲁克斯[ 28] 张后研究b 超重和肥胖的成年人(BMI≥25) 46.9 (sd 1.89)

N = 70

美国 健康的生活方式(减肥,健康的饮食,体育锻炼,健康的睡眠时间)
Crutzen等[ 29] 张后研究b 对干预感兴趣的青少年 15

N = 920

荷兰 健康的生活方式
巴拉加等[ 30.] 横断面研究(后研究) 医疗保险受益人 值71

N = 99217

美国 药物依从性
普罗查斯卡等[ 31] 张后研究b 美国成年人药物滥用筛查呈阳性 36.8 (sd 10)

N = 101

美国 减少有问题的药物使用
等人[ 32] 准实验设计,不设对照组 不活跃的个体(每天中等至高强度体育活动<20分钟) 49.1 (sd 9.3)

N = 116

澳大利亚 健康的生活方式(体育活动)
比克莫尔等[ 33] 个随机对照试验(4-arm) 对于中等或更高强度的身体活动或水果和蔬菜的消费,处于预先考虑或考虑改变阶段的个体 33 (sd 12.6)

N = 122

NRd 健康的生活方式(体育活动和健康饮食)

一个随机对照试验。

b前后研究没有对照组。

cN/A:不适用。

dNR:没有报道。

介入研究质量评估

质量评估结果载于 多媒体附件2 5 6 21- 33]。 报告结果的风险是低的,因为所有的研究都预先规定了结果和假设。 随机化过程中的偏倚风险很低27%(4/15)的rct采用了适当的随机治疗分配,并报告向参与者隐瞒了分配顺序,其中75%(3/4)的rct在基线时建立了组间相似性。非rct研究(11/ 15,73%)不适用于随机化过程的评估。

偏离预期干预的偏倚风险被认为是低到中度。所有纳入的研究(N=15)均未报告向辅导员、评估者和参与者隐瞒指定的干预措施,主要是因为向提供和接受行为、生活方式或手术干预的人隐瞒是困难的[ 19]。 来自意外来源的结果风险是高。首先,没有一项研究报告了任何明确的措施来避免其他干预措施对结果或现有干预措施的影响。在随机对照试验中(4/ 15,27%),由于干预措施的实验设置,这种偏差被最小化;然而,对于非rct研究(11/ 14,73%),由于混杂变量的潜在影响,存在较高的偏倚风险。其次,大多数研究(13/ 15,87%)没有报告参与者是否遵守干预方案。

结果测量中的偏倚风险是温和的。首先,没有一项研究报告是否对评估人员隐瞒了指定的干预措施。其次,60%(9/15)的研究报告了结果测量的信度和效度。在其余研究(6/ 15,40%)中,结果测量的信度和效度不清楚(3/ 6,50%)或未报告(3/ 6,50%)。 分析中的偏倚风险中度到高度。首先,组间差异退出率≥15%,干预组或对照组退出率≥20%的研究被认为退出率较高[ 19]。只有33%(5/15)的研究退出率低于临界值,20%(3/15)的研究没有报告退出率,47%(7/15)的研究退出率高于临界值。其次,只有33%(5/15)的研究报告使用幂计算来估计可以检测主要结果显著差异的样本量。第三,只有40%(6/15)的研究采用了意向治疗分析。

在4项RCT研究中,Carrasco-Hernandez等人[ 23]报告的依从性相对最高(8/ 12,67%),紧随其后的是Piao等人的研究[ 21(7/ 12,58%)。Perski等人[ 24]仅报告了50%(6/12)的因素的依从性,紧随其后的是Bickmore等人的研究[ 33(5/ 12,42%)。所有4项rct均未报告 隐藏指定的干预,努力 避免其他干预, 依从性所有随机对照试验均不符合辍学率。在非随机对照研究中,Maher等人[ 22]及巴拉加等[ 30.]报告了最高的依从性(5/ 9,56%),紧随其后的是Masaki等人的研究[ 25],普罗查斯卡等[ 31]和To et al [ 32(4/ 9,44%)。Chaix等[ 26]仅报告了33%(3/9)的因素的依从性,其次是Stein和Brooks的研究[ 28]及Crutzen等[ 29](2/ 9,22%)。其余的研究,即Stephens等人的研究[ 6], Calvaresi等[ 27], Galvão Gomes da Silva等[ 5]的受访者,只对11%(1/9)的因素感到不满。请注意,依从性<40%的研究结果需谨慎解释。

人工智能质量评估

评估了聊天机器人的人工智能组件,以证明人工智能对健康结果的影响( 多媒体 5 6 21- 33])。 使用AI的理由在所有研究中都是预先指定的(N=15)。 AI输入数据的特征和处理仅7%(1/15)的研究描述。 人工智能输入数据采集过程87%(13/15)的研究提到。 人机交互规范在大多数研究的输入数据收集中报告(9/ 15,60%)。 的输出 人工智能算法及其在研究结果中的意义在87%(13/15)的研究中描述。总之,除了输入数据特征和对不可用输入数据的处理外,对所有因素都有足够的描述。

回顾研究的结果 功效 定量研究:健康的生活方式

在15项研究中,7项(47%)研究[ 5 21 22 28 29 32 33]针对健康的生活方式,5项(33%)研究[ 21 22 28 32 33]评估了人工智能聊天机器人通过(1)身体活动水平、(2)健康饮食、(3)血压和(4)BMI来促进健康生活方式的功效。首先,80%(4/5)的研究[ 33报告体力活动增加。斯坦因及布鲁克斯[ 28]报告说,体育活动的增加导致75.7%的用户(n=53)的平均体重减轻了2.38%。Maher等人[ 22]的研究报告显示,每天的体育活动时间增加了109.8分钟( P=.005),平均体重和腰围减少1.3公斤( P=.01)及2.1 cm ( P分别= .003)。朴等[ 21]报告称,当通过聊天机器人启用应用程序控制内在奖励时,自我报告习惯指数在组间存在显著差异( P= .008)。等人[ 32]报告参与者记录了更多的步数( P<.01)和更多的体育活动(3.58倍; P<措施)。此外,在随访中,参与者也更有可能满足体育活动指南(95% CI 3.31-12.27)。然而,只有Bickmore等人[ 33]在国际体育活动问卷( P= .37点)。

第二,20%(3/15)的研究[ 22 28 33报告说饮食有所改善。斯坦因及布鲁克斯[ 28报告称,健康膳食的比例增加了31%,不健康膳食的比例下降了54%。Maher等人[ 22报告地中海饮食(健康膳食)的平均得分增加了5.7分( P<措施)。比克莫尔等[ 33]报告说,只接受饮食相关干预的小组比只接受体育活动干预或体育活动和饮食同时进行干预的小组食用的水果和蔬菜明显更多( P= .005);然而,各组之间的体重差异无统计学意义( P= .37点)。第三,Maher等人[ 22]评估干预后的血压水平,作为次要结果;然而,收缩压的平均改善(-0.2 mmHg; P=.90)和舒张压(−1.0 mmHg; P=.54)均不显著。第四,只有To et al [ 32]报告BMI下降不显著(95% CI−0.37至0.11)。总之,在所有旨在改善健康生活方式的研究中,主要结果(体育活动水平和健康饮食)存在显著差异。

定量研究:戒烟

在15项研究中,4项(27%)研究[ 23- 25 27评估了人工智能聊天机器人在戒烟方面的效果。Perski等[ 24]报告说,在1个月的随访中,干预组的禁欲几率是对照组的2.44倍( P<措施)。正木等[ 25]报告了总体持续禁欲率结果(76%,12周;64%, 24周;和58%,52周)优于美国和日本的门诊(通过全国调查计算)和varenicline(戒烟药物)3期试验的结果。正木等[ 25]报告了社交尼古丁依赖(平均- 6.7,SD 5.2)、烟草渴望(平均- 0.6,SD 1.5)和戒断症状(平均- 6.4,SD 5.8)的减少,这些是他们的次要结果。Calvaresi等[ 27报告称,28.9%的参与者在最后一支烟抽完3个月后完成了戒烟目标。这一结果比不包括聊天机器人支持的上一版戒烟计划高出10%。卡拉斯科-埃尔南德斯等人[ 23]报告吸烟戒断(呼出一氧化碳和尿液可替宁试验)为2.15次( P=.02),干预组高于对照组。然而,二级临床测量(与健康相关的生活质量、健康的生活方式和体育活动)在两组之间没有显示出任何差异。总之,有证据表明,基于聊天机器人的干预对戒烟有显著的长期和短期影响。

定量研究:药物滥用

在15项研究中,只有1项(7%)研究[ 31,旨在减少有问题的药物使用。普罗查斯卡等[ 31]报告了抵抗药物使用冲动的信心显著增加(平均得分变化+16.9,SD 21.4; P<.001),物质使用次数显著减少(平均变化−9.3,标准差14.1; P<.001)和酒精使用障碍识别测试(平均变化- 1.3,标准差2.6; P<.001), 10项药物滥用筛查试验(平均变化−1.2,SD 2.0; P<.001),患者健康问卷-8项(平均变化2.1,标准差5.2; P=.005),广泛性焦虑障碍-7(平均变化2.3,标准差4.7; P=.001),以及渴望程度(68.6% vs 47.1%中度至极端; P= . 01)。

定量研究:治疗或药物依从性

在15项研究中,3项(20%)研究[ 6 26 30.靶向用药或治疗依从性,但只有2项(67%)研究[ 26 30.]报告了人工智能聊天机器人通过及时和个性化的提醒,在提高治疗或药物依从性方面的效果。巴拉加等[ 30.报告称,在所有的续杯提醒(n=273,356)中,17.4% (n=47,552)导致了实际的续杯请求。此外,其中54.81%(26,062/47,552)的请求导致药物在2小时内实际补充。Chaix等[ 26]的报告显示,平均服药依从率在4周内提高了20%以上( P=.40)通过处方提醒功能。总之,有证据表明,通过聊天机器人的使用,药物依从率显著提高;然而,聊天机器人的使用存在文化差异。

定性研究:健康生活方式

只有一项研究进行了定性分析,即Galvão Gomes da Silva等人的研究[ 5]。这项研究报告称,社交机器人NAO增强了与朋友和家人见面等活动的即时动机,并通过正念技术增强了意志力。参与者还报告说,他们感觉更有自知之明,更愿意与他人分享自己的目标。然而,该研究报告了关于实现体育活动目标的混合结果。

可行性

所选研究的结果报告在 多媒体附件4 5 6 21- 33]。在15项研究中,11项(73%)报告了AI聊天机器人在以下方面的可行性:(1)安全性[ 22](即没有不良事件报告),(2)与聊天机器人交换的消息[ 6 26 29 31 32],(3)留存率[ 22 26(4)聘用期限。只有7%(1/15)的研究 22]报告了聊天机器人的安全性,即没有不良事件。许多研究报告了与聊天机器人交换的消息总数(5/ 15,33%)[ 6 26 29 31 32];然而,只有7%(1/15)的研究报告了用户发起对话的确切比例(约30%)[ 6,描述了参与者对与聊天机器人进行健康对话的兴趣程度。很少有研究[ 22 23 26]报告了在研究持续时间内参与和保留率的变化。总体而言,7%(1/15)的研究报告留存率(用户每月至少发送一条消息,持续超过8个月)逐渐下降,从72%(第二个月)下降到31%(第八个月)[ 26]。类似地,另一项研究报告称,用户的参与度在第一个月最高,然后逐渐下降,在第12个月达到最低。 23]。同样,另一项研究[ 22报告显示,在项目进行到一半的时候,签到率下降了20%,而在最后一周,签到率上升到了70%。总的来说,有强有力的证据表明,随着时间的推移,人们对聊天机器人的参与度下降了。需要注意的是,不同的研究在用户粘性指标方面存在不一致性。总体而言,关于聊天机器人安全性的证据非常少,就交换的健康信息总数和平均数量而言,聊天机器人的可行性有一些证据;但是,没有定义阈值来确定交换的消息数量是否具有可行性。有趣的是,在其中一项研究中(7%),参与率随着时间的推移而下降,但最终会上升。 22]。

可接受性

在15项研究中,有7项(47%)报告了人工智能聊天机器人在(1)满意度和(2)提供非评判的安全空间方面的可接受性和参与度。在满意度方面,7%(1/15)的研究报告称,大约四分之一的参与者喜欢这些信息[ 32],另一个(7%)报告参与者对基于web的代理的满意度高于平均水平[ 33]。在7%(1/15)的研究中,只有三分之一的参与者表示希望在未来使用聊天机器人[ 32],在另一项研究中(7%),平均而言,参与者报告的未来继续使用该药物的愿望低于平均水平[ 33]。类似地,另一项研究(7%)报告称,三分之一的参与者喜欢聊天机器人的建议[ 25]。只有7%(1/15)的研究 26用户满意度高(93.95%)。总体而言,满意的参与者比例或在内容受欢迎程度和聊天机器人未来使用方面的总体满意度低于50%。总体而言,20%(3/15)的研究报告称,人工智能平台为用户分享详细和敏感信息提供了一个非评判性的安全空间[ 5 26 29]。参与者表示,聊天机器人为他们提供了一个不间断思考和回应的个人空间和时间[ 5];分享他们无法直接与医生分享的个人和私密信息,如性取向[ 26];他们还会问一些关于性、毒品和酒精的问题,因为他们认为聊天机器人比信息热线和搜索引擎更匿名,速度更快。 29]。

可用性

在15项研究中,11项(73%)报告了AI聊天机器人的可用性,包括:(1)聊天机器人的易用性,(2)办公室外支持,(3)内容的可用性,以及(4)技术难度。总的来说,使用聊天机器人的容易程度是低到中等。易用性取决于参与者的智能手机技能、平台的用户界面以及聊天机器人设计中的文化敏感性。一项研究报告称,聊天机器人被用来为参与者提供办公室外的支持,这证明了人工智能聊天机器人提供可持续和持续支持的潜力[ 6]。大多数研究(9/ 15,60%)通过自我报告测量和使用聊天机器人服务的次数来证明聊天机器人共享内容的可用性。一般来说,人们认为文章内容可靠、简洁、高质量、易于理解。一些研究显示,个性化信息和多样化信息的平均得分较高。一些研究报告指出,需要消除内容中的歧义。正木等[ 25的数量 调用向AI护士提出吸烟冲动或副作用寻求帮助(平均1.7次,标准差2.4),表明在关键时刻需要AI聊天机器人。总的来说,人工智能聊天机器人提供的建议的质量可以进一步提高,使其对参与者来说更可行,同时用户界面的设计也得到了改进。7%(1/15)的研究[ 32],大多数参与者报告了使用聊天机器人的技术问题(82.3%),其中一个原因是他们在研究期间停止接收聊天机器人的消息(84.1%)。总之,虽然聊天机器人有效地提供了办公室外的支持,但聊天机器人的易用性和内容的可用性需要在用户友好的设计界面中提供可信和可行的建议来进一步提高。

聊天机器人干预特征 行为改变理论与聊天机器人功能

中总结了聊天机器人的干预特征 多媒体 5 6 21- 33]。在超过一半的研究中(9/ 15,60%),AI聊天机器人的内容、功能和界面是基于理论设计的。每项研究都根据干预目标和目标受益者严格选择理论。认知行为疗法(CBT)在Tess [ 6]、百灵健康教练(HCAI) [ 28]和Woebot [ 31来设计提高自我效能和维持行为改变的策略。《苔丝》[ 6, CBT与情感聚焦疗法理论和动机性访谈相结合,以辅助青少年患者的行为咨询。同样,在Woebot中[ 31, CBT与动机性访谈和辩证行为疗法结合,提供情感支持和个性化心理教育,以抵抗药物滥用。动机性访谈理论也被用于设计由NAO提出的访谈问题[ 5](社交机器人)和由Bickmore等人提供的动机强化信息[ 33Chat1。在HCAI [ 28, CBT与糖尿病预防计划(Diabetes Prevention Program)的课程结合在一起,为有关减肥的对话提供内容。

习惯形成模型解释了提示、行为和奖励之间的关系,用于健康生活方式指导聊天机器人(HLCC)的提醒系统。莫尔的 支持性问责模式,该报告指出,在数字干预中加入人力支持可提高参与度,并用于模拟无烟应用程序(SFA)中的人力支持[ 24以增加责任感和归属感。此外,国家林业局的[ 24行为改变技术是根据44项行为改变技术分类编码的,用于戒烟的个人行为支持。行为改变的跨理论模型(TTM)由Carrasco-Hernandez等人使用[ 23来确定AI聊天机器人的消息频率。同样,在Bickmore等人的[ 33Chat1设计行为监控流程,包括回顾进度、识别障碍和解决问题。能力、机会、动机、行为模型是行为改变之轮的核心,是一个聚焦于3个组成部分——能力、机会和动机的行为系统,在To等人的[ 32设定目标,监控行为,通过激励信息加强行为改变。社会认知理论也应用于Ida [ 32]以促进治疗性对话行动(即谈话治疗)和在代理咨询会议之外的家庭作业。除了运用理论,还采用专家咨询和制度协助的方式来开发人工智能聊天机器人的内容。咨询了心理健康专家,并通过Tess [ 6],而荷兰的2个国家健康促进机构为Bzz开发了内容[ 29]。总之,大多数研究要么采用一套严格选择的行为改变理论,要么咨询领域专家(个人或机构)来制定行为改变策略。

基于行为改变理论,人工智能聊天机器人具有多种功能,有助于产生有效的结果。首先,53%(8/15)的研究有针对性 行为目标设定。这些聊天机器人的目标是健康的生活方式(7/ 8,88%;HLCC,保拉[ 22], sfa [ 24], nao [ 5], hcai [ 28],艾达[ 32], Chat1 [ 33])和减少药物滥用(1/ 8,12%;Woebot [ 31])。这些聊天机器人的目标与健康的生活方式有关,用户可以通过推送警报设置身体活动和饮食目标,以维持日常生活并监测体重。其次,73%(11/15)的研究使用 行为监测。以健康生活方式为目标的聊天机器人(5/ 11,45%;HLCC,保拉[ 22], hcai [ 28],艾达[ 32], Chat1 [ 33])通过持续提供绩效内容和图片反馈、每周签到和基于数据的绩效输入,实现了行为监控。以戒烟为目标的聊天机器人(3/ 11,27%;DigiQuit [ 23], sfa [ 24],及SMAG [ 27)通过网络日志和图表,对健康指标提供数据驱动的反馈。针对药物或治疗依从性的聊天机器人(2/ 11,18%;维克( 26]及pulse [ 30.)及时提醒患者服药或补充药物。以减少药物滥用为目标的聊天机器人执行情绪跟踪和定期检查以保持问责制(1/ 11,9%;Woebot [ 31])。

第三,53%(8/15)的研究提供 行为相关信息。以健康生活方式为目标的聊天机器人(3/ 8,38%)提供了关于体育活动益处的教育课程(Ida [ 32])和健康饮食(Paola [ 22])和有关性、毒品和酒精的资料(Bzz [ 29])。以戒烟为目标的聊天机器人(4/ 8,50%;DigiQuit [ 23];国家林业局( 24];戒烟治标[中国科技研究中心],[ 25];和SMAG [ 27)教育使用者不吸烟的好处、突然戒烟的影响以及吸烟的替代方法。针对药物或治疗依从性的聊天机器人(1/ 8,12%;维克( 26)提供了关于使用者正在服用药物治疗的健康问题(乳腺癌)的信息。

第四,53%(8/15)的研究报告 动机强化。以健康生活方式为目标的聊天机器人(3/ 8,38%)提供了行为反馈(HLCC和Ida [ 32]),并通过计划和想象改变来增强乐观态度(NAO [ 5]和艾达[ 32])。以戒烟为目标的聊天机器人(4/ 8,50%)通过基于TTM (DigiQuit [ 23])、记分牌及里程碑追踪器(SFA [ 24]),以及激励讯息(CASC [ 25]和SMAG [ 27])。以减少药物滥用为目标的聊天机器人,通过个性化的每周报告,专注于激励和参与,以促进反思(Woebot [ 31])。

第五,27%(4/15)的研究提供 情感支持。其中,3项研究(75%)以健康生活方式为目标,25%(1/4)以减少药物滥用为目标。在针对健康生活方式的干预措施中,苔丝[ 6通过ml驱动的情感算法提供同理心健康咨询或同情护理;NAO [ 5,社交机器人通过人性化的机器人互动来表达同理心,而HCAI [ 28模仿卫生专业人员的移情健康咨询。旨在减少药物滥用的干预措施,Woebot [ 31],通过根据用户陈述的情绪量身定制来提供共情反应。

第六,7%(1/15)的研究(CASC [ 25])交付 provider-recommendation系统服务。公司( 25为医生提供建议和咨询支持。第七,47%(7/15)的研究报告 24 * 7的可用性人工智能聊天机器人。以健康生活方式为目标的聊天机器人(4/ 7,57%;Paola [ 22,苔丝[ 6], hcai [ 28]和Bzz [ 29)提供随需应变的支持、无限的对话和对无限的问题的回答。以戒烟为目标的聊天机器人(3/ 7,43%)通过人工智能护士提供按需紧急支持(CASC [ 25]),在高渴望期间给予支持(SMAG [ 27]),以及不限次数的对话(SFA [ 24])。第八,13%(2/15)的研究促进了与聊天机器人对话以外的活动。Chat1 [ 33]提供家庭作业,而Woebot [ 31需要正念练习、感恩日志,或者反思已经学到的模式和课程。总之,人工智能聊天机器人为用户提供了个性化的、实时的反馈和随需应变的支持。

聊天机器人的基础设施:AI技术

大多数研究(10/ 15,67%)部署了不同的人工智能技术来提供个性化干预:NLP、ML、混合技术(ML和NLP)、混合健康推荐系统、面部跟踪技术以及基于程序和认识论的知识算法。ml驱动的情感算法在Tess [ 6]及HCAI [ 28来提供同理心咨询或同情关怀(基于情绪的反应)。人工智能算法分析用户的信息(基于语音或文本),以识别和分类他们的情绪。此后,聊天机器人为用户提供了情感和战略上的支持。NLP和ML技术应用于Paola [ 22],维克[ 26],艾达[ 32]和Woebot [ 31]通过分析非结构化消息来识别和分类用户意图和实体。比克莫尔等人[ 33Chat1使用基于程序和认识论知识的人工智能算法,促进治疗性对话行动(谈话治疗)。pulse采用了NLP与会话AI或ML相结合的混合技术[ 30.以确保顺畅、持续和不间断的对话。混合健康推荐系统由Carrasco-Hernandez等人采用[ 23人工智能聊天机器人可以根据用户统计数据、内容(用户的兴趣)和效用(用户对每条消息的评分)来个性化消息。人脸跟踪技术集成到NAO中[ 5(社交机器人)来跟踪参与者的面部,使互动体验更加人性化。其余的聊天机器人研究(5/ 15,33%)指定使用人工智能来个性化聊天机器人交互,但没有详细说明所采用的人工智能技术。总之,大多数研究针对 个性化服务通过不同的人工智能技术。

聊天机器人的基础设施:物流

聊天机器人使用多模态渠道与用户交流。所有聊天机器人除了NAO [ 5(14/ 15,93%)使用文本与用户交流,其中2人(14%;苔丝( 6]和Vik [ 26)聊天机器人也使用基于语音的交流。NAO [ 5它通过一个社交机器人部署,只使用基于语音的交流。基于AI聊天机器人的干预实施了不同的持续时间:0 - 2个月(3/15,20%)、2- 5个月(7/15,47%)、5 - 9个月(2/15,13%)、9 - 12个月(2/15,13%)和>12个月(1/15,7%)。在13个聊天机器人中,所有的聊天机器人,除了NAO [ 5],每天与用户互动。NAO [ 5只有一次互动,因为它是通过社交机器人亲自传达的。人工智能聊天机器人要么被集成到现有平台中,要么独立交付。维克( 26], smag [ 27,苔丝[ 6],而艾达[ 32被整合到Facebook (Meta平台,Inc)的Messenger中。苔丝( 6在WhatsApp (Meta平台,Inc)、Amazon Alexa(亚马逊公司)、谷歌Home(谷歌LLC)和移动短信上也可以使用。益( 21与韩国流行的即时通讯应用KakaoTalk (Kakao Corp)和pulse [ 30.与手机短信相结合。其余的聊天机器人(8/ 15,53%)是独立交付的。这些聊天机器人使用不同的设备进行部署。所有聊天机器人除了NAO [ 5],艾达[ 32], Chat1 [ 33(12/15, 80%)通过智能手机部署,其中3个(27%;维克( 26], smag [ 27]和Bzz [ 29)聊天机器人也通过计算机部署。Chat1 [ 33只能通过计算机进行部署。NAO [ 5通过一个社交机器人进行部署,而Ida [ 32]通过Fitbit Flex 1 (Fitbit LLC)进行部署。三个聊天机器人(HLCC, Paola [ 22],而艾达[ 32])集成了现有的人工智能驱动对话平台,即Watson对话工具(HLCC和Paola [ 22])和Dialogflow,一种先进的谷歌ML算法(Ida [ 32])。总之,人工智能聊天机器人可以通过可访问的设备和平台部署,这表明它们有潜力覆盖偏远和大量人群。

聊天机器人的基础设施:个性化服务的输入数据

为了使用AI聊天机器人提供个性化服务,大多数聊天机器人或研究(9/ 15,60%)需要输入用户背景、目标和行为表现的数据,以及聊天机器人的可用性和基于证据的内容。用户的背景信息或基线特征由4个人工智能聊天机器人收集。Paola [ 22]测量身体活动和地中海饮食的基线水平;国家林业局( 24]测量第一支烟和每天吸烟的时间;公司( 25]测量了人口统计数据、戒烟动机水平、每天吸烟数量和吸烟年限;SMAG [ 27]测量人口统计数据和吸烟依赖类型;和苔丝[ 6使用电子健康记录。3个聊天机器人收集了用户的目标信息,即谁,何时,何地,什么,如何。益( 21)让用户(办公室职员)设定现实的爬楼梯目标,Paola [ 22]使用户能够根据前一周的结果设定每周的饮食目标和每日步数目标,而SFA [ 24]要求使用者设定戒烟的目标日期。3个聊天机器人收集了可用性的实时反馈。DigiQuit [ 23]收集关于邮件内容和时间的反馈,苔丝[ 6]收集信息有用性的数据,Vik [ 26收集有关提醒事项相关性的数据。5个聊天机器人对用户的行为表现进行实时反馈。益( 21]收集演出内容及图片;Paola [ 22]收集每日步数和饮食模式的数据;维克( 26收集药物依从性水平的数据;SMAG [ 27]监测用户的吸烟水平以及位置信息,单独或陪同,正在进行的活动和情绪,为他们创建吸烟档案;及HCAI [ 28通过手机和可穿戴设备等集成设备上的传感器自动收集数据,并自行报告饮食消费等信息。总体而言,20%(3/15)的研究使用了除用户数据之外的循证内容。苔丝( 6]使用针对行为改变的临床脚本,CASC [ 25]采用国家咨询支持指南,而HCAI [ 28]使用了糖尿病预防项目的课程内容。总之,大多数研究使用不同的输入数据集,表明需要收集全面和必要的输入数据,以提供个性化服务。

讨论 主要研究结果 概述

这项综述的结果证明了人工智能聊天机器人在提供有效、有效和可行的健康行为干预方面的潜力。然而,内部有效性的高风险,缺乏对AI技术的充分描述,以及所选研究缺乏概括性,这表明需要用稳健的方法进行进一步研究,以得出明确的结论。无论如何,该综述确定了干预力度的实际意义和研究意义,以及现有研究的局限性和潜在的未来方向。

主要的结果

该综述发现,人工智能聊天机器人在促进健康生活方式方面有效,包括体育锻炼和饮食(6/ 15,40 %)、戒烟(4/ 15,27 %)、治疗或药物依从性(2/ 15,13 %)以及减少药物滥用(1/ 15,7 %)。这些发现与之前的系统综述一致,这些综述报告了使用人工智能聊天机器人来改善身体活动水平和改善药物依从性[ 2 5]、治疗依从性[ 14]、坚持自我管理的做法[ 1]、戒烟[ 12],以及减少药物滥用[ 12]。

二次结果

该评估发现,人工智能聊天机器人在可行性、可接受性和可用性方面报告了不同的结果。在可行性方面,关于聊天机器人安全性的证据相当少,因为只有7%(1/15)的研究报告了安全性[ 22]。由于没有预先定义或标准的消息交换数量阈值来证明可行性,因此很难解释人工智能聊天机器人是否可行。之前的一些系统评估报告了与人工智能聊天机器人合作的可行性;然而,不同研究的可行性指标有所不同,有强有力的证据表明,随着时间的推移,用户参与度会下降。 11 13 14]。同样,人工智能聊天机器人在可接受性方面也有好坏参半的结果。虽然人工智能平台为用户匿名分享详细和敏感信息提供了一个非评判性的安全空间,但满意的参与者比例或聊天机器人的总体满意度不到50%。这些发现与之前报告可接受性的系统综述部分一致[ 11 13 14]以及按需提供的可用性、可及性和满意度[ 7]。同样,可用性方面的结果也是喜忧参半。一些研究报告称,人工智能聊天机器人在提供办公室外支持以及内容的高可靠性和可理解性方面很有效,而其他研究报告称,与聊天机器人缺乏个人联系,参与者的智能手机技能较差,聊天机器人提出的建议不切实际,以及一些技术挑战,例如参与者在研究期间停止接收聊天机器人消息。这些发现与之前关于人工智能聊天机器人的系统评论部分一致,这些评论报告称聊天机器人提供了有用的信息,并且易于使用[ 7]。总的来说,我们在可行性、可接受性和可用性方面的混合结果部分与现有系统综述的结果一致,这些综述报告了这些次要结果测量和研究结果的异质性[ 1 2 7 9- 11]。

干预特征的含义 行为改变的理论基础

人工智能聊天机器人的基本特征在确定有效结果方面发挥了关键作用。首先,大多数研究(9/ 15,60%)在设计和交付AI聊天机器人时使用了严格选择的行为变化理论。我们的研究结果表明,整合行为改变理论,如CBT、TTM、动机性访谈、情感聚焦疗法、习惯形成模型和莫尔的支持性问责模型,可以通过目标设定、监控或跟踪行为和强化,为用户提供一致的动机支持。这些策略不仅有助于获得更好的主要和次要结果,而且从用户的角度解决了传统面对面干预模型中的几个挑战,例如与专家的连接有限,缺乏一致的动机,随着时间的推移缺乏获取不同信息的途径。之前的系统综述也报道了CBT的使用[ 2 11]、习惯形成模型、情绪聚焦疗法和动机性访谈[ 2为人工智能聊天机器人设计行为改变策略,有助于更好的参与度、用户动机和健康行为结果。行为健康专家和计算机科学家之间需要更多的跨学科合作,以开发基于理论的人工智能聊天机器人,用于行为改变干预。

畅通的对话

第二,在所有的研究中, 畅通的对话而不是 基于规则的或受约束的对话人工智能聊天机器人通过个性化服务、多样化信息的传递和用户主动对话的选择来增强用户体验。相比之下,基于规则的聊天机器人通过对输入数据的限制,提供有限的用户体验,有限的面向任务的直接对话集,以及缺乏用户发起的对话。这一发现与之前的系统评估一致,该评估报告了通过对用户表现、问责制、鼓励和对用户情况的深刻兴趣的反馈,AI聊天机器人需要更大的个性化[ 13]。同样,Milne-Ives等人[ 8报告称,他们需要更强的互动或关系技能、同理心对话,以及通过富有同情心的回应与用户建立个人联系的感觉。

13%(2/15)的研究发现,对更强交互性的需求也与用户粘性的波动有关[ 22 23]。在其中一项研究中,随着干预的进行,参与率逐渐下降[ 23],在另一项研究中,参与率在项目中期显著下降,但在最后一周,即第12周,参与率上升至70% [ 22]。这是一个新的发现,在以前的系统综述中没有报道过。正如人工智能聊天机器人设计文献中所述,用户参与度取决于聊天机器人理解用户背景、建立关系、具有说服力并提供快速反馈的能力[ 34]。因此,对于人工智能聊天机器人来说,通过个性化和富有同情心的互动,与用户建立适当的融洽关系或关系,以实现持续和引人入胜的干预是至关重要的。人工智能专家必须建立全面的实时数据收集途径,以产生准确和个性化的响应。

无偏见的空间

第三,在20%(3/15)的研究中,AI聊天机器人的人文主义和非人文主义结构为用户讨论、分享和询问敏感问题的信息提供了一个安全的空间[ 5 22 23 35]。ml驱动的情绪算法为感知和理解人类情绪提供了潜力[ 36],而 非人类的互动经验或缺乏与人的互动 真正的人类使用户更容易自行披露敏感信息[ 37]。因此,人工智能聊天机器人展示了它们干预弱势群体的潜力,特别是在被污名化的问题方面。例如,青少年的特征是高度的社交焦虑;因此,青少年在寻求心理健康障碍等敏感问题的服务时感到耻辱。在这种情况下,人工智能聊天机器人为青少年提供了足够的隐私和匿名性,让他们自由地表达自己的想法和情绪。这一发现与之前的系统综述相一致,该综述报告了使用匿名来鼓励用户自由表达他们的情绪[ 13]。

可伸缩性

第四,大多数研究(8/ 15,53%)报告称,AI聊天机器人与现有服务的集成门槛较低,但回报很高。大多数传统的行为干预需要亲自提供服务;然而,从实现者的角度来看,这种方法有一些局限性,例如缺乏一致的数据收集、持续监测、可伸缩性和干预的可持续性。人工智能聊天机器人与这些传统服务的整合门槛很低,因为它们不会对现有资源(如专家、时间、金钱和精力)造成压力。聊天机器人可以通过日常使用平台自由部署,用户可以随时访问。聊天机器人的使用可以帮助将行为干预整合到日常临床环境中,避免医疗保健提供者面临的额外压力。例如,聊天机器人可以独立地向用户提供信息传递等低强度服务。此外,聊天机器人可以提供提供者推荐服务,其中,基于对实时用户数据的分析,聊天机器人可以向医疗保健提供者提供建议,以帮助他们提供更有效的服务[ 27]。因此,公共卫生专业人员和医疗保健提供者可以考虑将人工智能聊天机器人集成到现有服务中,作为支持工具,而不是替代品[ 9]。

大多数研究(10/ 15,67%)具有庞大而多样化的样本人群,证明了扩大基于聊天机器人的干预的潜力。几乎一半的研究有>200名参与者,27%(4/15)的研究的样本量在大约920至991,217名参与者之间。同样,所选研究不仅包括具有不同健康和行为状况的样本(13/ 15,87%),如乳腺癌、吸烟、肥胖、不健康饮食模式、缺乏体育锻炼、需要药物治疗的情况、药物滥用,而且还包括没有既往病史的样本(2/ 15,13%)。这证明了人工智能聊天机器人在不同环境下接触大量不同人群的潜力。这是因为人工智能聊天机器人有潜力被整合到广泛使用的现有平台,如文本短信、Facebook Messenger和WhatsApp,并通过智能手机、电脑和Alexa等常用设备部署,这使得它非常有可能接触到大量和多样化的人群。这一发现与之前的系统评估相一致,这些评估报告了人工智能聊天机器人与不同平台的集成,如Slack (Slack Technologies, LLC)、Messenger、WhatsApp和Telegram [ 1 2 14],并使用大样本量,如15项研究中10项的>100名参与者[ 21 23 24 26 27 29- 33]。因此,公共卫生专业人员可以部署人工智能聊天机器人进行教育,促进行为改变,并提供医疗保健服务,以防止影响大量人口的健康问题。

综述研究的局限性和未来研究方向 人工智能聊天机器人的新应用

近75%(11/15)的文章发表在2019年和2021年,这表明使用人工智能驱动的聊天机器人干预行为改变尚处于起步阶段。大多数研究(9/ 15,60%)采用了没有对照组的前-后研究设计,只有27%(4/15)的研究使用了RCT模型,恢复了在基于人工智能的对话代理和健康行为结果之间建立因果关系的不成熟。这一发现与先前许多系统综述相一致,这些综述报道9项研究中有4项为RCT,其余为准实验研究、可行性研究或试点RCT研究[ 9], 10项研究中有2项为随机对照试验,大多数为准实验[ 14], 17项研究中有2项为随机对照试验,大多数为准实验[ 1]。未来的研究需要采用可靠的随机对照试验,在人工智能聊天机器人和健康结果之间建立因果关系。

内部有效性风险

本综述的结果应谨慎解释,因为在所选研究中存在中度至高度的内部有效性风险。在纳入的研究中,由于缺乏关于避免其他干预措施影响的措施和遵守干预方案的程度的信息,来自非预期来源的结果的风险很高。由于缺乏对评估人员隐瞒指定的干预措施,以及缺乏使用经过验证和可靠的结果测量,结果测量中的偏倚风险为中等至高。由于较高的退出率,缺乏估计样本量的功率计算,以及缺乏使用意向治疗分析的信息,分析中的偏倚风险为中等至高。这些发现与先前许多系统综述一致,这些综述报告了由于所有准实验研究中的混杂,来自非预期来源的结果存在中度风险[ 9];结果测量的高风险,因为评估者知道指定的干预措施[ 8 9]或使用未经验证的仪器进行结果测量[ 1 11];由于流失率高,缺乏偏倚校正的分析方法,缺乏幂分析,随访样本量小,分析存在中度偏倚风险[ 2 9]。

不同研究在衡量次要结果(即可行性、可用性、可接受性和参与度)方面也存在不一致。这一发现与先前大多数系统综述一致,这些综述报道了次要结局指标的混合结果[ 1 2 7 9- 11]。首先,这一问题源于在基于聊天机器人的干预措施的背景下,缺乏对次要结果的通用操作定义。其次,由于人工智能聊天机器人干预领域相对较新,对可行性、可用性、可接受性和参与性进行测试的信度和有效性的度量非常少。因此,在选定的研究中,研究人员必须制定自己的评估结果的措施。这导致了各研究中测量方法及其操作定义的不一致。未来的研究应制定这些结果的通用操作定义,以便进行比较和标准化报告。此外,未来基于人工智能聊天机器人的干预研究应遵循美国国立卫生研究院控制干预研究的质量评估标准[ 19来评估他们研究的内在有效性。

缺少AI算法的描述

在这篇综述中,大多数研究(14/ 15,93%)没有描述输入数据的特征和处理,以及与AI算法相关的其他过程。这一发现与之前的系统文献综述一致,该文献综述报告了人工智能软件分类的不一致使用以及所报告的人工智能技术和系统缺乏深度[ 14]。与CONSORT-AI扩展对齐[ 20.],未来的研究需要详细阐述与AI算法相关的以下组成部分:(1)向AI算法提供输入数据的过程,包括允许数据收集的用户界面,输入数据的包含或排除标准,不可用数据的处理,以及建立所收集数据的可信度(例如,指定输入数据的来源);(2)人工智能算法的输出及其与健康相关目标的相关性;(3) AI功能,包括个性化算法的类型,如ML、NLP等,AI算法的版本,以及算法的精度水平;(4)部署的人工智能算法的性能积压,这将表明使用人工智能算法的安全水平,特别是对弱势群体;(5)集成并成功部署AI算法所需的专业知识水平和类型;(6)参与者使用AI聊天机器人所需的技能,这将表明所需资源的数量和使用AI算法的可行性

缺乏概括性

所选的研究不能代表不同的地理、文化和年龄组,这对研究的概括性产生了强烈的偏见。在13项报告地理位置的研究中,所有(100%)都在高收入国家进行;除韩国和日本的研究外,大部分研究(80%)是嵌入西方文化的;大多数研究(>80%)是在成年人(≥18岁)中进行的。这些发现与之前的系统文献综述一致,即所有的聊天机器人干预研究都是在高收入国家进行的[ 2 10 11 14],大多数研究都是在成年人身上进行的[ 2 7],而大多数研究并没有关注少数种族或少数民族[ 2 14]。

为了提高人工智能聊天机器人的有效性和可行性的普遍性,未来的研究需要测试它们在低收入国家或低资源环境以及儿童和青少年中的使用。低收入国家移动连接和互联网使用的增加[ 38]提供了实现基于人工智能聊天机器人的健康行为干预的潜力。人工智能聊天机器人的使用可以解决低收入国家卫生系统面临的挑战,例如缺乏专家、农村地区卫生基础设施有限以及卫生服务获取困难[ 39]。同样,随着青少年越来越多地使用智能手机和最新数字技术,[ 40,人工智能聊天机器人提供了向他们提供吸引人的行为健康干预的机会。基于人工智能聊天机器人的干预措施的非评判性和非污名化属性为青少年在寻求行为健康服务时面临的挑战提供了解决方案,例如感知和实施的污名化和缺乏动力[ 9 40]。

安全与道德

在本综述中,患者安全性的证据有限;然而,有限的证据表明,聊天机器人对行为和心理健康干预是安全的。只有7%(1/15)的研究,即Maher等人的研究[ 22],报告的安全性是指没有不良事件。这一发现与之前的系统文献综述一致,即很少有研究从不良事件的角度讨论参与者的安全性或伦理问题[ 1 2 7 9]及资料保安或私隐[ 2 8]。与AI聊天机器人进行灵活、实时、大量的对话,增加了AI算法出错的概率。这可能会导致意想不到的不利结果,特别是在敏感话题的情况下。因此,在人工智能技术刚刚开始使用的背景下,未来的研究应该从道德和安全的角度评估和报告人工智能的表现。

本文的局限性

这个系统的文献综述有几个局限性。首先,未对回顾的研究进行荟萃分析。由于研究设计、结果报告和结果测量的异质性,作者认为荟萃分析不可行。其次,这篇综述没有涵盖一套全面的行为结果。所选研究只关注3种行为结果:健康的生活方式(体育活动和饮食)、戒烟和治疗或药物依从性。然而,这也是因为作者对AI聊天机器人采用了严格的纳入标准,基于规则的聊天机器人的研究被排除在外,限制了所涵盖的行为结果的数量。三是对表的数据匹配没有量化;因此,没有报告编码器之间的可靠性。但是,数据提取和质量评估是由2位作者独立进行的,然后由作者讨论确定表格。第四,来自外部选定数据库的文章(如谷歌Scholar)、未发表的作品和会议文章、灰色文献(如政府报告)以及其他语言的文章未被包括在内。 Fifth, intervention studies that did not provide a clear description of AI chatbots or did not label AI chatbots as a keyword were excluded.

结论

这篇综述提供了人工智能聊天机器人作为行为改变干预媒介的评估。根据所选研究的结果(N=15), AI聊天机器人在促进健康的生活方式(体育活动和饮食)、戒烟和治疗或药物依从性方面有效。然而,就人工智能聊天机器人在不同环境、不同人群中的可行性、可接受性和可用性而言,这些研究的结果喜忧参半。人工智能驱动的聊天机器人干预的有效结果可以归因于人工智能聊天机器人的基本特征:(1)个性化服务,(2)非判断性的安全对话空间,(3)易于集成到现有服务中,(4)吸引人的体验,以及(5)对大量和多样化人群的可扩展性。然而,考虑到人工智能聊天机器人干预领域尚处于初级阶段,因此需要谨慎解释这一综述的结果,因为大多数纳入的研究都具有中等的内部有效性风险。未来的研究需要采用可靠的随机对照试验,并提供人工智能相关过程的详细描述。总的来说,人工智能聊天机器人具有巨大的潜力,可以集成到现有的行为改变服务中,因为它们(1)易于集成;(2)可负担性、可获得性、可扩展性和可持续性的潜力;(3)以非污名化和参与的方式,就敏感问题向弱势群体提供服务;以及(4)持续收集数据以支持医疗保健提供者决策的潜力。

搜索字符串。

基于美国国立卫生研究院控制干预研究质量评估工具的方法学评估。

基于consortium - ai(联合试验报告标准-人工智能扩展)的聊天机器人干预质量评估。

被评审文章的结果。

综述研究中聊天机器人的特征。

缩写 人工智能

人工智能

李宁公司

CureApp戒烟

认知行为治疗

认知行为疗法

CONSORT-AI

试验报告综合标准-人工智能

卫生保健相关感染

百灵健康教练

健康生活方式指导聊天机器人

毫升

机器学习

NLP

自然语言处理

棱镜

系统评价和元分析的首选报告项目

个随机对照试验

随机对照试验

国家林业局

无烟应用程序

TTM

跨理论模式

XL和SQ构想了研究主题和问题。CCT和AA进行文献检索和筛选。AA、CCT和SQ进行数据提取和分析。AA和SQ制定了初稿。DW审阅了这篇论文,并提供了关键反馈和编辑。所有的作者都审阅了最终的手稿。

本杂志报道的研究由美国国家过敏和传染病研究所资助,资助项目为R01AI127203-5S1。内容仅为作者的责任,并不一定代表美国国立卫生研究院的官方观点。

作者还想感谢南卡罗来纳大学大数据健康科学中心的慷慨资助,该中心是南卡罗来纳大学卓越倡议项目(授予BDHSC-2021-14和BDHSC-2021-11)。

没有宣布。

Laranjo l 邓恩 AG) 霍奇金淋巴瘤 Kocaballi AB J 巴希尔 R Surian D 加利西亚语 B Magrabi F Coiera E 医疗保健中的对话代理:系统回顾 美国医学信息协会 2018 09 01 25 9 1248 58 10.1093 /地点/ ocy072 30010941 5052181 PMC6118869 YJ J 毫升 福冈 Y 对人工智能聊天机器人在促进身体活动、健康饮食和减肥方面的系统综述 国际行为物理法案 2021 12 11 18 1 160 10.1186 / s12966 - 021 - 01224 - 6 34895247 10.1186 / s12966 - 021 - 01224 - 6 PMC8665320 杜阿尔特 一个 沃克 年代 Littlewood E Brabyn 年代 翰威特 C Gilbody 年代 帕尔默 年代 初级保健治疗抑郁症的计算机化认知行为疗法的成本-效益:来自计算机化疗法有效性和可接受性随机评估(REEACT)试验的结果 Psychol地中海 2017 07 47 10 1825 35 10.1017 / S0033291717000289 28228182 S0033291717000289 Gilbody 年代 Brabyn 年代 洛弗尔 K 凯斯勒 D Devlin T 史密斯 l 阿瑞亚 R Barkham 鲍尔 P 库珀 C 诺尔斯 年代 Littlewood E 理查兹 Tallon D 白色 D 有价值的 G REEACT协作 电话支持的计算机化认知行为疗法:REEACT-2大规模实用随机对照试验 精神病学杂志 2017 05 210 5 362 7 10.1192 / bjp.bp.116.192435 28254959 S0007125000281439 Galvão戈梅斯·达·席尔瓦 J 卡瓦纳 DJ Belpaeme T 泰勒 l Beeson K 安德雷德 J 机器人进行动机性访谈的经验:定性研究 J医疗互联网服务 2018 05 03 20. 5 e116 10.2196 / jmir.7737 29724701 v20i5e116 PMC5958282 史蒂芬斯 TN Joerin 一个 Rauws 颂歌 LN 通过人工智能行为指导聊天机器人Tess支持儿童肥胖和前驱糖尿病治疗的可行性 Transl行为医学 2019 05 16 9 3. 440 7 10.1093 / tbm / ibz043 31094445 5489496 Milne-Ives de Cock博士 C Lim E Shehadeh MH 德·彭宁顿 N 摩尔 G Normando E Meinert E 人工智能会话代理在医疗保健中的有效性:系统回顾 J医疗互联网服务 2020 10 22 22 10 e20346 10.2196/20346 33090118 v22i10e20346 PMC7644372 H 曼塞尔 W 年代 对话制剂在心理健康问题治疗中的应用:混合方法系统综述 JMIR Ment Health 2019 10 18 6 10 e14166 10.2196/14166 31628789 v6i10e14166 PMC6914342 Abd-Alrazaq AA Rababeh 一个 Alajlani 比尤伊克 BM Househ 使用聊天机器人改善心理健康的有效性和安全性:系统回顾和元分析 J医疗互联网服务 2020 07 13 22 7 e16021 10.2196/16021 32673216 v22i7e16021 PMC7385637 Vaidyam 一个 Wisniewski H Halamka JD Kashavan 女士 Torous 简森-巴顿 心理健康中的聊天机器人和会话代理:精神病学领域的回顾 《精神病学》 2019 07 64 7 456 64 10.1177 / 0706743719828977 30897957 PMC6610568 Hoermann 年代 麦凯布 吉隆坡 米尔恩 DN 卡尔沃 类风湿性关节炎 基于文本的同步对话系统在心理健康干预中的应用:系统综述 J医疗互联网服务 2017 07 21 19 8 e267 10.2196 / jmir.7023 28784594 v19i8e267 PMC5595406 Provoost 年代 Ruwaard J 成熟 H 临床心理学中的具体会话代理:范围综述 J医疗互联网服务 2017 05 09 19 5 e151 10.2196 / jmir.6553 28487267 v19i5e151 PMC5442350 Scholten 先生 Kelders SM 范Gemert-Pijnen 自我引导的基于web的干预:对用户需求的范围审查和嵌入式会话代理解决这些需求的潜力 J医疗互联网服务 2017 11 16 19 11 e383 10.2196 / jmir.7351 29146567 v19i11e383 PMC5709656 Schachner T 凯勒 R Wangenheim 艘渔船 基于人工智能的慢性病对话代理:系统的文献综述 J医疗互联网服务 2020 09 14 22 9 e20701 10.2196/20701 32924957 v22i9e20701 PMC7522733 莫赫 D Shamseer l 克拉克 Ghersi D Liberati 一个 Petticrew Shekelle P 斯图尔特 PRISMA-P集团 系统评价和元分析方案(PRISMA-P) 2015年声明的首选报告项目 系统加速 2015 01 01 4 1 1 10.1186 / 2046-4053-4-1 25554246 2046-4053-4-1 PMC4320440 博文 DJ Kreuter如此说道 春天 B Cofta-Woerpel l 岭南 l 维纳 D 巴肯 年代 卡普兰 CP 斯魁尔 l 法布里奇奥 C 费尔南德斯 我们如何设计可行性研究 是J Prev Med吗 2009 05 36 5 452 7 10.1016 / j.amepre.2009.02.002 19362699 s0749 - 3797 (09) 00096 - 8 PMC2859314 Nahum-Shani SD 卡彭特 SM 墨菲 SA C 参与数字干预 我Psychol 2022 10 77 7 836 52 10.1037 / amp0000983 35298199 2022-41985-001 PMC9481750 里昂 基于“增大化现实”技术 Pullmann 医学博士 雅各布森 J Osterhage K Achkar Renn BN 芒森 SA Arean 巴勒斯坦权力机构 评估复杂社会心理干预的可用性:干预可用性量表 实施条例实务 2021 2 10.1177 / 2633489520987828 10.1177 / 2633489520987828 35601889 PMC9122125 学习质量评估工具 国家心脏,肺和血液研究所,国家卫生研究院 2021 2022-07-03 https://www.nhlbi.nih.gov/health-topics/study-quality-assessment-tools X 里维拉 SC 莫赫 D 卡尔弗特 乔丹 丹尼斯顿 正义与发展党 SPIRIT-AICONSORT-AI工作组 涉及人工智能干预的临床试验报告报告指南:consortium - ai扩展 BMJ 2020 09 09 370 m3164 10.1136 / bmj.m3164 32909959 PMC7490784 Ryu H H J 使用健康生活方式指导聊天机器人应用程序来促进办公室职员的爬楼梯习惯:探索性随机对照试验 JMIR Mhealth Uhealth 2020 05 19 8 5 e15085 10.2196/15085 32427114 v8i5e15085 PMC7267999 马赫 CA 戴维斯 CR 柯蒂斯 RG CE 墨菲 KJ 由人工智能虚拟健康教练提供的身体活动和饮食计划:概念验证研究 JMIR Mhealth Uhealth 2020 07 10 8 7 e17558 10.2196/17558 32673246 v8i7e17558 PMC7382010 Carrasco-Hernandez l Jodar-Sanchez F Nunez-Benjumea F 莫雷诺康德 J 台面冈萨雷斯 Civit-Balcells 一个 Hors-Fraile 年代 Parra-Calderon CL Bamidis PD Ortega-Ruiz F 移动健康解决方案补充精神药理学支持的戒烟:随机对照试验 JMIR Mhealth Uhealth 2020 04 27 8 4 e17530 10.2196/17530 32338624 v8i4e17530 PMC7215523 Perski O 起重机 D 胡子 E 棕色(的) J 在戒烟应用中加入聊天机器人是否能提高用户的参与度?实验研究 数字健康 2019 9 30. 5 2055207619880676 10.1177 / 2055207619880676 31620306 10.1177 _2055207619880676 PMC6775545 正树 K Tateno H Kameyama N 森野 E 渡边 R 关根身上 K 小野 T Satake K 铃木 年代 野村证券 一个 Betsuyaku T 的巨大 K 新型智能手机应用程序(CureApp Smoking Cessation)对尼古丁依赖的影响:前瞻性单臂介入试点研究 JMIR Mhealth Uhealth 2019 02 19 7 2 e12694 10.2196/12694 30777848 v7i2e12694 PMC6399570 Chaix B Bibault 一个 Delamon G Guillemasse 一个 Nectoux P Brouard B 当聊天机器人与患者见面:对乳腺癌患者与聊天机器人之间对话的一年前瞻性研究 JMIR癌症 2019 05 02 5 1 e12856 10.2196/12856 31045505 v5i1e12856 PMC6521209 Calvaresi D Calbimonte 摩根大通 Dubosson F 纳加尔 一个 舒马赫 戒烟的社交网络聊天机器人:代理和多代理框架 IEEE/WIC/ACM网络智能国际会议 2019 10 WI的19 2019年10月14-17日 希腊塞萨洛尼基 286 92 10.1145/3350546.3352532 斯坦 N 布鲁克斯 K 一项用于减肥的全自动对话人工智能:超重和肥胖成年人的纵向观察研究 JMIR糖尿病 2017 11 01 2 2 e28 10.2196 / diabetes.8590 30291087 v2i2e28 PMC6238835 克鲁岑 R 彼得斯 GJ 葡萄牙 SD 可裂变物质 新兴市场 Grolleman JJ 一种人工智能聊天代理,可以回答青少年有关性、毒品和酒精的问题:一项探索性研究 青少年健康 2011 05 48 5 514 9 10.1016 / j.jadohealth.2010.09.002 21501812 s1054 - 139 x (10) 00430 - 1 Brar Prayaga R Agrawal R B 电子战 高贵的 香港 贴纸 一个 Prayaga RS 健康和人口统计学的社会决定因素对使用对话式人工智能短信解决方案的医疗保险患者补充需求的影响:横断面研究 JMIR Mhealth Uhealth 2019 11 18 7 11 e15771 10.2196/15771 31738170 v7i11e15771 PMC6887813 Prochaska JJ 沃格尔 EA 一个 坎德拉 Baiocchi Pajarito 年代 罗宾逊 一个 减少有问题物质使用的治疗关系剂(Woebot):开发和可用性研究 J医疗互联网服务 2021 03 23 23 3. e24850 10.2196/24850 33755028 v23i3e24850 PMC8074987 路上 绿色 C Vandelanotte C 基于机器学习的物理活动聊天机器人的可行性、可用性和有效性:准实验研究 JMIR Mhealth Uhealth 2021 11 26 9 11 e28577 10.2196/28577 34842552 v9i11e28577 PMC8665384 比克摩尔 太瓦 舒尔曼 D Sidner C 使用对话代理对多种健康行为进行自动化干预 病人教育计数 2013 08 92 2 142 8 10.1016 / j.pec.2013.05.011 23763983 s0738 - 3991 (13) 00211 - 5 PMC3727973 J YJ 兰格 P Z 福冈 Y 人工智能聊天机器人的行为改变模型设计人工智能聊天机器人促进身体活动和健康饮食:观点 J医疗互联网服务 2020 09 30. 22 9 e22845 10.2196/22845 32996892 v22i9e22845 PMC7557439 Radziwill 纳米 本顿 MC 评估聊天机器人和智能会话代理的质量 arXiv 2017 4 15 Brandtzæg PB Skjuve Dysthe Følstad 一个 当社交变得非人类:聊天机器人中年轻人对社会支持的感知 计算系统中的人为因素2021年CHI会议论文集 2021 5 气的21 2021年5月8日至13日 日本横滨 257 10.1145/3411764.3445318 l 史密斯 一个 约翰逊 C J 安德森 雷尼 l 新兴经济体的移动连接 皮尤研究中心 2019 3. 7 2022-04-08 https://www.pewresearch.org/internet/2019/03/07/mobile-connectivity-in-emerging-economies/ 戴利 K Hungerbuehler Cavanagh K 克拉洛雪茄烟 HG 史温顿 巴勒斯坦权力机构 卡普 心理健康聊天机器人的参与度和有效性的初步评估 前指生命值 2020 11 30. 2 576361 10.3389 / fdgth.2020.576361 34713049 PMC8521874 安德森 J 青少年,社交媒体和技术2018 皮尤研究中心 2018 5 31 2022-04-08 https://www.pewresearch.org/internet/2018/05/31/teens-social-media-technology-2018/ 格罗夫 C 与年轻人共同开发一个心理健康和幸福聊天机器人 前精神病学 2021 2 1 11 606041 10.3389 / fpsyt.2020.606041 33597898 PMC7882508
Baidu
map