发表在第9卷第4期(2022):10 - 12月

本文的预印本(早期版本)可在以下网站获得https://preprints.www.mybigtv.com/preprint/35882,第一次出版
聊天机器人在公共卫生领域的发展和使用:范围审查

聊天机器人在公共卫生领域的发展和使用:范围审查

聊天机器人在公共卫生领域的发展和使用:范围审查

审查

1昆士兰大学未来政策中心,澳大利亚昆士兰圣卢西亚

2剑桥大学计算机科学与技术系,英国剑桥

通讯作者:

李。威尔森博士

政策期货研究中心

昆士兰大学

米基大厦3楼(9)

圣卢西亚,昆士兰,4072

澳大利亚

电话:61 0795318198

电子邮件:l.wilson7@uq.edu.au


背景:聊天机器人是一种提供类似对话界面的计算机程序,人们可以通过它访问信息和服务。COVID-19大流行推动了聊天机器人的使用大幅增加,以支持和补充传统卫生保健系统。然而,尽管聊天机器人的使用得到了重视,但支持在公共卫生领域开发和部署聊天机器人的证据仍然有限。最近的综述集中在COVID-19大流行期间聊天机器人的使用,以及更普遍的会话代理在医疗保健中的使用。本文对该研究进行了补充,并通过评估在公共卫生领域使用聊天机器人的研究证据的广度和范围,填补了文献中的空白。

摘要目的:这次范围审查有3个主要目标:(1)确定在公共卫生领域有最多证据证明聊天机器人的发展和使用的应用领域;(2)确定在这些领域部署的聊天机器人的类型;以及(3)确定在公共卫生应用中评估聊天机器人的方法和方法。本文根据对聊天机器人使用证据的分析,探讨了在公共卫生领域发展和部署聊天机器人的未来研究的意义。

方法:根据范围审查的PRISMA-ScR(系统审查和meta分析扩展范围审查首选报告项目)指南,从2021年6月中旬至8月,通过在MEDLINE、PubMed、Scopus、Cochrane对照试验中央登记处、IEEE Xplore、ACM数字图书馆和开放灰色数据库中进行搜索,确定了相关研究。如果为了预防或干预的目的而使用或评估聊天机器人,且有证据表明对健康有明显影响,则纳入研究。

结果:在确定的1506项研究中,有32项纳入了该综述。结果显示,在疫情爆发前不久的过去几年里,人们对聊天机器人的兴趣大幅增加。一半(16/ 32,50%)的研究评估了应用于心理健康或COVID-19的聊天机器人。这些研究表明,聊天机器人的应用前景看好,特别是在容易自动化和重复的任务中,但总体而言,目前没有证据证明聊天机器人在所有领域的预防和干预效果。

结论:需要更多的研究来充分了解在公共卫生中使用聊天机器人的有效性。考虑到聊天机器人在实践中被采用的速度,对其在医疗保健中使用的临床、法律和伦理方面的担忧是有充分理由的。今后关于它们使用的研究应通过发展专门知识和公共卫生方面的最佳做法,包括更加注重用户体验,来解决这些问题。

JMIR Hum Factors 2022;9(4):e35882

doi: 10.2196/35882

关键字



谷歌的首席执行官Sundar Pichai在最近的一次采访中表达了他的观点,他认为人工智能(AI)对人类的影响将比火、互联网或电的出现更深远[1].尽管皮查伊在宣传人工智能增强的未来愿景方面有既得利益,但毫无疑问,计算技术的进步正在推动我们与计算系统、组织、彼此和世界的互动方式迅速转变。这种快速变化的技术图景的一个显著特征是对话代理(或称“聊天机器人”)的蓬勃发展和使用。

聊天机器人——一种旨在进行类似人类对话的交互的软件程序——正越来越多地应用于我们日常生活的许多方面。它们模仿自然语言对话,以促进人类和计算机之间的交互,也被称为“对话代理”、“对话助手”或“智能虚拟助手”,它们可以支持语音和文本对话。早期著名的聊天机器人包括ELIZA(1966;“一个模仿罗杰斯式心理治疗师”),PARRY (1972;模拟偏执型精神分裂症患者的聊天机器人,由一名精神病学家针对ELIZA开发)和ALICE (1995;一个通用对话聊天机器人,受ELIZA启发)[2].聊天机器人技术的发展和应用最近取得的进展,以及信使平台的迅速普及,推动了自2016年以来聊天机器人使用和开发的爆炸式增长[3.].自然语言处理(NLP;包括语音识别、文本到语音、语音到文本、自然语言理解和自然语言生成),以及商业“虚拟助手”的出现和推广,如Siri、谷歌Now、Cortana和Alexa [4将人工智能带入了我们日常生活的许多方面。现在,人们发现聊天机器人应用于商业和电子商务、客户服务和支持、金融服务、法律、教育、政府和娱乐,并越来越多地应用于卫生服务提供的许多方面[5].

持续的COVID-19大流行进一步推动了聊天机器人的迅速普及和部署[6],其中许多利用商业聊天机器人开发平台,如IBM的Watson Assistant、谷歌Dialogflow、Yellow Messenger和Turn。IO开发定制聊天机器人来帮助对抗这种疾病。面对大流行给卫生保健系统带来的负担,聊天机器人实现了服务自动化,以满足保持身体距离的需求,并帮助传播信息,缓解全球公共卫生系统对医疗服务的压力[78].

使用人工智能进行大规模症状检查和分诊现在已成为世界许多地区的常态,标志着以人为本的医疗保健正在远离[9在非常短的时间内。世界卫生组织(世卫组织)认识到有必要在实地提供指导,最近发布了一套关于在卫生领域使用人工智能的伦理和原则的准则[10].世卫组织本身利用聊天机器人提供指导,并通过其健康警报聊天机器人打击关于COVID-19的错误信息[11通过WhatsApp、Viber和Facebook messenger使用多种不同的语言进行交流,据报道,该应用已经覆盖了超过1200万人[12].

鉴于为支持公共卫生服务而部署的聊天机器人数量急剧增长,迫切需要进行研究,以帮助指导其战略发展和应用[13].本文旨在帮助解决这一赤字问题。我们研究了聊天机器人在公共卫生领域的发展和使用的证据,以评估该领域的当前状态,聊天机器人最多产的应用领域,以及聊天机器人被评估的方式。通过回顾目前的证据,我们发现了当前知识中的一些空白,以及为公共卫生服务开发和使用聊天机器人的可能下一步步骤。我们的研究问题如下。

  1. 关于在公共卫生领域使用聊天机器人的证据告诉我们什么?
  2. 在公共卫生的哪些领域中,聊天机器人的使用最为频繁?
  3. 在公共卫生领域使用的聊天机器人有哪些类型?
  4. 如何评估聊天机器人在公共卫生领域的作用?
  5. 从在公共卫生领域使用聊天机器人的证据中可以学到什么潜在的教训?

我们对在公共卫生领域使用聊天机器人的研究进行了范围审查。我们遵循Arksey和O’malley的PRISMA-ScR(系统评审和范围评审元分析扩展的首选报告项目)指南和方法框架[14的范围研究,并在2021年6月的两周时间内在MEDLINE、PubMed、Scopus、Cochrane中央对照试验登记册、IEEE Xplore、ACM数字图书馆和开放灰色数据库上搜索研究的标题和摘要。我们的搜索词包括“聊天机器人”、“对话代理”以及它们的同义词、公共卫生、全球公共卫生和相关词汇多媒体附录1).我们选择将搜索范围扩大到包括医疗保健和健康,以更广泛地了解聊天机器人用于健康相关目的的应用领域。领域分类分为三种分配方式:(1)由作者自行确定,(2)根据当前公共卫生部门的定义进行分类,(3)根据聊天机器人的设计范围进行分配。关于心理健康,我们进一步区分了专门为未确诊患者提供社会支持的聊天机器人,将其定义为“咨询/支持”,以及那些旨在处理抑郁症等临床疾病的聊天机器人,将其定义为“心理健康”。

人工智能和数字技术的使用以及它们在卫生领域的作用往往会模糊人口与临床卫生之间的界限——也就是说,用于满足个人卫生需求的聊天机器人在应用中往往与人口层面的卫生同样相关。在这方面,基于人群的预防与个体层面的临床护理之间的综合[15变得尤为重要。聊天机器人等数字技术所隐含的效率和规模水平为提供医疗保健开辟了新的可能性,可以将个人层面的医疗保健扩展到人口层面。因此,我们纳入了旨在向个人提供卫生服务的聊天机器人的研究,这些研究有明显的健康影响的证据,而且重要的是,它们有可能提高可扩展的效率,以支持人口层面的卫生结果。

我们的选择方法如下。其中一名作者筛选了通过数据库搜索找到的研究的标题和摘要,选择了被认为符合资格标准的研究。然后第二个作者随机筛选了50%的同一组已确定的研究,以验证第一作者的选择。在标题和摘要筛选阶段,两位作者分别检索和审查了符合纳入标准的论文,随后讨论了差异和解决方案,以达成一致的纳入研究清单结束。

我们的入选标准是为了预防或干预的目的而使用或评估聊天机器人,并有证据表明对健康有明显影响的研究。我们包括了一些实验研究,其中聊天机器人进行了试验,显示出了对健康的影响。我们还包括了正在推出的代理的可行性研究,随机对照试验(rct)告知会话代理的可行性,这些代理具有明显的可扩展性适用性和人口水平干预的潜力,以及在职聊天机器人的比较分析。我们选择不区分具体化会话代理和基于文本的代理,包括这两种模式,以及带有基于卡通界面的聊天机器人。

我们排除了思想实验、对尚未实现的系统的设计概要和思考、拟议的聊天机器人和对话代理的描述、系统架构的原型、调查和预设计分析、框架、评论、验证研究、介绍代理的技术论文,这些论文解释了尚未试验的代理的架构和设计,以及探索用户对数字代理的感知或其可接受性或有效性的论文。我们也排除了比较技术方法(如消息传递)差异影响的研究和使用“绿野仙踪”协议的研究。“绿野仙踪”协议是一种用于测试用户反应的协议,在该协议中,人类通过一个界面对用户做出反应,用户认为他们是在与计算机交互。评审选择过程如图所示图1

图1所示。评估选择过程。
把这个图

包括研究

共有32项研究符合纳入标准。这些研究包括随机对照试验(n=12)、用户分析(n=8)、用户体验研究(n=3)、试点试验(n=1)、描述性研究(n=1)、比较分析(n=2)、病例对照研究(n=1)、设计过程(n=2)和可行性研究(n=2)。这些研究分布在11个应用领域。

心理健康和COVID-19主导了应用领域。这一结果可能是心理健康领域关于使用聊天机器人的研究成熟的产物,以及使用聊天机器人帮助抗击COVID-19的大量增加。的图图2因此反映了应用领域研究的成熟度和这些领域研究的存在,而不是已经进行的研究的数量。

图2。跨应用程序域分发所包含的出版物。心理健康研究和COVID-19构成了大多数研究。由于论文数量较少,必须谨慎地解释百分比,只表明该领域的研究存在,而不是研究的准确分布。
把这个图

公共卫生领域聊天机器人研究的成熟度

研究的时间轴,见图3这并不奇怪,因为从2016年开始,人们对聊天机器人的兴趣激增。尽管在聊天机器人的吸收和使用方面,卫生服务总体上落后于其他部门,但自2016年以来,人们对心理健康等应用领域的兴趣越来越浓厚。这一发现可能反映了对话技术在何种程度上有助于精神卫生领域使用的各种互动方法,以及对实地卫生从业人员使用的方法进行更严格审查的必要性。

同样,人们可以看到通过使用聊天机器人对COVID-19的快速反应,这既反映了在分诊和信息工作中使用聊天机器人的实际需求,也反映了大流行的时间轴。

图3。跨应用领域和出版年份的出版物分布。随着时间的推移,人们对心理健康研究一直很感兴趣,与covid -19相关的研究如预期的那样,最近表现出强烈的兴趣。
把这个图

聊天机器人设计

在聊天机器人的开发中,详述任何以用户为中心的设计方法的研究属于少数(3/ 32,9%)[16-18].大多数(22/32,69%)的论文只大致描述了聊天机器人中可用的消息内容(例如,涉及的主题)和用户可用的功能(例如,每日提醒),但很少有人描述了决定这些功能和能力的过程。

一项突出的研究是Bonnevie及其同事的工作。16的发展蕾拉在意外怀孕风险较高的人群中,这是避孕和性健康方面值得信赖的信息来源。蕾拉是通过基于社区的参与式研究来设计和开发的,在这种研究中,将从聊天机器人中受益的社区也对它的设计有发言权。蕾拉展示了人工智能在增强社区主导的卫生干预方面的潜力。这些方法也提出了关于知识生产的重要问题,人们担心人工智能在更广泛的范围内正在进行清算。19].

在纳入的研究中,三分之二(21/ 32,66%)的聊天机器人是在网络上的定制开发平台上开发的[61620.-26],适用于流动装置[2127-36],或个人电脑[3738].还有一小部分(8.32,25%)的聊天机器人部署在Facebook Messenger、Telegram或Slack等现有的社交媒体平台上。39-44];使用短讯短讯[4245];或谷歌Assistant平台[18)(见图4).

所有纳入的研究都测试了文本输入聊天机器人,其中用户被要求打字发送消息(自由文本输入)或从列表中选择一个短语(单一选择输入)。只有4项研究纳入了以语音回应的聊天机器人[24253738];其他所有的研究都包含了用文字回应的聊天机器人。

大多数研究(28/ 32,88%)对聊天机器人的技术实现描述非常少,这使得从这个角度对聊天机器人进行分类非常困难。大多数(19/32,59%)纳入的论文包含了用户界面的截图。然而,有些只提供了界面的草图,而且通常情况下,详细描述聊天机器人功能的文本与文本附带的图片不一致(例如,聊天机器人被描述为自由进入,但截图显示的是单一选择)。在这种情况下,我们将聊天机器人标记为使用组合输入法(参见图5).

令人惊讶的是,在应用程序域、聊天机器人的目的和通信模式之间没有明显的关联多媒体附录268916-1820.-45])。一些研究确实表明,使用自然语言并不是积极的会话用户体验的必要条件,特别是用于自动填写表单的症状检查代理[846].然而,在另一项研究中,不能自然交谈被视为与聊天机器人互动的一个消极方面。20.].

聊天机器人角色的呈现(参见图6)通常以静态化身的形式呈现(n=17)。在这些聊天机器人中,8个被赋予了拟人化的化身,无论是照片还是绘画(例如,剪贴画),而其余的则采用了机器人、动物、卡通或其他抽象的化身。具身对话代理(n=5)仅以“女性”类人化身的形式呈现。在那些没有头像的用户中(n=6),这种缺失通常是由于平台限制(如WhatsApp或某些形式的嵌入式网络聊天)。虚拟形象的存在和聊天机器人的拟人化外观的影响仍然是一个研究不足的领域,但我们预计它将对医疗保健领域的未来聊天机器人设计具有特别重要的意义。

图4。聊天机器人平台在纳入研究中的分布。PC:个人电脑。
把这个图
图5。用户给聊天机器人发消息的方式要么是从一组预定义的选项中选择,要么像典型的消息应用程序那样自由输入文本。
把这个图
图6。聊天机器人化身的展示。
把这个图

基于聊天机器人的健康干预的有效性证据

纳入的研究包括随机对照试验(n=12)、用户分析(n=8)、用户体验研究(n=3)、试点试验(n=1)、描述性研究(n=1)、比较分析(n=2)、病例对照研究(n=1)、设计过程(n=2)和可行性研究(n=2)。

对于rct,参与者的数量在20到927之间变化,而用户分析研究考虑了129到36070名用户的数据。总的来说,发现的证据是积极的,显示出一些有益的影响,或混合的,显示出很少或没有影响。证据主要是初步的和上下文相关的。大部分(21/ 32,65%)纳入的研究表明,聊天机器人是可用的,但在用户体验方面存在一些差异,它们可以在不同的健康领域提供一些积极的支持。

在知识和技能提高方面的几项研究发现了中等积极的结果[20.39,减少健康风险[25],以及支持饮食和体育锻炼[31],并且有一些初步证据表明,支持戒烟的聊天机器人可以提高戒烟的机会[36].

关于使用聊天机器人治疗心理健康(尤其是焦虑和抑郁)的研究似乎也显示出了潜力,用户至少在一些测量中报告了积极的结果[333441].该研究表明,心理治疗聊天机器人可以作为更广泛的心理治疗过程的一部分作为辅助工具[21)在广泛的心理治疗方法和方法(见多媒体附录2查看聊天机器人角色的摘要)。

研究发现,聊天机器人通过减少筛查时间改善了医疗服务的提供[17并对有COVID-19症状的人进行分类,在需要时指导他们进行检测。这些研究明确表明,在COVID-19大流行的早期阶段,聊天机器人是应对大量人口的有效工具。然而,1比较研究[22]显示,在10个基于web的症状检查器之间,正确评估的COVID-19病例数量差异很大,只有2个聊天机器人在敏感性(没有将几乎所有患者归类为COVID-19阳性)和特异性(没有将所有患者归类为COVID-19阴性)之间取得了良好的平衡。总的来说,这一结果表明,尽管聊天机器人可以实现有用的可伸缩性属性(处理许多情况),准确性是需要积极关注的,而且它们的部署需要基于证据的[23].

关于使用聊天机器人来支持行为改变的证据有好有坏。一项研究发现,任何影响都仅限于那些已经在考虑做出这种改变的用户。24,另一项研究为老年人的健康教练提供了初步证据[31].另一项研究报告称,尽管完成率很高,但支持问题赌徒并没有显著效果[40].

关于依从性也报告了混合的结果。一项研究发现,坚持血压监测计划没有效果[39],而另一项报告称药物依从性有积极改善[35].

关于在公共卫生服务提供中使用聊天机器人的研究还处于早期阶段。虽然初步结果确实表明在一些应用领域产生了积极影响,但报告的结果在大多数情况下是好坏参半的。此外,不同的用户对聊天机器人的参与度(尽管不一定与效果相关]36),研究的规模,以及目标人群的人口统计学特征(例如,某些人群更有可能使用聊天机器人获得更好的体验[18)是可能影响干预效果的少数变量之一。

聊天机器人设计评估

大多数研究(26/ 32,81%)使用定量方法和方法学评估聊天机器人设计及其对健康结果的影响。在大多数情况下,定性方法被用于检查聊天机器人对患者的可接受性,以及患者在使用聊天机器人和其他定量可用性指标时的自我报告体验[45].用户体验和可用性评估由结构化问卷和调查组成,通常包含一些开放式问题(n=11),只有一项研究使用了焦点小组(n=1)。

到目前为止,评估聊天机器人主导的干预措施的健康影响最普遍的方法是随机对照试验(n=12)。专注于聊天机器人对分配任务的有效性的研究,如分诊和症状检查,更容易通过用户分析进行评估(n=8)。然而,对用户体验的评估有限(n=3),聊天机器人的开发很少由设计主导——尽管有明显的例外,有一项研究确定了开发中的用户原则[17];1项研究遵循以人为中心的设计过程,对接受癌症治疗的年轻人进行研究[43];另一个是利用基于社区的参与式研究开发聊天机器人[16].在对广泛部署的聊天机器人进行评估时注意到的另一个限制是,聊天机器人收集的用于进一步分析的数据不包含个人身份信息,因此不可能知道目标人群是否为实际用户[16].

没有纳入的研究报告直接观察(在实验室或原位;例如,民族志)或深度访谈作为评价方法。鉴于已认识到需要对用于公共卫生的聊天机器人进行观察性研究[28]以及目前在人机交互(HCI)中广泛使用的观察式和参与式方法[47],未来的聊天机器人研究有动力依赖这些方法,如果他们的开发是最好的支持其用户。


主要研究结果

尽管关于在公共卫生领域使用聊天机器人的研究尚处于早期阶段,但技术的发展和抗击COVID-19的紧迫性推动了聊天机器人的使用大幅增加,尤其是在分诊方面。关于使用聊天机器人治疗心理健康(特别是抑郁症)的研究似乎也显示出了潜力,用户报告了积极的结果[333441].在2019冠状病毒病大流行之前,关于聊天机器人在心理健康方面的治疗性使用的研究仍主要是实验性的。然而,聊天机器人的研究领域还处于起步阶段,目前还没有证据证明聊天机器人在所有领域的预防和干预效果。

值得注意的是,人们似乎更愿意在与聊天机器人交谈时分享敏感信息,而不是与其他人交谈。20.].在某些情况下,与聊天机器人而不是与人交谈被认为是一种积极的体验,因为人们认为聊天机器人不那么“挑剔”。48].与聊天机器人的类人互动似乎对支持健康和幸福有积极贡献[27]以及通过提供陪伴和支持来对抗社会排斥的影响[49].然而,在其他使用领域,人们担心AI症状检查器的准确性[22建立了与聊天机器人界面的关系。信息的可信度和准确性是人们放弃咨询诊断聊天机器人的原因[28],并承认有必要对人工智能算法进行临床监督[9].

尽管COVID-19大流行推动了聊天机器人在公共卫生领域的使用,但令人担忧的是,各国政府在抗击疾病的过程中以安全为由获取信息的程度。例如,在韩国,实施综合技术应对措施,包括个性化通信聊天机器人和使用收集的个人数据进行接触者追踪[50),在使用人工智能时,侵犯了许多人认为是基本人权的隐私。商业实体和政府机构共享通过COVID-19症状检查收集的健康数据,对数据隐私法和司法管辖权边界提出了进一步挑战[51].

大多数纳入的研究引用的证据要么是测量干预的效果,要么是表面和自我报告的用户满意度。几乎没有定性的实验证据能够提供对人与聊天机器人互动的更实质性的理解,比如参与者观察或深度访谈。在这方面,我们应该记住,聊天机器人是复杂的系统,在公共卫生领域部署聊天机器人是一种技术设计活动(平台的设计、交流方式和内容的设计),就像它是一种医疗干预(干预的设计和为其有效性设置措施)。作为HCI和公共卫生研究的交叉学科,研究必须满足这两个领域的标准,而这两个领域有时是相互矛盾的[52].为评估药理干预措施而开发的方法,如rct,旨在评估干预措施的有效性,在HCI和相关领域是已知的[53他们为更好的设计提供的见解受到限制。

现有研究中的研究往往不能提供关于被测试聊天机器人的设计的充分信息,包括RCT标准,因为聊天机器人的描述不足以实现一个等价的聊天机器人。干预设计中还有更多的混杂因素,这些因素与聊天机器人没有直接关系(例如,输入情绪数据的每日通知),或者包括聊天机器人编程的个性等方面,这些因素会对人们产生不同的影响[33].作为一个新兴的研究领域,未来人类与人工智能和聊天机器人界面的交互影响是不可预测的,因此需要标准化的报告、研究设计[5455,以及评估[56].

纳入的研究中很少讨论他们如何处理安全问题,即使只是在设计阶段。在那些做到了的研究中,研究人员提到,他们无法提供一个人来支持聊天机器人(即,与聊天机器人的对话不受人监控),所以聊天机器人被编程为在用户遇到问题时通知用户联系官方卫生当局(例如,指示用户拨打911)。当聊天机器人大规模使用或在诸如心理健康等敏感情况下使用时,这种方法尤其值得关注。在这方面,聊天机器人可能最适合作为现有医疗实践的补充,而不是替代[2133].

对未来研究的启示

虽然在卫生领域使用自然语言处理是一个新的领域[47],它是计算机科学和人机交互的一个深入研究的领域。在开发和部署新的技术干预措施时,必须注意确定这些干预措施可能复制或放大现有不平等的方式,例如获取语言熟练程度、技术知识、智能手机技术、移动数据,甚至电力[9].在人机交互和计算机科学中使用的以人为本的设计过程,特别是那些在整个设计过程中让目标用户参与的设计过程,如参与式设计、协同设计和参与式行动研究,可能是从一开始就解决现有不平等的有用方法[57].

大多数被收录的论文都包含了聊天机器人的截图。然而,其中一些只是界面的草图,而不是最终的用户界面,而且大多数截图对功能的描述都不充分。尽管对聊天机器人的技术描述可能单独构成论文,但这些描述超出了我们关注公共卫生证据的范围。然而,此前发表的一份范围审查[58],重点关注聊天机器人实现医疗用途的技术方面,区分文本理解模式(例如,模式匹配、机器学习、固定输入和混合)、数据管理(医疗知识库、用户信息数据库和对话脚本)和文本生成(固定输出和机器学习)。进一步的范围研究将有助于更新用于与covid -19相关聊天机器人的技术策略的分布。

未来对聊天机器人的研究将受益于包括更多的细节,如聊天机器人是如何实现的,它使用什么类型的NLP,并交叉引用描述系统实现和技术贡献的等效技术论文(如果有的话)。

更广泛地说,在一个快速发展的技术领域,有来自行业参与者的大量投资,需要更好的报告框架,详细描述用于聊天机器人开发的技术和方法。同样,鉴于聊天机器人在各种各样的公共卫生领域的广泛部署,有必要制定比较标准的标准,以便更好地评估和验证这些代理以及它们用于改善健康和福祉的方法和途径。最后,需要了解和预测这些技术可能出错的方式,并确保有充分的保障框架来保护这些技术的用户并让他们有发言权。

限制

鉴于聊天机器人研究的不成熟、在其开发和使用方面的巨大投资以及人工智能和人机交互的动态性质,我们的研究没有捕捉到公共卫生应用领域开发的大量聊天机器人,包括商业和其他方面。在聊天机器人设计和健康影响方面的学术知识的产生与该领域的进展之间存在很大的滞后。

结论

在公共卫生领域,人工智能的最新进展使得对话代理能够与人类进行更现实的互动,这方面的研究仍处于初级阶段。研究显示出了潜力,特别是对于容易自动化和重复的任务,但与此同时,考虑到会话代理在实践中被采用的速度,对其在医疗保健中使用的临床、法律和伦理方面的担忧是有充分根据的。目前还没有临床试验和深入的定性研究形式的证据支持聊天机器人的广泛使用,而这在心理健康等敏感领域尤其必要。大多数用于咨询和治疗服务等辅助领域的聊天机器人仍处于试验阶段,或作为试点和原型进行试验。在有证据的地方,它通常是好坏参半的或有希望的,但在聊天机器人的有效性方面有很大的变化。这一发现在一定程度上可能是由于聊天机器人的设计有很大的可变性(如内容、特征和外观的差异),但用户对聊天机器人的反应也有很大的可变性。

毫无疑问,包括聊天机器人在内的人工智能在公共卫生领域的使用将继续增长。这种增长带来了相当大的道德困境,我们最好警惕新技术的魅力。59].最重要的是需要了解在什么情况下我们可以使用自动化而不是其他连接人类的技术(例如,机器辅助而不是机器智能),以及在什么情况下,与模拟另一个人的计算机对话确实满足了这个人的需求。例如,最近发表的《世卫组织卫生领域人工智能伦理和治理指南》[10是朝着实现这些目标和围绕人工智能的使用制定一个人权框架迈出的一大步。然而,正如隐私国际在审查世卫组织指南时所评论的那样,指南在挑战使用人工智能必然会带来更好结果的假设方面做得还不够充分[60].理想情况下,公共卫生领域的数字创新应以衡量聊天机器人等技术可能对卫生干预措施产生的影响、洞察用户体验并致力于确保用户安全和促进用户福祉的研究为依据。

的利益冲突

作为本文基础的原始研究是受世界卫生组织委托进行的。MM是Katikati的承包商,Katikati是一家社交技术初创公司,能够通过短信、即时消息或网络实现1对1的人机对话。

多媒体附录1

搜索条件。

DOCX文件,15 KB

多媒体附录2

聊天机器人应用领域、目的、交互类型和结果摘要。

DOCX文件,33 KB

  1. 在《Amol Rajan访谈》中,Amol Rajan采访桑达尔·皮采。英国广播公司2。URL:https://www.bbc.co.uk/iplayer/episode/m000xwll/amol-rajan-interviews-sundar-pichai[2021-07-22]访问
  2. 聊天机器人技术综述。见:IFIP信息与通信技术进展,第584卷。报告:AIAI 2020:人工智能应用与创新;6月5日至7日,2020;Neos Marmaras,希腊,第373-383页。[CrossRef
  3. 聊天机器人:改变用户需求和动机。2018年8月22日;25(5):38-43。[CrossRef
  4. Borah B, Pathak D, Sarmah P, Som B, Nandi S.基于文本的聊天机器人的最新技术综述。见:计算机与信息科学中的通信,第1031卷。2019年6月26日出席:CICBA 2018:计算智能、通信和商业分析;2018年7月27日至28日;印度Kalyani,第84-96页。[CrossRef
  5. 黑山JLZ,哥斯达黎加达科斯塔,罗萨莱吉共和国健康对话媒介调查。Expert Syst app 2019 Sep;129:56-67。[CrossRef
  6. 麦基洛普M,南BR,普里宁格A,梅森M,杰克逊GP。利用对话技术回答COVID-19常见问题。J Am Med Inform Assoc 2021年3月18日;28(4):850-855 [免费的全文] [CrossRef] [Medline
  7. Almalki M, Azeez F.用于抗击COVID-19的卫生聊天机器人:范围综述。通知医学学报2020年12月28日(4):241-247 [免费的全文] [CrossRef] [Medline
  8. Höhn S, Bongard-Blanchy K. COVID-19聊天机器人的启发式评估。见:计算机科学课堂讲稿,卷12604。发表于:对话2020:聊天机器人研究与设计;2020年11月23 - 24日,;虚拟事件第131-144页。[CrossRef
  9. 赖L, Wittbold KA, Dadabhoy FZ, Sato R, Landman AB, Schwamm LH,等。数字分诊:应对COVID-19大流行的人口健康管理新策略。卫生(Amst) 2020年12月;8(4):100493 [免费的全文] [CrossRef] [Medline
  10. 卫生领域人工智能的伦理和治理:世卫组织指导。世界卫生组织,2021年6月28日。URL:https://www.who.int/publications/i/item/9789240029200[2022-08-30]访问
  11. 世界卫生组织的健康警报:用WhatsApp沟通全球大流行。J Bus Tech comm2020年9月16日;35(1):35-40。[CrossRef
  12. 世卫组织在Facebook Messenger上推出一个聊天机器人,以抗击COVID-19错误信息。世界卫生组织2020年4月15日。URL:https://www.who.int/news-room/feature-stories/detail/who-launches-a-chatbot-powered-facebook-messenger-to-combat-covid-19-misinformation[2021-07-21]访问
  13. Gabarron E, Larbi D, Denecke K, Årsand E。关于聊天机器人在公共卫生方面的使用,我们知道些什么?种马健康技术通知2020年6月16日;270:796-800。[CrossRef] [Medline
  14. 阿克西,欧马利。范围研究:迈向方法论框架。国际社会计量方法2005年2月;8(1):19-32。[CrossRef
  15. 科普兰JP、邦德TC、默森MH、雷迪KS、罗德里格斯MH、塞万坎博NK、全球卫生大学联盟执行委员会。朝着全球卫生的共同定义迈进。Lancet 2009 june 06;373(9679):1993-1995。[CrossRef] [Medline
  16. Bonnevie E, Lloyd T, Rosenberg S, Williams K, Goldbarg J, Smyser J. Layla’S Got You:为黑人和西班牙裔年轻女性开发量身定制的避孕聊天机器人。健康教育杂志2020年12月18日;80(4):413-424。[CrossRef
  17. Judson TJ, Odisho AY, Young JJ, Bigazzi O, Steuer D, Gonzales R,等。实施数字聊天机器人,在COVID-19大流行期间筛查卫生系统员工。J Am Med Inform Assoc 2020 july 01;27(9):1450-1455 [免费的全文] [CrossRef] [Medline
  18. Roman M, Bellei EA, Biduski D, Pasqualotti A, De Araujo CDSR, De Marchi ACB。"嘿,助手,我怎么才能成为献血者?"这是一个对话代理的案例,旨在让人们参与献血。J Biomed Inform 2020 july;107:103461 [免费的全文] [CrossRef] [Medline
  19. Bechmann A, Bowker G.没有任何其他名字的监督:社交媒体上人工智能中知识生产的隐藏层。2019大数据与社会2月05日;6(1):205395171881956。[CrossRef
  20. 前田E,宫田A, Boivin J,野村K,熊泽Y,白泽H,等。使用聊天机器人促进生育意识和孕前健康:一项随机对照试验。生物医学在线2020年12月41(6):1133-1143。[CrossRef] [Medline
  21. 徐波,庄铮。心理治疗聊天机器人研究概况。concurrent Comput 2020 12月28日;34(7):2020。[CrossRef
  22. Munsch N, Martin A, Gruarin S, Nateqi J, Abdarahmane I, Weingartner-Ortner R,等。基于web的COVID-19症状检查器的诊断准确性:比较研究。J Med Internet Res 2020 Oct 06;22(10):e21299 [免费的全文] [CrossRef] [Medline
  23. 莫思凯,奥斯特伯格NP,琼斯VG,陈AS。大型综合卫生系统中数字症状检查器的使用特性和分诊灵敏度:基于人群的描述性研究。J Med Internet Res 2020年11月30日;22(11):e20549 [免费的全文] [CrossRef] [Medline
  24. Gardiner P, Bickmore T, Yinusa-Nyahkoon L, Reichert M, Julce C, Sidduri N,等。利用健康信息技术使非裔美国妇女参与孕前期间的营养和补充剂使用。Front Endocrinol(洛桑)2020年1月19日;11:571705 [免费的全文] [CrossRef] [Medline
  25. Jack BW, Bickmore T, Yinusa-Nyahkoon L, Reichert M, Julce C, Sidduri N,等。利用健康信息技术改善孕前期年轻非裔美国妇女的健康:一项随机对照试验柳叶刀数字健康2020年9月2日(9):e475-e485 [免费的全文] [CrossRef] [Medline
  26. 豪兹WE, Exadaktylos A, Sauter TC。2019冠状病毒病疫情期间的在线正向分诊。新兴医学杂志2021年3月11日;38(2):106-108 [免费的全文] [CrossRef] [Medline
  27. Ta V, Griffith C, Boatfield C, Wang X, Civitello M, Bader H,等。日常环境中同伴聊天机器人的社会支持的用户体验:主题分析。J Med Internet Res 2020年3月06日;22(3):e16235 [免费的全文] [CrossRef] [Medline
  28. 王粉丝X,曹国伟D,张Z, D,李X,田f .利用自我诊断健康聊天机器人在实际设置:案例研究。J Med Internet Res 2021 Jan 06;23(1):e19928 [免费的全文] [CrossRef] [Medline
  29. 吴永华,钟凯,朱元元。与会话代理交互的差异。2020年5月04日;17(9):3189 [免费的全文] [CrossRef] [Medline
  30. Ly KH, Ly A, Andersson G.促进心理健康的全自动对话代理:混合方法的试点RCT。Internet Interv 2017年12月;10:39-46 [免费的全文] [CrossRef] [Medline
  31. Fitzpatrick KK, Darcy A, Vierhile M.使用全自动会话代理(Woebot)对有抑郁和焦虑症状的年轻人进行认知行为治疗:一项随机对照试验。JMIR Ment Health 2017 Jun 06;4(2):e19 [免费的全文] [CrossRef] [Medline
  32. 达西·A,丹尼尔斯·J,塞林格·D,威克斯·P,罗宾逊·A.数字对话代理建立的人类级别联系的证据:横断面,回顾性观察研究。JMIR Form Res 2021年5月11日;5(5):e27868 [免费的全文] [CrossRef] [Medline
  33. 施罗德J, Wilkes C, Rowan K, Toledo A, Paradiso A, Czerwinski M,等。Pocket Skills:一个支持辩证行为疗法的对话移动web应用程序。2018年4月21日发表于:CHI’18:2018年计算系统中的人为因素CHI会议论文集;2018年4月,第21到26;蒙特利尔,QC,第1-15页。[CrossRef
  34. Inkster B, Sarda S, Subramanian V.用于数字心理健康的共情驱动、会话型人工智能代理(Wysa):真实世界数据评估混合方法研究。JMIR mHealth uHealth 2018年11月23日;6(11):e12106 [免费的全文] [CrossRef] [Medline
  35. Chaix B, Bibault J, Pienkowski A, Delamon G, Guillemassé A, Nectoux P,等。当聊天机器人与患者见面:为期一年的乳腺癌患者与聊天机器人对话的前瞻性研究。JMIR Cancer 2019 5月02日;5(1):e12856 [免费的全文] [CrossRef] [Medline
  36. Perski O, Crane D, Beard E, Brown J.添加支持性聊天机器人是否能促进戒烟应用程序的用户粘性?一个实验研究。数字健康2019年9月30日;5:2055207619880676 [免费的全文] [CrossRef] [Medline
  37. 个人化:最终用户通过虚拟代理编写健康叙述。见:计算机科学课堂讲稿,卷6356。2010年出席:IVA 2010:智能虚拟代理;2010年9月20 - 22日举行,;费城,399-405。[CrossRef
  38. Bickmore T, Rubin A, Simon S.使用虚拟代理进行物质使用筛查:走向自动筛查、短暂干预和转诊治疗(SBIRT)。2020年10月19日发表于:IVA '20:第20届ACM智能虚拟代理国际会议论文集;2020年10月20 - 22日举行,;虚拟事件,苏格兰,英国第1-7页。[CrossRef
  39. Echeazarra L, Pereira J, Saracho R. TensioBot:用于自我管理内部血压检查的聊天机器人助手。J Med Syst 2021 3月15日;45(4):54。[CrossRef] [Medline
  40. R, Furukawa TA, Matsushita S, Baba T, Matsuzaki T, Furuno S,等等。无引导聊天机器人通过消息应用程序对问题赌徒进行认知行为干预:一项随机对照试验。J Gambl Stud 2020 12月11日;36(4):1391-1407。[CrossRef] [Medline
  41. Klos MC, Escoredo M, Joerin A, Lemos VN, Rauws M, Bunge EL。基于人工智能的聊天机器人治疗大学生焦虑和抑郁:先导随机对照试验。JMIR Form Res 2021年8月12日;5(8):e20678 [免费的全文] [CrossRef] [Medline
  42. Dosovitsky G, Pineda BS, Jacobson NC, Chang C, Escoredo M, Bunge EL。人工智能聊天机器人用于抑郁症:描述性研究的使用。JMIR Form Res 2020年11月13日;4(11):e17065 [免费的全文] [CrossRef] [Medline
  43. Greer S, Ramo D, Chang Y, Fu M, Moskowitz J, Haritatos J.使用聊天机器人Vivibot为癌症治疗后的年轻人提供积极心理学技能和促进幸福感:随机对照可行性试验。JMIR mHealth uHealth 2019 10月31日;7(10):e15018 [免费的全文] [CrossRef] [Medline
  44. Maher CA, Davis CR, Curtis RG, Short CE, Murphy KJ。由人工智能虚拟健康教练提供的体育活动和饮食计划:概念验证研究。JMIR mHealth uHealth 2020年7月10日;8(7):e17558 [免费的全文] [CrossRef] [Medline
  45. Kowatsch T, Schachner T, Harperink S, Barata F, Dittler U, Xiao G,等。在涉及卫生保健专业人员、患者和家庭成员的慢性疾病管理中,会话代理作为中介社会行动者:多地点单臂可行性研究。J Med Internet Res 2021年2月17日;23(2):e25060 [免费的全文] [CrossRef] [Medline
  46. Espinoza J, Crown K, Kulkarni O.儿科医疗机构用于COVID-19筛查的聊天机器人指南。JMIR公共卫生监测2020年4月30日;6(2):e18808 [免费的全文] [CrossRef] [Medline
  47. 拉扎尔J,冯J, Hochheiser H.人机交互的研究方法。第二版。伯灵顿,麻州:摩根考夫曼;2017年4月19日。
  48. Jack B, Bickmore T, Hempstead M, Yinusa-Nyahkoon L, Sadikova E, Mitchell S,等。使用对话代理技术降低非裔美国妇女的先入为主风险。J Am Board Fam Med 2015 july 07;28(4):441-451 [免费的全文] [CrossRef] [Medline
  49. de Gennaro M, Krumhuber EG, Lucas G.共情聊天机器人对抗社会排斥对情绪的负面影响的有效性。Front Psychol 2019 1月23日;10:3061 [免费的全文] [CrossRef] [Medline
  50. 南t。韩国是如何利用技术应对新冠肺炎危机的?一个国家报告。国际公共管理评论2020年11月20日;25(4):225-242。[CrossRef
  51. Chouhan A, Pathak S, Tendulkar R.冠状病毒聊天机器人:用虚拟评估工具检测COVID-19症状。作者:Kautish S, Peng SL, Obaid AJ,编辑。抗击COVID-19的计算智能技术。瑞士Cham:施普林格;5月1日,2021:275 - 304。
  52. Blandford A, Gibbs J, Newhouse N, Perski O, Singh A, Murray E.交互式数字健康干预跨学科研究的七个教训。数字健康2018 May 03;4:2055207618770325 [免费的全文] [CrossRef] [Medline
  53. 在医疗保健领域,化身和机器人作为社会伴侣:要求、工程、采用和伦理。见:医疗伦理和培训:概念、方法、工具和应用。好时,PA: IGI Global;2017:582 - 602。
  54. Laranjo L, Dunn AG, Tong HL, Kocaballi AB, Chen J, Bashir R,等。医疗保健中的会话代理:系统回顾。J Am Med Inform Assoc 2018年9月01日;25(9):1248-1258 [免费的全文] [CrossRef] [Medline
  55. Milne-Ives M, de Cock C, Lim E, Shehadeh MH, de Pennington N, Mole G,等。人工智能对话代理在医疗保健中的有效性:系统综述。J Med Internet Res 2020 10月22日;22(10):e20346 [免费的全文] [CrossRef] [Medline
  56. 柯恩思,徐宁,蔡耀凯,林珊珊,汤普生,德米瑞斯。健康对话系统的系统综述。方法Inf Med 2019 12月29日;58(6):179-193。[CrossRef] [Medline
  57. 整合参与式设计和卫生知识,以改进研究和干预措施。种马健康技术通报2017;240:303-329。[CrossRef] [Medline
  58. Safi Z, Abd-Alrazaq A, Khalifa M, Househ M.开发用于医疗应用的聊天机器人的技术方面:范围审查。J Med Internet Res 2020 Dec 18;22(12):e19127 [免费的全文] [CrossRef] [Medline
  59. 非人类人道主义:当“人工智能做好事”可能是有害的。信息、传播与社会2021年4月08日;24(6):850-868。[CrossRef
  60. 我们对世卫组织《卫生领域人工智能伦理与治理》报告的分析。隐私国际,2021年7月20日。URL:https://privacyinternational.org/news-analysis/4594/our-analysis-who-report-ethics-and-governance-artificial-intelligence-health[2021-07-30]访问


人工智能:人工智能
人机交互:人机交互
NLP:自然语言处理
PRISMA-ScR:系统评审和元分析的首选报告项范围评审扩展
个随机对照试验:随机对照试验
人:世界卫生组织


编辑:A Kushniruk;提交21.12.21;H Tanaka, J Parsons同行评议;对作者23.03.22的评论;修订版收到14.07.22;接受02.08.22;发表05.10.22

版权

©Lee Wilson, Mariana Marasoiu。最初发表于JMIR Human Factors (https://humanfactors.www.mybigtv.com), 05.10.2022。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是在JMIR Human Factors上首次发表的原始作品被恰当引用。必须包括完整的书目信息,https://humanfactors.www.mybigtv.com上的原始出版物链接,以及版权和许可信息。


Baidu
map