这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
为老年人设计社交机器人的新研究领域正在兴起。通过提供交流和社会互动的支持,这些机器人旨在提高生活质量。由于老年人因认知障碍而导致功能下降,社交机器人被认为是有前途的,特别是对于患有痴呆症的人。虽然研究结果是有希望的,但由于许多方法的限制,关于老年人社交机器人有效性的研究质量仍然很低。
我们的目的是回顾迄今为止在研究中使用的方法,评估社交机器人在老年人(包括痴呆症患者)的临床和社会环境中的可行性、可用性、功效和有效性。
专门的搜索字符串被开发出来。于2020年8月13日在MEDLINE (PubMed)、Web of Science、PsycInfo和CINAHL中进行检索。
在纳入的33篇论文中,研究了23种不同的社交机器人的可行性、可用性、功效和有效性。共有8项(24.2%)研究纳入了社区老年人,9项(27.3%)纳入了长期护理机构的居民,16项(48.5%)纳入了痴呆症患者。大多数研究的目标单一,其中7项(21.2%)研究关注疗效,7项(21.2%)研究关注有效性。此外,随机对照试验的形式是最适用的设计。可行性和可用性通常在混合方法或实验设计中一起研究,并且最常在个别干预中进行研究。可行性通常用技术接受和使用的统一理论模型来评估。疗效和有效性研究使用了一系列社会心理和认知结果测量。然而,纳入的研究未能发现在生活质量、抑郁和认知方面有显著改善。
这项研究确定了用于评估社交机器人的方法中的几个缺点,导致研究结果矛盾。为了提高这类研究的质量,疗效/有效性研究将受益于适当的大样本量随机对照试验设计和个体干预。实验设计可能最适合可行性和可用性研究。对于这3个目标(功效/有效性、可行性和可用性)中的每一个,我们还建议采用混合的数据收集方法。持续至少一个月的多次互动会议可能有助于研究人员得出重要的结果,并证明社交机器人的真正长期影响。
在接下来的几十年里,由于预期寿命高、出生率低以及婴儿潮一代进入老年,我们预计全球人口将出现老龄化。到2030年,西欧33%的人口将超过60岁[
痴呆症的特征是记忆、认知、行为和日常活动能力的退化[
在过去的几十年里,技术的进步与老龄化社会对健康的巨大挑战同时发生[
社会辅助机器人(sar)根据其特征和功能可分为两大类:(1)服务机器人和(2)伴侣机器人[
为了成功实施和大规模采用社交机器人或任何其他社会心理干预措施,其可行性、可用性和成本效益应被最终用户(痴呆症患者和健康老年人)、临床医生和其他利益相关者(如医疗保险公司和政策制定者)视为良好。监测和评估数字卫生干预措施框架建议评估4个因素,以整合和实施数字卫生干预措施:(1)可行性,评估数字卫生系统是否在给定环境中按预期工作;(2)可用性,评估数字卫生系统是否可以按用户预期使用;(3)有效性,评估数字健康干预是否能在研究(受控)环境中达到预期结果;(4)有效性,评估数字健康干预是否能在非研究(非受控)环境中达到预期结果[
尽管在新冠肺炎大流行之后,人们对社交机器人的兴趣日益浓厚,但关于社交机器人在老年人护理中的有效性的证据有限。老年人社交机器人有效性研究的方法学质量仍然较低,不适当的研究设计、样本、形式、干预持续时间和数据收集方法影响了研究结果的强度[
目前,还没有最先进的概念证明来评估老年人使用社交机器人的研究设计。由于痴呆症的退行性可能会引起方法学上的挑战,因此应特别注意包括痴呆症患者在内的研究。为了确定研究可行性、可用性、功效和有效性的适当研究方法,本文旨在回顾迄今为止在临床和老年人社会环境中研究社交机器人所使用的方法,为该领域未来的研究人员铺平道路。
此范围审查的方案已在开放科学框架(OSF) [
检索于2020年8月13日在MEDLINE (PubMed)、Web of Science、PsycInfo和CINAHL数据库中进行。没有应用时间窗口。构建了三个搜索字符串,涵盖“社交机器人”、“社区设置”和“老年人”等主题。对于每个数据库,虔诚的主题标题被改编。对于MEDLINE,我们使用了以下字符串和关键字:((机器人(网格计算)或机器人*))((人形或同伴或社会*或“社会辅助”或交互*或android )), ((((((( 老化(网格计算))或([网条款])岁)或(老年人(网格计算)))或(脆弱的人口(网格计算)))或(高级))或(老化))或(老年))或(老*),和(((((社区卫生服务[MeSH术语])或(社会支持[MeSH术语])或(住宅设施[MeSH术语])或(独立生活[MeSH术语])或(社会支持[MeSH主题]))或(“社区住宅”或“家庭住宅”或“护理院”或“在家”或“以家庭为基础”或“家庭设置”或“养老院”或家庭)。
有可能入选的出版物必须研究一种社交机器人,该机器人必须在65岁或以上的人群中进行实验或临床研究。如果研究:(1)在急症护理环境中进行;(二)会议摘要、案例研究、学位论文、书籍或综述论文;(三)以英语、西班牙语以外的语言出版的;(4)单独报告机器人的设计、开发过程或理论模型;(5)利益相关者对机器人的意见,不进行任何互动;(6)参与在机器人上实施新的硬件或软件或评估工具(例如评估跌倒检测传感器);(7)涉及只有视频通话功能的远程呈现机器人。
去除重复后,2名审稿人(作者AM和MM)分别分3步独立应用纳入和排除标准,从筛选标题、摘要到全文。对所选结果进行比较,如有分歧,由两位审稿人进行讨论。如果无法达成一致意见,则咨询第三审稿人(作者HR)。
根据以下兴趣领域绘制文献图:作者和国家、机器人名称、机器人目的、研究目的、结果测量类型、研究设计、研究样本、研究设置、数据收集方法、交互场景、相关结果测量、测量仪器、结果和报告的研究局限性。信息以描述性的方式合成,并根据感兴趣的领域以叙述性的方式总结结果。
2位作者(AM和MM)通过在世界卫生组织(世卫组织)建立的监测和评估数字卫生干预措施框架内对数字卫生干预措施进行质量评估,独立评估了所纳入文章的质量[
搜索结果是总共723份单独的出版物。经筛选,共有33篇文章符合评选标准(
质量评价确认所有研究的主要和次要结局都有明确的定义。此外,有12篇(36.4%)的论文对数据收集方法进行了很好的描述,但没有报告参与者的资格。此外,33篇论文中有12篇(36.4%)没有对研究设计进行清晰的描述。
PRISMA(系统评价和荟萃分析首选报告项目)文献检索流程图。
在23种不同的社交机器人中,最常被调查的是PARO (n=10, 30.3%)、Nao (n=5, 15.1%)、AIBO (n=2, 6%)和Hobbit (n=4, 12.1%)。
在33项确定的研究中,16项(48.4%)关注痴呆症患者[
在长期设施(n=17, 51.5%)、私人家庭(n=8, 24.2%)和实验室环境(n=4, 12.1%)中对社交机器人进行了研究。其他设置基于护理组织(n= 1.3%)、痴呆症日托中心(n= 1.3%)和卫生服务机构(n= 1.3%)。四项(12.1%)研究调查了两种不同环境下的机器人[
在纳入的研究中,3项(9.1%)只关注可行性,采用准实验设计[
共有14项(42.4%)研究具有多重目标。其中,7个(50%)侧重于可行性和可用性[
18项旨在评估可行性和/或可用性的研究中,只有5项(27.8%)是在养老院环境中进行的;5例(27.8%)在实验室环境中进行,其余8例(44.4%)在私人家庭中进行。在这18项研究中,有7项(38.9%)研究纳入了痴呆症患者和认知障碍患者。在其余11项(61.1%)研究中,参与者的认知状态没有明确的指示。
在22项(66.7%)研究中,除4项(81.8%)外,其余22项(66.7%)研究[
研究参与者和社交机器人之间的互动主要是在个别会议期间调查的(n=18, 54.5%)。在12项(36.4%)研究中,在小组会议中研究了相互作用。只有3项(9.1%)研究同时应用了个体和群体的相互作用[
共有9项(27.3%)研究进行了1或2次互动会话[
我们确定了4种数据收集方法:(1)问卷调查(n=26, 78.8%),(2)观察(物理和录像)(n=19, 57.6%),(3)访谈(n=13, 39.4%)和生理测量(n=3, 9.1%)。
采用单目标和多目标研究的数据收集方法。
负责数据管理,确定数据收集方法。
可行性方面的结果是用Heerink [
应用系统可用性量表探讨可用性的研究[
通过广泛的神经社会心理测量仪器评估疗效和效果结果:(1)情绪:老年抑郁症筛查[
采用问卷调查的研究中,通过护理人员和非正式护理人员间接收集数据的研究有5项(19.2%),通过研究人员直接收集数据的研究有13项(50%)。
关于社交机器人的可行性结果,几乎所有的研究(n=16, 94.1%)都认为社交机器人是可以接受的。然而,1项(5.9%)研究报告了护理人员可接受性的混合结果[
报告的可用性(n=12, 36.4%)总体上是积极的,除了2项(16.7%)研究,其中可用性受到技术问题或机器人缺乏鲁棒性的负面影响[
大多数研究结果支持老年人使用社交机器人。改善主要体现在情绪和心情方面[
同时,4项(12.1%)研究未发现对生活质量有显著影响[
33项研究中,7项(21.2%)未报告任何研究局限性[
评价者对质量评价的一致性为86.1%。关于研究设计、偏倚和入组程序的描述报告大多被评为“公平”。在大多数文章中,对抽样方法、混杂因素、定量研究中的缺失数据以及定性研究中数据解释的反身性报道较少。其他标准大多被评为“良好”(
这项范围综述的结果揭示了社交机器人研究中的各种应用研究方法,包括研究设计、样本量、研究设置、数据收集方法、交互场景(干预的顺序、持续时间和设置)、结果测量、测量仪器、研究结果和报告的局限性。在实验室环境下,主要研究了社交机器人原型的可行性和可用性。考虑到在社会心理干预中使用社交机器人的历史相对较短,在设计和开发阶段确定机器人的主要特征和功能是至关重要的。因此,可用性、可行性和可执行性应该是战略研究的目标。完全开发的机器人,如PARO,在现实世界的有效性方面进行了评估。大多数已确定的研究旨在确定社交机器人对老年人的神经社会心理影响。
对于明确属于可行性和/或可用性评估范围的研究,研究人员采用实验、混合方法和现场试验设计,主要应用于养老院护理环境之外。这可能意味着目前对认知障碍更严重的人的可行性和/或可用性研究不足。大多数研究验证了机器人在个人或群体设置的单次或多次互动会话中的可接受性和可用性,并且所有这些研究都在不同程度上报告了社交机器人的可行性和/或可用性的积极结果。定量和定性数据的收集多采用问卷调查和访谈的方式,少数采用直接观察的方式。关于这一点,研究人员应该考虑使用直接观察方法来捕捉机器人使用所培养的互动和情感关系的主要因素。在基于UTAUT模型的问卷调查和访谈问题中,一些概念,如信任、焦虑、感知享受和社会支持,会随着时间的推移而改变[
总体而言,疗效和有效性研究是在认知障碍患者或居住在长期护理机构的研究人群中进行的。有显著结果的研究[
针对机器人提供干预的疗效和有效性的研究在形式、持续时间、剂量和地点上存在分歧。两项(6.1%)研究[
除了上述研究的局限性外,研究设计的一些薄弱方面导致了社交机器人影响的失败。例如,所研究的结构与机器人的主要目标之间的不匹配可能导致机器人效率不高的不良结论。这方面的一个例子是对PARO的研究未能证明认知方面的显著结果,因为PARO不是为了刺激认知功能而开发的[
适当的大样本量随机对照试验和超过1个月的个体相互作用将最适合此类研究,以得出相对稳健和可靠的结果。
这两个研究目标的研究方法相似,因此研究人员可以采用相同的设计。这些研究建议采用混合数据收集方法的实验设计。多个交互会话可能会揭示可行性和可用性的变化。
我们建议针对多个目标进行单独的研究,因为每个目标的研究设计具有可比性。
我们收集了进一步的实际建议,以便未来的工作可以解决现有的不足(
进一步的影响和对未来研究的建议。
考虑范围 | 研究类型 | 建议 |
参与者和设置 | 功效/有效性 |
性别的同质性 不同程度的痴呆 现实的环境 |
干预和数据收集 | 功效/有效性 |
超过1个月的多次干预疗程 |
可行性/可用性 |
试用前的初始化阶段 |
|
所有类型的研究 |
训练有素的观察员和专业人士 定制的干预措施 除了观察员之外,还包括一个干预促进者 一致的观察 标准化和验证的测量仪器 以客户为中心的干预设计方法 数据收集的定性和定量方法的结合 观察性研究包括严重痴呆患者 |
|
现有文献的空白有待填补 | 功效/有效性 |
最佳反应-特定措施和参与者条件下的干预剂量 从社交机器人中获益最多的对象的特征 |
尽管社交机器人的使用有望为痴呆症患者提供支持,但我们并没有将痴呆症特别纳入搜索字符串,因为本次范围审查主要针对老年人。然而,我们相信我们的搜索捕获了大多数在痴呆症领域进行的研究,因为许多已确定的研究将痴呆症患者纳入混合或特定研究样本中。然而,在本综述中可能遗漏了一些与老年痴呆相关的研究,以及在本综述中未考虑的仅在数据库中可追溯的研究。检索是在科学数据库中进行的,这些数据库被认为是最可行的,可以为本范围审查检索有效和可靠的结果。排除仅关注社交机器人发展阶段的研究可以被认为是本研究的局限性。在开发阶段执行的可行性和可用性评估的一些信息可能被遗漏了。此外,远程呈现机器人的研究由于其相对简单的特征而被排除在外。与宠物机器人和人形机器人相比,远程呈现机器人在与用户的交互方面受到限制,仅通过触摸屏进行交互,利用视觉和音频刺激,而忽略了其他感官刺激。虽然主要用于医疗访问,但一些远程呈现机器人可能支持社交功能。在这些机器人上进行的研究的信息可能被遗漏了。
我们的研究是对老年人和痴呆症患者的社交机器人研究方法的第一次范围审查。关于这一主题的现有评论主要集中在社交机器人的设计、使用、有效性、促进因素和实施障碍[
这篇综述叙述性地综合了研究老年人和痴呆症患者的社交机器人的方法学信息。制定了相关建议,针对具有特定目标的研究,这些建议可能有助于未来的研究人员开发足够的研究设计来评估社交机器人,从而为研究结果提供更可靠的信息。我们的研究得出结论,社交机器人在老年人和痴呆症患者的私人家庭中的有效性需要更多的大样本研究,以证明社交机器人通过改善生活质量、认知、社会联系和抵消孤独感来延缓机构化的实际用途。大多数确定的研究都集中在可用性上,在大多数情况下,机器人似乎都很受欢迎。现在是时候鼓励在私人家庭进行调查,以补充有关机器人有效性和个性化功能的现有知识。我们希望更多的研究能够证实社交机器人对痴呆症患者和老年人的孤独感、情绪、生活质量和社交健康的影响。
由两名独立评审员对纳入的研究进行质量评价。
研究的特点和方法。
结果。
日常生活活动
创新培训网络
长期护理机构
开放科学框架
生活质量
随机对照试验
社交辅助机器人
加州大学洛杉矶分校
技术接受与使用的统一理论
世界卫生组织
本研究是居里夫人创新培训网络(ITN)行动的一部分,编号为H2020-MSCA-ITN-2018,资助协议号为813196。
MFM参与了灵北(Lundbeck)、阿卡迪亚(Acadia)、杨森(Janssen)、大ka、安吉利尼(angelini)、Oxygen、罗氏(Roche)、施维雅(Servier)、勃林格殷格翰(Boehringer Ingelheim)和Gw Research Limited的临床试验。