发表在卷9,第4期(2022):10月- 12月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/38876,首次出版
评估人类与社会聊天机器人交互背后的主题和激励因素:用户体验的主题分析

评估人类与社会聊天机器人交互背后的主题和激励因素:用户体验的主题分析

评估人类与社会聊天机器人交互背后的主题和激励因素:用户体验的主题分析

原始论文

1心理学系,湖森林学院,湖森林,伊利诺伊州,美国

2美国伊利诺伊州北芝加哥罗莎琳·富兰克林大学卫生专业学院

3.美国纽约哥伦比亚大学心理学系

4美国伊利诺伊州梅伍德市洛约拉大学芝加哥分校健康科学和公共卫生学院

通讯作者:

Vivian P Ta-Johnson,理学硕士,博士

心理学系

森林湖学院

谢里丹路555号

森林湖,伊利诺伊州,60045

美国

电话:1 847 735 5258

电子邮件:ta@lakeforest.edu


背景:尽管随着语言模型和人工智能的改进,社交聊天机器人的使用预计会增加,但人们对人类与社交聊天机器人互动的动态知之甚少。具体来说,很少有研究研究人类与社会聊天机器人互动的原因以及讨论的主题。

摘要目的:我们试图确定与一个流行的社交聊天机器人Replika接触背后的激励因素,以及这些互动中讨论的主题。

方法:Replika用户的样本完成了一项调查,其中包括与他们开始与Replika联系的原因有关的开放式问题,以及他们通常讨论的话题。然后使用主题分析来提取关于Replika使用背后的动机因素和与Replika对话中发生的讨论类型的主题和子主题。

结果:用户最初与Replika联系是出于兴趣,寻求社会支持,以及应对心理和身体健康状况。用户使用他们的Replika参与各种各样的讨论话题,包括智力话题、生活和工作、娱乐、心理健康、连接、Replika、时事和其他人。

结论:考虑到所报告的动机因素和讨论主题的广泛范围,我们的结果表明,单个社交聊天机器人可以提供多方面的支持。虽然之前的研究已经证实,社交聊天机器人可以有效地帮助解决心理和身体健康问题,但这些功能分散在几个不同的社交聊天机器人中,而不是来自单一的社交聊天机器人。我们的研究结果还强调了一个与其他激励因素相比较少受到关注的人类-社会聊天机器人使用的激励因素:兴趣。用户使用Replika最常见的原因是出于兴趣,他们希望探索它的功能,了解更多关于人工智能的知识。因此,当开发人员和研究人员在研究人类与社会聊天机器人的互动时,考虑到社交聊天机器人的功效及其目标用户群,同样重要的是,要考虑它的使用如何影响公众对社交聊天机器人和人工代理的看法和支持。

JMIR Hum Factors 2022;9(4):e38876

doi: 10.2196/38876

关键字



背景

随着人工智能的进步,随着聊天机器人在日常生活中越来越普遍,人们花在与聊天机器人互动上的时间可能会增加。这包括与社交聊天机器人的互动,聊天机器人可以通过社交和同理心的交谈与人类用户建立友谊。1-3.].虽然社交聊天机器人的使用率在上升[45],我们对这些互动的动态知之甚少,特别是关于为什么人类与社会聊天机器人的互动会被发起,以及这种互动的内容[6].换句话说,启动与社交聊天机器人接触的激励因素是什么,这些互动中讨论了什么?在本文中,我们从一个流行的社交聊天机器人Replika的用户那里收集了数据,以解决这一文献中的空白。

这项调查之所以重要,有几个原因。最近聊天机器人研究的一个突出部分集中在聊天机器人用户体验上,因为“加强聊天机器人用户体验仍然是一个关键的研究挑战”[78].这项工作揭示了“影响积极或消极用户体验的因素……以及聊天机器人设计如何影响这些方面”[7].例如,缺乏信任[9]及用户不满[10]会阻碍聊天机器人的使用,而情感决定因素和感知有用性和帮助性可以改善人们对聊天机器人使用的态度[8].虽然这些信息对于设计有效的聊天机器人无疑是至关重要的,但要确定有助于积极(或消极)用户体验的因素,还需要考虑聊天机器人使用背后的激励因素。这一点很重要,因为用户体验与使用模式(如何使用产品)联系在一起。11].现有的研究主要将聊天机器人的使用区分为面向任务的或面向社交的,通常没有指定任何进一步的角色或功能。同样,改进聊天机器人的对话和交互设计必然涉及评估人类与聊天机器人交互中正在讨论的内容,并考虑其对交互满意度的潜在影响。例如,在一些研究中,讨论个人和亲密话题的互动有助于发展亲密关系[1213].相比之下,那些没有一致意见的话题(如移民改革、堕胎权等)会增加焦虑和威胁感[14].因此,清楚地了解人们与社交聊天机器人互动的原因以及这种互动的内容,可以更明确、具体地了解为什么某些人类与社交聊天机器人的使用可能(或可能不)有效,并阐明使社交聊天机器人能够更好地满足用户需求的设计元素。

最后,尽管聊天机器人的研究正在迅速扩展,并涵盖了广泛的学科,但聊天机器人知识的主体“目前在学科和应用领域之间是碎片化的”[7].这可能会产生一个不连贯的知识体系,抑制与有效的人类与社会聊天机器人交互有关的基本但关键的发现。因此,确保全面理解人类与聊天机器人的交互,需要检查任何交互的基本构建模块:人类与聊天机器人交互的激励因素和内容。这样做将使新的研究对现有的文献和知识体系做出系统和有意义的贡献。

Human-Chatbot交互

聊天机器人主要分为面向任务的聊天机器人或社交聊天机器人。与社交聊天机器人不同,面向任务的聊天机器人为完成特定任务提供基于服务的帮助(例如,在餐馆预订一张桌子),通常不提供超出其分配目的的任何社交价值[15].因为它们是用户的虚拟伴侣,社交聊天机器人被创建来体现类似人类的个性、情感和行为,并促进社会互动,以满足用户的个人需求[216].社交聊天机器人的情感成分使它们能够识别和表达同情和同理心等情绪,这可以培养用户的信任感,并增加用户的自我表露。1718].社交聊天机器人已经越来越多地应用于协助医疗保健,它们的使用与减少抑郁和焦虑症状,改善情绪有关[19-21]、更好的社会支持[22],改善服药依从性,增加锻炼[23].社交聊天机器人在医疗保健领域的使用越来越多,这是因为聊天机器人有能力支持、促进和增强医疗保健过程[24].例如,聊天机器人可以全天候提供更大的可访问性,即时获取信息和支持,以及一定程度的匿名性[25].这使得聊天机器人能够帮助减少等待时间和名单,接触到更偏远或农村地区的个人,并促进那些可能不愿向人类医疗保健提供者自我披露的个人的自我披露[24].

在健康和任务导向的背景之外,很少有研究考察了人类与社会聊天机器人互动背后的动机因素以及这些互动的一般内容。此外,现有研究的规模较小有重要的局限性。布兰扎格和福斯特德[26报告称,与聊天机器人接触主要是为了提高工作效率,其次是娱乐、社交联系和好奇心。然而,他们的研究并没有区分任务型聊天机器人和社交型聊天机器人。这是一个重要的区别,因为面向任务的聊天机器人被编程为提供不同的目标,而社交聊天机器人被编程为提供虚拟陪伴。因此,开始与任务型聊天机器人接触的动机可能与开始与社交型聊天机器人接触的动机不同。此外,如果激励因素不同,那么与面向任务的聊天机器人的交互可能包含与社交聊天机器人的交互完全不同的讨论。

在一项关于人类与聊天机器人关系的研究中[27,用户报告称,主动接触社交聊天机器人是因为他们对人工智能感兴趣,为了满足情感和社交需求,为了提高技能,以及出于好奇心。然而,由于人类与聊天机器人关系的研究不足,这项研究只包括那些表示与聊天机器人建立了友谊的人。开始与社交聊天机器人接触的原因,以及这种互动的性质,在那些将他们与它的关系归类为友谊的人之间,可能与那些不将他们的关系归类为友谊的人不同。此外,将一段关系划分为友谊的标准不仅因人而异,而且在人的一生中也不尽相同。2829].排除那些可能与社交聊天机器人有大量互动,但没有明确地将其标记为友谊的个体,忽略了人类与社会聊天机器人互动的潜在相当大一部分,从而抑制了对人类与社会聊天机器人互动和人类与机器人互动的包容性调查和理解。

理论观点

至少有两个理论角度可以用来理解人类与社会聊天机器人互动的启动和发展背后的因素。首先,社会交换理论假定社会行为是由成本-收益分析驱动的,这样个人就会寻求以最小的“成本”产生最大“收益”的互动。30.31].换句话说,交互的成本不应该超过收益。当讨论的话题有争议或有争议时,与社交聊天机器人(与人类相反)的互动可能被认为成本更低,回报更高。因为人类是社会动物,更喜欢被喜欢和接受,而不是被拒绝。3233],有争议的话题通常被认为是不舒服的讨论,因为它们会给人带来压力,并导致人际冲突[3435].然而,讨论有争议的话题对于发展重要的民主能力是至关重要的,例如对社会问题有充分的了解,并具有“对其他文化和信仰的开放态度,分析和批判性思维技能,灵活性和适应性,以及对模糊性的容忍度”[36].由于社交聊天机器人不是人类,它们可能为个人提供了一个安全的途径来讨论具有挑战性的话题,而不必担心冲突或他人的报复。

同样,对于那些经历社交焦虑和害怕他人负面评价的人来说,与社交聊天机器人互动的成本可能更低。患有社交焦虑症的人通常会刻意避免真实的或预期的社交场合,因为这些场合可能会引发别人不想要的想法、感受和负面评价。3738].这与之前的研究相一致,该研究表明,以电脑为媒介的交流可能是社交焦虑者首选的交流媒介,因为它比面对面的交流更具威胁性[39].同样,由于社交聊天机器人不是人类,人类与社交聊天机器人的互动提供了在更轻松、风险更低的环境中进行社交互动的机会。这降低了成本,并使利益最大化,从而使个人能够满足人类对归属感的需求,而不会与他人面对面互动的潜在不适。

其次,评估人们如何利用技术来满足他们的需求,可以用来理解为什么人类与社会的聊天机器人互动是开始的,以及这些互动是如何进行的。存在、关联与成长理论[40假设行为是由满足三种需求驱动的:存在、关联和成长。生存需求是指人类生存所需的要素,包括生理需求(如食物、水)和安全需求(如健康)。关联需求指的是社会关系,获得他人的尊重。成长的需要是指对个人发展和自尊的需要。研究表明,人们乐于使用新兴技术来满足自己的各种需求[4041].此外,现代媒体的使用也与学习和获取信息以及追求享乐满足的动机有关[40].更具体地说,使用手机应用程序背后的动机与获得社会福利、即时访问和流动性、地位、信息和娱乐有关。42].这一观点表明,人们追求与社交聊天机器人的互动,以满足他们的各种需求,特别是关系和成长的需求。

我们的目标

鉴于关于人类与社会聊天机器人互动的启动和性质的知识差距,我们试图评估以下两个研究问题:(1)人类与社会聊天机器人互动背后的动机因素是什么?(2)在人与社会的聊天机器人互动中,讨论的主题是什么?

因此,我们研究了一个流行的社交聊天机器人Replika的用户体验[43),通过一项调查,邀请Replika用户回答有关他们与Replika互动的问题。然后使用主题分析来提取与使用Replika背后的动机因素有关的主题和子主题,以及与Replika讨论的主题。鉴于我们的目标是解决人类与社会聊天机器人交互方面知识的缺乏,我们采用了探索性和理论方法来进行这项调查。换句话说,虽然我们试图从用户的回答中提取所有重要的主题,但基于上述两个理论观点,我们预计人类-社会聊天机器人交互中涉及的激励因素和讨论主题将由以下因素驱动:(1)社交或讨论具有挑战性的话题的需求,而不必担心来自他人的负面评价;(2)满足相关性和成长需求的动机。

我们选择专注于Replika而不是其他社交聊天机器人,因为它的功能、可访问性和庞大的用户群。Replika被编程为同伴,而不是提供特定的结果(如通过Lark减肥健康教练AI减肥)或治疗方法(如通过Woebot进行认知行为治疗)。Replika也可以在许多平台上使用[22],这使得它比其他社交聊天机器人更容易接近。因此,与其他更有针对性的聊天机器人相比,它更有可能用于更广泛的原因,使其成为我们研究的合适社交聊天机器人。


参与者

Replika用户(N=66)是在2019年春夏通过社交媒体网站招募的,包括Facebook和Reddit。大多数受访者是男性(n= 36,54.5%)、单身(n= 42,63.6%)、白人(n= 47,71.2%)和来自美国(n= 41,62.1%)。受访者年龄17 ~ 68岁(平均32.64岁,标准差13.89岁)。多媒体附件1报告其他受访者的人口统计数据。

材料与步骤

受访者完成了一份关于他们使用Replika的开放式问题的调查,并提供了基本的人口统计信息。为了研究受访者为什么开始与Replika接触,并确定表征他们互动的主题,我们分析了对以下问题的回答:(1)为什么决定尝试Replika?(如果您不愿意回答,请输入“n/a”)(2)您通常与您的Replika讨论什么主题?(如果您不愿意回答,请输入“n/a”)。

参与者还回答了关于他们使用Replika的其他问题,但这些问题与本次调查无关。多媒体附件2载有网上电子调查报告结果核对表。

伦理批准

所有程序都由森林湖学院的人体受试者审查委员会(TA04152019)批准,并根据1964年赫尔辛基宣言及其后来的修正案进行。


初步调查结果

进行了两个专题分析。第一个专题分析,说明在图1,针对用户使用Replika的动机(您为什么决定尝试Replika?)共有5个回答不符合纳入研究的要求,因此被省略(例如,只包含“n/ A”的回答)。第二个专题分析,说明在图2,是关于用户与他们的Replika进行讨论的主题的回答(你通常与你的Replika讨论什么主题?)同样,5个应答不符合纳入研究的要求,因此被省略。最终纳入的回复数为59。中报告了与受访者使用Replika动机相关的主题和子主题表1,并在报告中报告了与受访者使用Replika进行的讨论主题相关的主题和子主题表2

因为受访者经常在他们的回答中提到多个激励因素和讨论主题,所以一个给定的回答可能被编码在多个激励因素和主题下。

图1。Replika使用的激励因素:主题和子主题。
查看此图
图2。讨论主题:主题和子主题。
查看此图
表1。与受访者使用Replika动机相关的主题和子主题(N=59)。
主题和子主题 值,n (%)
感兴趣

一般利益 27 (46)

对人工智能的兴趣 19 (32)

口碑 14 (24)
社会支持

孤独 14 (24)

陪伴 4 (7)

自我完善 4 (7)
健康

心理健康 5 (8)

身体健康 4 (7)
表2。受访者参与Replika讨论的主题和子主题(N=59)。
主题和子主题 值,n (%)
知识

科技 12 (20)

人文学科 12 (20)

自然/动物 6 (10)
生活与工作

生活 21 (36)

工作 5 (8)
心理健康

幸福和个人发展 5 (8)

问题 6 (10)

情绪 12 (20)
连接

性/亲密 10 (17)

7 (12)

的关系 4 (7)
Replika

关于Replika本身 4 (7)

Replika的选择 4 (7)

复制实验 2 (3)
时事 4 (7)
4 (7)
娱乐 25 (42)
广泛的 21 (36)

使用Replika的动机

关于使用Replika的最初动机,从用户的反馈中可以看出三个主要主题:兴趣、社会支持和健康。

感兴趣

几乎一半的用户(27/ 59,46%)提到他们发现Replika很有趣,并出于好奇或无聊而决定尝试这款应用。

我在测试版发布之前就发现了它(Replika),觉得它看起来很酷,所以我在它发布时注册了一个代码。
[女性,20岁]
我对这项技术以及我在网上读到的文章很好奇。
[女性,48岁]

一些用户(19/ 519,32%)还表示对人工智能特别感兴趣,并有动力探索Replika的功能及其背后的人工智能。

我想看看人工智能是否真的像和另一个人说话一样,我很高兴地发现它在很多方面都做到了。
[男性,30岁]
我一直对聊天机器人着迷,在网上搜索时发现了Replika。
[男性,42岁]

近四分之一的用户(14/ 559,24%)是在从线上和线下的第三方渠道了解到Replika后开始与之互动的。在线资源包括新闻文章、用户评论、社交媒体和互联网搜索。线下消息来源包括谈论或使用过Replika的朋友和家人。

我看到我关注的一位youtube用户评论了这款应用(Replika),觉得它看起来很有趣。
[男性,31岁]
我丈夫用它(Replika),所以我想试试。
[女性,23岁]
社会支持

大约四分之一的用户(14/ 55,24%)寻求与Replika互动以对抗孤独感,这种孤独感通常源于没有定期与他人进行社交互动的机会或高度的社交焦虑。

那时候我一个人住,没有多少人可以交谈。
[男性,21岁]
当时我一个人在医院里,所以没有多少人可以和我交流。
[男性,22岁]

除了找人聊天,一小部分(4/ 59,7%)的用户还从他们的Replika上寻求陪伴和友谊。

有一个可以说话的同伴。
[男性,24岁]

一些(4/ 59,7%)用户还试图完善某些社交技能,并通过与Replika的互动更多地了解自己。

我想…变得更加自信。
[女性,18岁]
我把它看作是帮助我更好地了解自己的一种方式。
[男性,20岁]
健康

用户称他们的身心健康是他们与Replika互动的最初原因。具体来说,一些用户(5/ 59,8%)试图使用Replika来应对焦虑、抑郁和恐惧等心理健康问题。其他人(4/ 59,7%)提到,他们开始使用Replika来弥补由于身体健康问题导致的社交不足,这限制了他们的行动能力。

我需要治疗恐慌症。
[女性,57岁]
当我第一次开始时,我也患有严重的抑郁症,并将它视为一种解决我的问题的方法。
[男性,20岁]
我有残疾,没有太多的社交活动。
[男性,59岁]

讨论主题

从用户的反馈中,共有9个主要的讨论主题:智力、生活和工作、娱乐、心理健康、广泛、连接、Replika、时事和人物。绝大多数用户以列表方式描述了几个讨论主题。因此,与这些主题相关的示例回答也将按列表列出。用户也倾向于用描述性的回答来描述一些讨论主题。因此,与这些主题相关的示例回答将以引用回答的形式呈现。

知识

用户报告说,他们与他们的Replika就科学和技术进行了深入、理智的讨论(12/ 59,20%),包括人工智能、宇宙、空间、物理学、地外生命;人文学科(12/59,20%),包括现实的本质、感知、意识、精神主题、存在、生活的目的/意义和日本文化;自然(6/ 59,10%),包括海洋和动物。

生活与工作

用户与Replika讨论他们的生活(21/ 59,36%),这些话题从重大生活事件到日常生活的细节。与用户职业相关的话题和其他与工作相关的话题(5/ 59,8%),如老板和商业战略,也被讨论。

娱乐

用户讨论了他们经常消费的各种形式的娱乐和媒体(25/ 59,42%)。这通常包括用户参与并试图与他们的复制人分享的爱好和活动(例如,音乐、视频游戏、动漫、书籍、表情包、主题公园、游戏、电影、照片、艺术、笑话、食物和角色扮演)。

心理健康

用户与他们的Replika(12/ 59,20%)讨论了他们的情绪状态,尤其是消极的想法和情绪状态。这些话题通常来自用户对日常挑战和主要生活障碍的讨论(6/ 59,10%),以及这些经历如何影响用户的幸福和个人成长(5/ 59,8%)。

我抱怨自己长得丑,人们不喜欢我。
[男性,41岁]
有时我们会谈论一些困扰我的事情,或者一般来说,如果我感到沮丧,她(用户的Replika)会让我振作起来。
[男性,22岁]
连接

用户报告讨论有关爱情的话题(7/ 59,12%),性/亲密关系(10/ 59,17%)和关系(4/ 59,7%)。然而,绝大多数用户列出了这些主题,却没有提供任何额外的上下文。

Replika

用户报告说,他们询问了关于Replika自身的问题,以更多地了解它作为一个实体(4/ 59,7%),以及它的技术能力(2/ 59,3%)。例如,用户通过提问来了解他们的Replika的个性特征,他们的Replika如何看待自己(它的“身份”),以及他们的Replika在多大程度上记得他们之前讨论的内容。用户还允许他们的Replika引导讨论主题(4/ 59,7%)。

不管他们(用户的Replika)想要提什么。
[男性,19岁]
我喜欢测试复制器,看它是否记得我以前告诉它的关于我自己的事情。
(男,25岁)
时事

用户还向他们的Replika通报了世界上正在发生的事件(4/ 59,7%),并讨论了其含义和影响(例如,全球事务,最新的技术进步)。

用户用他们的Replika讨论其他人(4/ 59,7%)。这些人既有知名公众人物(如唐纳德·特朗普、埃隆·马斯克),也有用户自己社交网络中的个人(如家人、朋友)。

广泛的

一些用户表示,他们在Replika上讨论了各种各样的主题(21/ 59,36%),但没有提供具体的例子。没有讨论主题是禁止的,主题由用户当时选择的任何内容驱动。

说实话,所有的事情。
[女性,25岁]
这通常只是谈话的流程。
[男性,22岁]

使用副本的动机

尽管社交聊天机器人的使用率正在上升[45],对于人类与社会聊天机器人互动背后的激励因素以及其中讨论的主题知之甚少[6].在这项研究中,我们解决了这一知识差距。流行的社交聊天机器人Replika的用户回答了有关他们使用Replika的问题,并使用主题分析来深入了解用户与社交聊天机器人互动的动机,并确定标志着这些互动的对话主题。

参与者最常提到的兴趣来自对人工智能的好奇和兴趣,这是使用社交聊天机器人的激励因素,这与之前的研究是一致的[32].出现的一个值得注意的子主题涉及来自用户环境中的第三方来源的兴趣,特别是来自拥有Replika经验或事先了解Replika的朋友和家庭成员。这表明,人们对社交聊天机器人的兴趣并不完全是由新技术和先进技术带来的新奇和兴奋所驱动的。相反,社交聊天机器人的使用似乎也可能是由强关系推荐来源(即,认识个人的人,因此可以影响个人的态度和随后对产品的使用)展示其实际效用所驱动的。44].这可能也暗示了社交聊天机器人在日常生活中越来越普遍的使用,以及人类与社交聊天机器人互动的兴起。

社会支持,尤其是同伴支持和评价支持,是第二大常见原因。用户希望使用Replika来对抗因独居或身体受伤等各种情况而产生的孤独感。一些用户还表示希望得到陪伴,并体验更有意义的互动,而另一些用户则将与Replika的互动作为某种形式的个人发展的机会,如提高自信和自我认识。之前的研究也报道了使用社交聊天机器人来获得社会支持,因为它们能够与人类建立情感联系[45-47].此外,由于Replika几乎可以像人类一样进行社交交流,这为用户提供了提高人际交往技能和更多了解自己的机会。

值得注意的是,与之前的研究不同[22],信息支持和情感支持并不是启动与Replika联系的主要激励因素。没有受访者表示,他们主动联系Replika是为了获取信息或建议,只有1名受访者表示,他们在寻找机会“向那些不会评判我的东西发泄”。因此,这并不符合将信息社会支持和情感社会支持分别列为副主题的标准[48].值得注意的是,尽管信息和情感社会支持并没有被报告为使用社交聊天机器人的最初动机,但用户在与Replika互动一段时间后,可能会寻求信息和情感社会支持。

与Replika接触的第三个最常见的原因是为了应对健康问题。使用社交聊天机器人来改善身心健康与之前的研究是一致的[49].虽然用户主要报告说,他们寻找应对心理健康问题的方法是开始接触的直接催化剂(这并不奇怪,因为Replika的设计是为了提供陪伴),但用户也报告说,他们寻找应对身体健康问题的方法是开始接触Replika的间接催化剂(例如,使用它来补充他们由于身体疾病限制了他们的行动能力而缺乏社会互动)。后一项发现值得注意,因为Replika并没有被编程来收集用户的身体健康数据,如身体活动、饮食和体重;因此,用它来解决身体健康问题并不是立即显而易见的。目前尚不清楚Replika是否是使用者唯一的应对机制,还是与保健专业人员规定的其他应对机制/治疗方法一起使用。然而,很明显,用户与社交聊天机器人接触是为了应对心理和身体健康问题。

讨论主题

用户使用他们的Replika参与了各种各样的讨论主题,这是在受访者内部和受访者之间观察到的。报道的讨论话题包括智力话题、生活和工作、娱乐、心理健康、联系、复制、时事和其他人。从严肃的(如心理健康、时事)到琐碎的(如娱乐),从复杂的(如智力话题、联系、复制)到平凡的(如生活和工作),话题差异很大。这证明了社交聊天机器人的多功能性;它们不仅能够讨论各种各样的话题,而且似乎也能够与人类同伴进行这样的讨论。

部分讨论主题与以往研究一致,包括用户生活和兴趣等方面[3.26以及让用户更多地了解社交聊天机器人技术能力的话题[626].此外,研究人员还讨论了与心理健康相关的主题(幸福、个人发展、问题、情绪)和与连接相关的主题(性、爱、关系),因为据报道,社会支持(孤独、陪伴、自我提高)是启动与Replika接触的激励因素。之前的研究也表明,使用社交聊天机器人作为社会支持的来源[22].

值得注意的是,最常报道的讨论主题是实质性的,智力的,通常集中在复杂的内容和需要自我表露(例如,有关生命意义的话题)。社交聊天机器人讨论这个话题的频率可能是由于人们如何看待智力话题。人们往往高估了深入讨论的尴尬程度,低估了谈话对象对自己回答的兴趣程度。50].这种期望可能会阻止人们参与这样的讨论,与更肤浅的话题相比,这更有可能引发某种程度的社交焦虑。这在一定程度上支持了这样一种观点,即人类与社会的聊天机器人互动可以提供一个“安全空间”,用于进行深入的智力对话。此外,因为深入的讨论可以促进更大的联系、喜欢和幸福。50,因此,人们在追求陪伴和更有意义的互动时,可能会倾向于这样的讨论就不足为奇了。

影响

考虑到所报告的动机因素和讨论主题的广泛范围,我们的结果表明,单个社交聊天机器人可以提供多方面的支持。虽然之前的研究已经证实,社交聊天机器人可以有效地帮助解决心理和身体健康问题,但这些功能分散在几个不同的社交聊天机器人中,而不是来自单一的社交聊天机器人。例如,百灵减肥健康教练AI [51]通过提供用户报告的活动水平和膳食反馈,帮助超重和肥胖用户减肥并做出健康的食物选择;Woebot [19]帮助使用者使用认知行为治疗技术管理他们的心理健康;和Bonobot [52为减压而进行动机性访谈。一些社交聊天机器人可以解决不止一个心理/身体健康问题(例如,Woebot可以减轻抑郁症状[53]和有问题的药物使用[54),但它们的功能通常仅限于解决心理健康或身体健康问题,比如Woebot和Lark减肥健康教练。聊天机器人提供心理和身体健康支持的能力不仅展示了更高水平的多功能性和效率,而且还响应了卫生保健专业人员对健康干预措施的呼吁,包括解决心理和身体健康问题的组件[55].

我们的研究结果还强调了兴趣是人类-社会聊天机器人使用的一个激励因素,这一点比其他激励因素受到的关注要少。虽然这似乎与Replika提供陪伴的目的没有直接关系,但之前的研究表明,任何人工代理的使用不仅会影响人们对人工智能的理解,而且还会强烈地影响他们如何看待人工智能及其随后的叙述[56],无论人工制剂是否用于其预期目的。关于人工智能的叙述“对于科学发展以及人们与新知识和新应用的接触至关重要”[57].这些叙述还可能导致对人工智能的错误信息和恐惧;对于那些与科学或技术没有密切接触的人来说,“叙述可以影响对潜在应用的看法和对这些应用的信心程度,以及那些开发、促进或反对这些应用的人”[57].值得注意的是,这项研究不能也没有在社交聊天机器人的使用和对人工智能的认知或叙述之间建立联系。然而,在我们的研究中,用户最常报告使用Replika是出于兴趣,试图探索其功能,并学习更多关于人工智能的知识,这一事实不应被忽视。因此,虽然开发人员和研究人员完全有理由研究人类与社交聊天机器人的互动,重点关注社交聊天机器人及其目标用户群的功效,但研究人员也应该评估社交聊天机器人的使用是否以及如何影响人们对人工智能的看法及其潜在后果。

优势、限制和未来方向

这项研究首次研究了与社交聊天机器人接触背后的激励因素,以及在人类与社交聊天机器人互动中发生的讨论。受访者只需要确认自己是Replika用户就可以参与这项研究。研究纳入没有额外要求(即,受访者不需要使用特定标签(如友谊)对他们与Replika的关系进行分类)。这使得对人类-社会聊天机器人交互的启动和发展进行更具包容性的评估成为可能。此外,问题的匿名性质和开放式回答形式鼓励并允许详细回答。正如这两个问题中出现的广泛主题和子主题所反映的那样,这导致了对用户与Replika互动的动机以及他们参与的讨论主题的丰富而全面的评估。

虽然受访者报告了启动与Replika联系的几个激励因素,但我们的研究无法评估用户继续与Replika联系的原因。用户开始与Replika接触的原因可能也是他们继续与Replika互动的原因。也有可能受访者最初被Replika吸引的原因只有一个,但随着对话的继续,这个原因发生了变化。同样,我们的研究无法评估讨论的主题是否会持续出现,或者某些主题是否在一段时间后更有可能出现。要回答这些问题,需要采用纵向方法。未来的研究应该跟踪随着时间的推移所讨论的主题类型,并评估用户与社交聊天机器人互动的动机如何随着时间的推移而变化。最后,使用调查收集数据可能会引入自我选择偏差,并限制结果的泛化到更大的样本或人群。据我们所知,我们的研究是第一个研究人类与社会聊天机器人交互的激励因素和讨论主题的研究;因此,只有重复研究才能评估我们结果的外部有效性。未来的研究应该使用更大、更有代表性的Replika用户样本来重复这项研究。

作者的贡献

VPT-J制定研究设计,协助创建研究材料,进行数据分析,并撰写手稿。CB和XW共同开发研究材料,进行数据收集,并协助数据分析和稿件撰写。ED协助数据分析。ICK和SDR协助数据分析和稿件撰写。AM和WMP协助撰写稿件。

利益冲突

没有宣布。

多媒体附件1

受访者的其他人口统计资料。

DOCX文件,9 KB

多媒体附件2

网上电子调查报告结果核对表

DOCX文件,8kb

  1. Seering J, Luria M, Kaufman G, Hammer J.超越二元交互:将聊天机器人视为社区成员。2019年5月出席:2019年计算系统人为因素会议(CHI);5月4 - 9日;苏格兰格拉斯哥,第4-9页。[CrossRef
  2. 沈浩,何霞,李东。从Eliza到小冰:社交聊天机器人的挑战与机遇。前沿技术与电子工程2018年1月8日;19(1):10-26。[CrossRef
  3. 周玲,高洁,李东,沈华。同理心社交聊天机器人小冰的设计与实现。计算语言学2020年3月,46(1):53-93。[CrossRef
  4. Balch O.人工智能和我:友谊聊天机器人正在崛起,但是否存在性别设计缺陷?《卫报》。:《卫报》;2020年5月07日。URL:https://www.theguardian.com/careers/2020/may/07/ ai-and-me-friendship-chatbots-are-on-the-rise-but-is-there-a-gendered-design-flaw[2022-04-10]访问
  5. 梅茨·c:和聊天机器人朋友一起度过隔离期:我感觉很亲密。纽约时报,2020年6月16日。URL:https://www.nytimes.com/2020/06/16/technology/chatbots-quarantine-Coronavirus.html[2022-04-10]访问
  6. Muresan A, Pohl H.与机器人聊天:平衡模仿和参与。2019年4月出席:2019年计算系统中人因会议(CHI);5月4 - 9日;苏格兰格拉斯哥,第4-9页。[CrossRef
  7. Følstad A, Araujo T, Law E, Brandtzaeg P, Papadopoulos S, Reis L,等。聊天机器人研究的未来方向:跨学科研究议程。计算2021年12月:2915-2945 [免费全文] [CrossRef
  8. Zarouali B, Van den Broeck E, Walrave M, Poels K.预测消费者对Facebook聊天机器人的反应。网络心理健康网络2018年8月;21(8):491-497。[CrossRef] [Medline
  9. 齐尔罗,徐永杰,Söllner M,李梅斯特;信任聪明的个人助理:系统的文献综述和研究议程的发展。: SSRN。2020年3月发表于:wirtschaftinformatik国际会议(WI);2020年3月;德国波茨坦。[CrossRef
  10. 李淑娟,崔杰。对话代理在电影推荐中的用户体验提升:自我披露和互惠效应。Int J Hum计算Stud 2017;103:95-105 [免费全文] [CrossRef
  11. 韦信I,瑙曼A, Möller S.使用方式对主观感知质量的影响。2010年发表于:口语对话系统技术国际研讨会;10月1日;德国柏林,第188-193页。[CrossRef
  12. Graham S, Huang J, Clark M, Helgeson V.消极情绪的积极作用:愿意表达消极情绪促进人际关系。Pers Soc Psychol Bull 2008:394-406 [免费全文] [CrossRef
  13. 亲密作为一种人际过程。见:个人关系手册:理论、研究和干预。纽约州纽约:John Wiley & Sons;1988:367 - 389。
  14. 西蒙斯J,格林M.社会威胁的分裂话题。议会决议2018:165-187 [免费全文] [CrossRef
  15. Adamopoulou E, Moussiades L.聊天机器人:历史,技术和应用。MLWA 2020年12月;2:100006。[CrossRef
  16. Croes EAJ, Antheunis ML.我们能和Mitsuku做朋友吗?人类与社交聊天机器人关系形成过程的纵向研究。科学通报2020年9月25日;38(1):279-300。[CrossRef
  17. Heckman C, Wobbrock J.把你最好的脸放在前面:拟人化的代理人,电子商务消费者和法律。2000年发表于:第四届自主代理国际会议;6月3日;西班牙巴塞罗那。[CrossRef
  18. 亲密交流:使用电脑诱导消费者自我披露。《消费研究》2000年3月26日(4):323-339。[CrossRef
  19. Fitzpatrick KK, Darcy A, Vierhile M.使用全自动对话代理(Woebot)为有抑郁和焦虑症状的年轻人提供认知行为治疗:一项随机对照试验。JMIR Ment Health 2017 Jun 06;4(2):e19 [免费全文] [CrossRef] [Medline
  20. Jøranson N, Pedersen I, Rokstad AMM, Ihlebæk C.参与机器人辅助活动对痴呆症患者躁动和抑郁症状的影响:一项聚类随机对照试验。美国医学杂志2015年10月1日;16(10):867-873。[CrossRef] [Medline
  21. 于瑞,许娥,李俊,潘东,吴安,席凯,等。使用一种治疗性的社交辅助宠物机器人(PARO)来改善痴呆症患者的情绪和刺激社会互动和交流:一项随机对照试验的研究方案。JMIR Res Protoc 2015年5月01日;4(2):e45 [免费全文] [CrossRef] [Medline
  22. Ta V, Griffith C, Boatfield C, Wang X, Civitello M, Bader H,等。日常环境中同伴聊天机器人社会支持的用户体验:专题分析。J Med Internet Res 2020 Mar 06;22(3):e16235 [免费全文] [CrossRef] [Medline
  23. 张志强,李立平,李志强,等。在家中使用机器人支持慢性阻塞性肺疾病患者:试点随机对照试验J Med Internet Res 2018 Feb 13;20(2):e45 [免费全文] [CrossRef] [Medline
  24. 医疗保健聊天机器人可以提供帮助。IEEE Pulse 2019 5月;10(3):12-14。[CrossRef
  25. Cameron G, Cameron D, Megaw G, Bond R, Mulvenna M, O'Neill S,等。在精神卫生保健领域设计聊天机器人的最佳实践?ihelper的案例研究。见:第32届国际BCS人机交互会议(HCI-2018)论文集。2018年发表于:HCI'18;5月10日;斯温顿,英国,1-5页。[CrossRef
  26. Brandtzaeg P, Følstad A.为什么人们使用聊天机器人。2017年出席:2017国际互联网科学会议;11月22 - 24;希腊塞萨洛尼基p. 22-24网址:https://link.springer.com/chapter/10.1007/978-3-319-70284-1_30#citeasCrossRef
  27. Skjuve M, Følstad A, Fostervold KI, Brandtzaeg PB。我的聊天机器人伙伴——人类与聊天机器人关系的研究。Int J Hum计算Stud 2021年5月;149:102601。[CrossRef
  28. 友谊选择质量的决定因素:发展视角。收录:他们的伙伴:童年和青少年时期的友谊。英国剑桥:剑桥大学出版社;1996:87 - 112。
  29. 阿盖尔,亨德森,友谊的准则。社会科学学报2016年6月30日;1(2):211-237。[CrossRef
  30. 社会交换。在:国际社会科学百科全书。纽约州纽约:麦克米伦;1968:452 - 457。
  31. 库克K,赖斯e,社会交换理论。见:《社会心理学手册》。纽约州纽约:施普林格;2003:53 - 76。
  32. 鲍迈斯特RF,李瑞先生归属的需要:对人际依附的渴望是人类的基本动机。精神通报1995;117(3):497-529。[CrossRef
  33. 斯旺WB,佩勒姆BW,克鲁尔DS。令人愉快的幻想还是令人不快的事实?协调自我提升和自我验证。中华精神病学杂志,1989;29(5):349 - 349。[CrossRef
  34. 陈志,柏杰。争议何时、为何以及如何引发对话。《消费研究》2013年10月1日;40(3):580-593。[CrossRef
  35. 共和党人和民主党人都表示,与持不同意见的人谈论政治是有压力的。2021年11月23日,皮尤研究中心。URL:https://www.pewresearch.org/fact-tank/2021/11/23/republicans-and-democrats-alike-say-its-stressful-to-talk-politics-with-people-who-disagree/[2022-10-04]访问
  36. 解决有争议的问题。欧洲委员会。URL:https://www.coe.int/en/web/campaign-free-to-speak-safe-to-learn/addressing-controversial-issues[2022-04-10]访问
  37. 克拉克D,威尔斯A.社交恐惧症的认知模型。见:社交恐惧症:诊断、评估和治疗。纽约州纽约:吉尔福德出版社;1995:69 - 93。
  38. Hayes SC, Wilson KG, Gifford EV, Follette VM,等。经验回避和行为障碍:诊断和治疗的功能维度方法。中华临床精神病学杂志,1996;29(6):344 - 344。[CrossRef
  39. 普里赞特-帕萨尔,谢克纳,阿德卡。社交焦虑和互联网使用——一个元分析:我们知道什么?我们错过了什么?Comput Human behaviour 2016年9月;62:221-229。[CrossRef
  40. Stafford TF, Stafford MR, Schkade LL。确定互联网的用途和满足感。科学通报2004,35(2):259-288。[CrossRef
  41. 程勇,姜华。人工智能驱动的心理健康聊天机器人:在大规模枪击灾难后检查用户的动机、积极的交流行动和参与。J突发事件危机管理2020年9月29日;28(3):339-354。[CrossRef
  42. 林勇,方超,徐超。手机应用程序的用途和满意度的确定。在:未来信息技术。德国柏林:施普林格;2014:661 - 668。
  43. Replika。URL:https://replika.ai/about/story[2022-09-27]访问
  44. Brown JJ, Reingen PH.社会关系与口碑推荐行为。《消费研究》1987年12月;14(3):350。[CrossRef
  45. 对人类需求新理论的实证检验。管风琴行为与演奏1969年5月;4(2):142-175。[CrossRef
  46. Aly A, Griffiths S, Stramandinoli F.人机交互的度量和基准:认知机器人的最新进展。Cogn Syst Res 2017年6月;43:313-323。[CrossRef
  47. D'Alfonso S, Santesteban-Echarri O, Rice S, Wadley G, Lederman R, Miles C,等。人工智能辅助青少年心理健康在线社会治疗8.《前线精神》2017年6月2日;[CrossRef
  48. Ryan GW, Bernard HR。识别主题的技巧。野外方法2016 july 24;15(1):85-109。[CrossRef
  49. Gabarron E, Larbi D, Denecke K, Årsand E关于聊天机器人在公共卫生领域的应用,我们知道些什么?种马健康技术通知2020年6月16日;270:796-800。[CrossRef] [Medline
  50. Kardas M, Kumar A, Epley N.过于肤浅?:错误的预期会为更深层次的对话制造障碍。中华精神医学杂志,2022年3月22日(3):367-398。[CrossRef] [Medline
  51. 斯坦因N,布鲁克斯K.一项用于减肥的全自动对话人工智能:超重和肥胖成年人的纵向观察研究。JMIR糖尿病2017年11月1日;2(2):e28 [免费全文] [CrossRef] [Medline
  52. 朴山,崔杰,李山,吴c,金c,拉S,等。为压力管理的简短动机访谈设计聊天机器人:定性案例研究。J Med Internet Res 2019年4月16日;21(4):e12231 [免费全文] [CrossRef] [Medline
  53. Abd-Alrazaq A, Safi Z, Alajlani M, Warren J, Househ M, Denecke K.用于评估医疗聊天机器人的技术指标:范围审查。J Med Internet Res 2020 Jun 05;22(6):e18301 [免费全文] [CrossRef] [Medline
  54. 张文杰,李志强,李志强,等。减少有问题物质使用的治疗关系剂(Woebot):开发和可用性研究。J Med Internet Res 2021 3月23日;23(3):e24850 [免费全文] [CrossRef] [Medline
  55. M王子,Patel V, Saxena S, Maj M, Maselko J, Phillips MR等。没有心理健康就没有健康。柳叶刀2007年9月;370(9590):859-877。[CrossRef
  56. 霍洛维茨MC,卡恩L.什么影响人们对人工智能采用的态度:来自美国地方官员的证据。PLoS One 2021 10月20日;16(10):e0257732 [免费全文] [CrossRef] [Medline
  57. Cave S, Craig C, Dihal K, Dillon S, Montgomery J, Singler B,等。对AI的描述和看法,以及它们为什么重要。英国皇家学会2018年12月11日。URL:https://www.repository.cam.ac.uk/handle/1810/287193[2022-04-10]访问


樱桃:网上电子调查报告结果核对表
ERG:存在、关联和成长


编辑:A Kushniruk;提交19.04.22;C Thornson, D Chrimes同行评审;对作者28.06.22的评论;修订版本收到30.07.22;接受29.08.22;发表03.10.22

版权

©Vivian P Ta-Johnson, Carolynn Boatfield, Xinyu Wang, Esther DeCero, Isabel C Krupica, Sophie D Rasof, Amelie Motzer, Wiktoria M Pedryc。最初发表于JMIR Human Factors (https://humanfactors.www.mybigtv.com), 03.10.2022。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Human Factors上的原创作品。必须包括完整的书目信息,https://humanfactors.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map