这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
抑郁症在年轻人中发病率很高,特别是在2019冠状病毒病大流行期间。然而,世界各地的精神卫生服务仍然稀少,而且利用不足。心理健康聊天机器人是一种新型的数字技术,可以为抑郁症状提供全自动干预。
本研究的目的是测试基于认知行为疗法(CBT)的心理健康聊天机器人(XiaoE)在COVID-19大流行期间对患有抑郁症状的年轻成年人的临床有效性和非临床表现。
在一项单盲、3组随机对照试验中,从一所中国大学招募的有抑郁症状的参与者被随机分配到一个心理健康聊天机器人(XiaoE;n=49),一本电子书(n=49),或者一个普通的聊天机器人(小爱;N =50)组,比例为1:1:1。参与者接受为期1周的干预。主要结局是根据患者健康问卷(PHQ-9)在1周后(T1)和1个月后(T2)抑郁症状的减轻。意向治疗和方案分析均在基线数据调整后的协方差模型分析下进行。对缺失数据进行控制多重输入和δ敏感性分析。次要结果是使用工作联盟问卷(WAQ)测量的工作联盟水平,使用用户体验可用性度量(UMUX-LITE)测量的可用性,以及使用可接受度量表(AS)测量的可接受性。
参与者平均年龄18.78岁,37.2%(55/148)为女性。平均基线PHQ-9评分为10.02 (SD 3.18;三分之一的范围)。意向治疗分析显示,与电子书组和小爱组相比,小e组的PHQ-9得分较低。
基于cbt的聊天机器人是一种可行且引人入胜的数字治疗方法,可以为患有抑郁症状的年轻人提供轻松访问和自我指导的心理健康援助。本研究对心理健康聊天机器人的非临床指标进行了系统评估。未来,有必要同时关注临床结果和非临床指标,以探索心理健康聊天机器人对患者的作用机制。需要进一步的证据来证实心理健康聊天机器人的长期有效性,通过更长剂量的重复试验,以及与其他主动对照相比,探索其更强的功效。
中国临床试验注册中心ChiCTR2100052532;http://www.chictr.org.cn/showproj.aspx?proj=135744
COVID-19大流行对人们的心理健康产生了巨大影响,在第一年,全球抑郁症和焦虑症的发病率增加了25%以上,20-24岁的人群比老年人受到的影响更大[
在计算机、互联网、移动设备、移动软件应用程序和虚拟现实(VR)等数字技术的推动下,心理健康问题的治疗经历了前所未有的转变[
聊天机器人是一种新型的心理健康服务数字技术,它是一种依靠人工智能(AI)通过文本或语音模拟与用户对话的软件程序。
根据世界卫生组织的最新数据,2015年全球有322万抑郁症患者[
针对心理健康问题的聊天机器人的技术和形式已经从只有文本交流的脚本机器人发展到具体化的会话代理[
然而,以往的研究更多地关注聊天机器人作为技术载体在干预中的作用,忽视了对心理过程和内容本身的验证和创新。因此,在数字心理健康领域,心理学和人工智能的进展存在差距。聊天机器人旨在促进心理科学与其他领域之间的协作、整合和共同发展[
作为临床效果的一种替代和有用的前兆,非临床指标与临床结果同样重要,可能有助于进一步探索心理健康聊天机器人的工作机制[
本研究采用随机对照试验,对148名中国大学生进行心理健康聊天机器人(XiaoE)治疗抑郁症的表现和疗效进行评估。我们预计,与电子书和普通聊天机器人相比,心理健康聊天机器人在治疗1周后更有效地减轻抑郁症状,并且这种效果在干预后持续1个月(主要假设)。此外,我们假设心理健康聊天机器人可以更容易地与用户建立关系,增强参与度,并在治疗过程中改善用户体验(次要假设)。
该研究是在中国天津的一所大学进行的一项单盲、3组随机对照试验。大学生从社交媒体、在线平台和大学社区中招募,或者由咨询中心的辅导员介绍到这里。所有潜在的参与者都经过心理咨询师筛选,符合以下入选标准:(1)年龄17-34岁;(2)大学生心理健康筛查量表(CSMHSS)抑郁分量表平均得分[
通过小鄂技术开发团队自主开发的计算机程序进行性别分层随机化。被随机分配(1:1:1)接受心理健康聊天机器人干预、电子书干预或普通聊天机器人干预的参与者在第一次登录小e时自动进入相应的干预过程。治疗分配对参与者、研究者和参与试验数据分析的人员是保密的,因为这些数据由多方(研究设计者、试验实施者、数据处理者和技术开发代表)以加密的电子文件形式保存,并在数据分析完成后进行盲化。干预和结果测量都是在线完成的,在干预期间没有调查人员可以访问参与者的系统(单盲)。
干预时间为1周。在入组当天(T0),收集基线数据,包括主要结局指标(9项患者健康问卷[PHQ-9])的预测和人口统计信息。1周后(T1)对主要结果进行后测,同时对次要结果进行工作联盟性、可用性和可接受性测试。在入组后30天(T2)对主要结局进行最终随访评估。
小鄂是一款针对抑郁症开发的基于cbt的无导向聊天机器人,可以通过与用户的全自动智能交互(文字、图像、语音),对抑郁症状进行筛查、预防和自助。小e的技术植根于自然语言处理(NLP)和深度学习[
小e配备了完整的流程指导和日常任务提醒。在试验实施期间,参与者每天只需要跟随小e的指导,工作人员只提供技术或操作问题的答案。此外,还可以在系统后台获取小e参与和使用的交互数据。由于相互作用发生在小e系统之外,因此无法从对照组获得数据。结果,在试验结束时,以自评问卷的形式测量了对照组的互动频率。
对照组1的参与者被安排阅读一本关于抑郁症的电子书《我有一只黑狗》。
对照组2的参与者被要求每天至少与小爱交流一次。小爱是中国的一个聊天机器人,旨在满足更广泛受众的闲聊需求,而不是专门用于抑郁症等心理健康服务。参与者和小爱之间的聊天内容不受限制。然而,我们限制了每天的谈话话题(对应于干预组的日常功能模块),并向参与者提出了具体的聊天任务。例如,第二天的主题是自尊,我们支持参与者与小爱分享他们对自尊的看法和感受,讨论“自尊如何影响我们的情绪状态以及它与抑郁之间的关系”,与小爱评估他们目前的自尊水平,并询问“如何提高自尊”的建议。
主要观察指标为PHQ-9评分[
次要指标为工作联盟问卷(WAQ)得分[
样本量计算采用G* Power(版本3)[
采用SPSS (version 26;IBM公司)。为了确定在基线时各组之间是否存在显著差异,
意向治疗(ITT)分析[
缺失的数据机制假设有三大类[
依从性通过对参与者流失的卡方分析来揭示,而参与度则通过与聊天机器人互动的频率和持续时间来揭示。如果与聊天机器人的互动在2分钟内持续至少2次输入,并且休息时间不超过1分钟,则该互动被认为是一次会话。平均互动频率定义为在为期一周的干预期间,每个参与者每天与聊天机器人的平均会话数。平均交互持续时间定义为每天从用户第一次输入内容到聊天机器人最后一次输出内容之间每个会话的平均响应时间,以毫秒计算。为期1周的干预期分为第1 ~ 7天,每天24小时分为12个2小时时间段。我们记录并计算了7天和12个时间段的平均交互频率和平均交互时间。在所有随访测量完成后,我们重新联系了所有入组的参与者,并开放了XiaoE的访问。在试验结束时,他们被问及3个开放式问题:“你使用小e的最佳体验是什么?”“你使用小e最糟糕的经历是什么?”、“请对小娥提出一些个人意见或建议。”我们使用潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)对参与者的反馈进行了专题分析[
本研究方案经天津市安定医院(天津市精神卫生中心;数量:2021 - 21)。所有参与者均提供知情同意。
参与者的流动(CONSORT)。大学生心理健康筛查量表。
随机分组组的基线特征。
特征 | XiaoE (N = 49) | 电子书(N = 49) | Xiaoai (N = 50) | 总(N = 148) |
|
|
|||||||
phq - 9一个平均得分(SD) | 10.10 (3.18) | 9.18 (3.94) | 10.76 (3.86) | 10.02 (3.71) | 2.294 (2145) | 厚 | |||||||
年龄,平均(SD) | 18.80 (0.89) | 18.92 (0.84) | 18.64 (0.90) | 18.78 (0.88) | 1.258 (2145) | 29 | |||||||
|
|
|
|
|
0.023 (2) | 获得 | |||||||
|
男性 | 31 (63.3) | 31 (63.3) | 31 (62.0) | 93 (62.8) |
|
|
||||||
|
女 | 18 (36.7) | 18 (36.7) | 19日(38.0) | 55 (37.2) |
|
|
||||||
|
|
|
|
|
3.239 (2) | .20 | |||||||
|
汉 | 44 (89.8) | 44 (89.8) | 49 (98.0) | 137 (92.6) |
|
|
||||||
|
汉族以外的 | 5 (10.2) | 5 (10.2) | 1 (2.0) | 11 (7.4) |
|
|
||||||
|
|
|
|
|
2.043 (2) | 36 | |||||||
|
是的 | 16 (32.7) | 13 (26.5) | 10 (20.0) | 39 (26.3) |
|
|
||||||
|
没有 | 33 (67.3) | 36 (73.5) | 40 (80.0) | 109 (73.7) |
|
|
||||||
|
|
|
|
|
0.450 (2) | .80 | |||||||
|
是的 | 6 (12.2) | 4 (8.2) | 5 (10.0) | 15 (10.1) |
|
|
||||||
|
没有 | 43 (87.8) | 45 (91.8) | 45 (90.0) | 133 (89.9) |
|
|
||||||
|
|
|
|
|
1.912 (2) | 38 | |||||||
|
是的 | 3 (6.1) | 4 (8.2) | 1 (2.0) | 8 (5.4) |
|
|
||||||
|
没有 | 46 (93.9) | 45 (91.8) | 49 (98.0) | 140 (94.6) |
|
|
||||||
|
|
|
|
|
5.057 (4) | .28 | |||||||
|
城市 | 11 (22.5) | 14 (28.6) | 12 (24.0) | 37 (25.0) |
|
|
||||||
|
郊区 | 10 (20.4) | 6 (12.2) | 15 (30.0) | 31 (20.9) |
|
|
||||||
|
农村 | 28日(57.1) | 29 (59.2) | 23日(46.0) | 80 (54.1) |
|
|
||||||
|
|
|
|
|
6.089 (4) | .19 | |||||||
|
和谐 | 36 (73.5) | 42 (85.7) | 45 (90.0) | 123 (83.1) |
|
|
||||||
|
不和谐 | 7 (14.3) | 5 (10.2) | 2 (4.0) | 14 (9.5) |
|
|
||||||
|
离婚了 | 6 (14.2) | 2 (4.1) | 3 (6.0) | 11 (7.4) |
|
|
一个PHQ-9: 9项患者健康问卷。
b
在分配到小e组的49名参与者中,4人在1周内退出,1人在1个月期间退出。在被分配到电子书组的49名参与者中,10人在1周内退出,7人在1个月内退出。在被分配到小爱组的50名参与者中,9人在1周内退出,11人在1个月内退出(
在T1时,实验组与基线PHQ-9评分之间无显著交互作用(
与对照组相比,小e组参与者的抑郁症状明显减轻,并且在T1 (
所有结果在敏感性分析下都是稳健的,除了与T2时的电子书比较,从显著到不显著(
主要结果测量和全分析集和每个方案集的组间差异。
分析和时间点 | XiaoE | 电子书 | Xiaoai |
|
|
η2 | 科恩的 |
|||||||||||||||||||||||||||||||
|
调整一个phq - 9b,平均值(SE) | n | 调整一个phq - 9b,平均值(SE) | n | 调整一个phq - 9b,平均值(SE) | n |
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
7.58 (0.30) | 45 | 8.62 (0.30) | 39 | 10.10 (0.30) | 41 | 17.011 (2136) | <.001 | 0.060 | 0.51 | |||||||||||||||||||||||||||
|
|
从基线更改 | −2.44 (0.30) |
|
−1.40 (0.30) |
|
0.08 (0.30) |
|
|
|
|
|
||||||||||||||||||||||||||
|
|
7.82 (0.34) | 44 | 9.01 (0.35) | 32 | 9.39 (0.35) | 30. | 5.477 (2136) | .005 | 0.024 | 0.31 | |||||||||||||||||||||||||||
|
|
从基线更改 | −2.20 (0.34) |
|
−1.01 (0.35) |
|
−0.63 (0.35) |
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
7.51 (0.28) | 45 | 9.29 (0.30) | 39 | 10.51 (0.30) | 41 | 26.168 (2113) | <.001 | 0.088 | 0.62 | |||||||||||||||||||||||||||
|
|
从基线更改 | −2.84 (0.28) |
|
−1.06 (0.30) |
|
0.16 (0.30) |
|
|
|
|
|
||||||||||||||||||||||||||
|
|
7.92 (0.37) | 44 | 9.23 (0.43) | 32 | 10.04 (0.46) | 30. | 6.408 (94) | .002 | 0.044 | 0.43 | |||||||||||||||||||||||||||
|
|
从基线更改 | −2.41 (0.37) |
|
−1.10 (0.43) |
|
−0.29 (0.46) |
|
|
|
|
|
一个根据基线PHQ-9评分、年龄、性别、种族、独生子女、单亲、宗教、家庭所在地和父母婚姻进行调整。
bPHQ-9: 9项患者健康问卷。
cITT公司:意向处理。
d页:按方案。
减轻参与者抑郁症状的功效。该图显示了主要结局测量指标(9项患者健康问卷[PHQ-9])与基线的平均变化,以及干预后和随访时小e组与电子书组和小爱组的组间差异。显示平均值和标准误差。(A)意向治疗分析。(B)协议分析。*
δ敏感性分析。
时间和分析一个 | 与电子书相比 | 与小爱相比 | |||||||
组差值(SE) | 95%可信区间 |
|
组差值(SE) | 95%可信区间 |
|
|
|||
|
|
|
|
|
|
|
|
||
|
心肌梗死b, 3月c | −1.52 (0.43) | −2.38 ~−0.66 | 措施 | −2.62 (0.42) | −3.45 ~−1.78 | <.001 |
|
|
|
δ=−0.31 | −1.45 (0.43) | −2.31 ~−0.59 | 措施 | −2.52 (0.42) | −3.36 ~−1.69 | <.001 |
|
|
|
δ=−0.62 | −1.38 (0.44) | −2.25 ~−0.51 | .002 | −2.43 (0.43) | −3.27 ~−1.58 | <.001 |
|
|
|
δ=−0.93 | −1.31 (0.44) | −2.19 ~−0.43 | 04 | −2.33 (0.43) | −3.18 ~−1.48 | <.001 |
|
|
|
δ=−1.24 | −1.24 (0.45) | −2.13 ~−0.35 | .007 | −2.24 (0.44) | −3.10 ~−1.37 | <.001 |
|
|
|
|
|
|
|
|
|
|
||
|
, 3月 | −1.11 (0.54) | −2.18 ~−0.03 | .043 | −1.65 (0.55) | −2.74 ~−0.56 | .003 |
|
|
|
δ=−0.32 | −1.03 (0.54) | −2.11 ~ 0.04 | 06 | −1.55 (0.55) | −2.64 ~−0.46 | .006 |
|
|
|
δ=−0.64 | −0.96 (0.55) | −2.05 ~ 0.12 | 。08 | −1.45 (0.55) | −2.55 ~−0.35 | . 01 |
|
|
|
δ=−0.96 | −0.89 (0.55) | −1.98 ~ 0.20 | 厚 | −1.35 (0.56) | −2.46 ~−0.24 | 02 |
|
|
|
δ=−1.28 | −0.81 (0.56) | −1.92 ~ 0.29 | 酒精含量 | −1.25 (0.56) | −2.37 ~−0.13 | 03 |
|
一个所有参与者的PHQ-9评分从基线到干预后的绝对平均变化为- 1.24,所有参与者的PHQ-9评分从基线到随访的绝对平均变化为- 1.28。
bMI:多重imputation。
c随机失踪。
在T1时,实验组与基线PHQ-9评分无显著交互作用(
与对照组相比,小e组参与者的抑郁症状明显减轻,并且在T1 (
如图所示
使用和参与小e。图中显示了干预期间小e组与聊天机器人互动的频率和持续时间,以及每天12个时间段的日常互动和互动趋势。(A)每日参与。x轴表示1周干预的每一天。(B)聘期为12个时期。x轴表示1天内的每个时间段。
次要结果测量和不同条件之间的差异。
变量 | XiaoE (n=49), mean (SD) | 电子书(n=49),均值(SD) | 小爱(n=50),均值(SD) |
|
|
|
|
|
|
|
|
|
|
|
总计 | 53.94 (5.96) | 50.35 (9.38) | 50.68 (6.87) | 3.407 (2145) | .04点 |
|
目标任务 | 17.22 (2.71) | 16.43 (3.10) | 16.54 (2.48) | 1.188 (2145) | 。31 |
|
债券 | 18.47 (1.92) | 17.06 (3.26) | 17.32 (2.64) | 3.890 (2145) | 02 |
|
订婚 | 18.24 (2.25) | 16.86 (3.54) | 16.82 (2.69) | 3.925 (2145) | 02 |
|
|
|
|
|
|
|
|
总计 | 8.61 (1.43) | 8.31 (1.52) | 8.24 (1.30) | 0.968 (2145) | 38 |
|
有用性 | 4.16 (0.94) | 4.14 (0.76) | 4.08 (0.78) | 0.135 (2145) | .87点 |
|
易用性 | 4.45 (0.71) | 4.16 (0.87) | 4.16 (0.77) | 2.192 (2145) | 点 |
|
|
|
|
|
|
|
|
总计 | 27.86 (3.25) | 25.82 (5.04) | 25.48 (4.53) | 4.322 (2145) | 02 |
|
整体满意度 | 4.67 (0.75) | 4.43 (0.89) | 4.32 (0.89) | 2.264 (2145) | 厚 |
|
内容的满意度 | 4.76 (0.52) | 4.45 (0.79) | 4.30 (0.81) | 5.093 (2145) | .007 |
|
情感意识 | 4.57 (0.74) | 4.20 (1.00) | 4.12 (0.90) | 3.636 (2145) | 03 |
|
学习新知识 | 4.63 (0.64) | 4.27 (0.95) | 4.16 (0.89) | 4.330 (2145) | 02 |
|
与日常生活相关 | 4.67 (0.63) | 4.14 (1.10) | 4.30 (0.81) | 4.834 (2145) | .009 |
|
推广自助过程 | 4.55 (0.77) | 4.33 (0.94) | 4.28 (0.83) | 1.429 (2145) | 。 |
一个WAQ:工作联盟问卷。
bUMUX-LITE:用户体验的可用性度量。
cAS:可接受度量表。
根据LDA的主题困惑度图表(
就对有关的问题的反馈,出现了以下4个主题
关于对有关的问题的反馈,出现了以下两个主题
参与者对“意见或建议”问题的反馈主要可以提炼为以下3个主题:希望对话过程更流畅,更多的情感反应和互动,以及服务器升级。
主题和困惑的图表。如图所示,在“您使用小鄂的最佳体验是什么?”和“您使用小鄂最糟糕的体验是什么?”这两个问题中,参与者在不同主题数量下的困惑度。(A)“最佳体验”的主题困惑图。(B)“最糟糕经历”的主题困惑图。
参与者反馈的主题和关键词。
问题和主题 | 关键字 | ||
|
|
||
|
的关系 | 陪伴,关心,孤独,青睐,关怀 | |
|
情感 | 快乐,放松,压力,宣泄,陪伴 | |
|
个性化 | 思考,学习,抑郁,情绪和智力 | |
|
实用性 | 便利、帮助、现实、方法和可用性 | |
|
|
||
|
内容 | 不灵活、反应迟钝、乏味、重复和机械 | |
|
技术 | 故障、延迟、系统、崩溃和不灵活 |
据我们所知,这是第一个直接比较心理健康聊天机器人和普通聊天机器人对抑郁症状进行自动远程治疗的临床疗效的研究。我们通过单盲、3组随机对照试验对小鄂的短期和长期疗效进行了检验,并建立了心理健康聊天机器人非临床指标的系统评价,为今后的研究提供参考。
这项试验的参与者平均年龄为18.78岁,比成年人或大学生的典型研究样本年轻,这表明对心理健康聊天机器人的研究正在转化为青少年样本。此外,与之前的研究相比,更多的男性参与了这项研究,而在之前的研究中,大多数参与者都是女性。鉴于目前还没有对青少年做得很好的研究,我们希望将来能看到更多这样的研究。
在流失率方面,小e组的参与者退出率低于电子书组和小爱组的参与者。小e与高参与度相关,尤其是在试验的开始和结束时,这种参与度上升到最高水平,这表明小e对参与者很有吸引力,当参与者接触到这种新颖的人工智能时,小e可以迅速建立关系。使用小e的参与者在每天中午12点到下午2点最活跃,这可能与小e每天12点后设置的自动任务提醒有关。但周激活和日激活的趋势在参与度上有较大波动,说明参与者与小e之间的关系不够稳定和牢固。
ITT分析显示,与2个对照组相比,小e治疗抑郁症的效果明显更好,持续1周,达到中等效果(
需要注意的是,虽然通过心理健康聊天机器人干预有显著改善症状,但改善的幅度很小。因此,心理健康聊天机器人更适合作为一种辅助工具,与传统的心理咨询和治疗相结合,或者作为治疗精神疾病的初级保健方法。虽然在实际临床实践中迅速实施干预具有挑战性,但至少在目前,干预对希望获得自助心理健康服务的个人来说是有效和方便的。这是有道理的,因为这些人代表了一个更大的群体,而且这种无指导工具的推广将大大减少人力和财政资源的成本。
小鄂表现出显著的高水平的可接受性和工作联盟,但不显著的高水平可用性。这说明小e在关系建立上已经初步达到了能力的标准,但在用户界面、操作系统等方面,还需要为用户进一步简化。参与者报告说,在“关系”、“情感”、“个性化”和“实用性”四个主题中,小e的体验最好。“关系”这一主题反映了小e与参与者之间关系的建立、发展和作用,如Dosovitsky等[
如前所述,在聊天机器人中使用心理学仍然是肤浅的。尽管我们的内容是基于CBT的,但我们通过主题分析发现,参与者的评论几乎没有提到它。XiaoE的谈话并不总是向参与者强调CBT本身,就像病人从人类治疗师那里接受治疗,可能会觉得他们正在改善,但不知道他们实际上接受的是哪种治疗。另一方面,CBT也有它的局限性。尽管CBT是一种高度结构化的疗法,但将典型的基于CBT的心理治疗转化为聊天机器人的设置是困难的。
我们增加了一个通用的聊天机器人(小爱)干预作为控制条件,以证明心理设计和内容对心理健康聊天机器人的意义。有趣的是,与小爱互动的参与者在接受为期一周的干预后,抑郁症状略有恶化。这表明,使用一般的聊天机器人来治疗心理健康问题可能是有害的,而专门设计的心理健康聊天机器人可能需要缓解抑郁症状。在本研究中,增加了随访以考察长期有效性,并进行了基于δ的敏感性分析以确保结论的稳健性。我们对心理健康聊天机器人的非临床指标建立了创新的系统评估,随着样本量的增加,LDA首次应用于用户反馈的主题分析。
本研究存在一些局限性:首先,由于工具的特殊性和对实际招募的考虑,无法对研究者和参与者进行双盲。为了便于管理,我们为148名被招募的参与者建立了一个在线小组,在试验实施过程中提供重要信息和技术解决方案,这是一个潜在的风险,可能导致他们试图揭示自己干预措施的不同内容,从而对其他参与者的有效性产生主观影响。在今后的网上研究中应特别注意这一点。其次,本研究1周的干预时间较短,如果延长干预时间,结果可能会有所不同。从每周激活的趋势可以看出,小e的参与度波动幅度较大,小e表现出较强的吸引力,但在试验过程中迅速消退。这可能是由于与呆板乏味的内容的反复交互,以及小故障和滞后等技术问题造成的。可以推测,聊天机器人可能更适合短期干预,而不是长期干预,这需要在更长的治疗周期的进一步研究中探索。第三,对于对照条件,干预本身的证据力度仍然有限,电子书干预作为一种自助方式,只涉及心理教育的概念,并没有配备一套完整的心理治疗方案[
疫情后时代,人们的生活方式发生了深刻变化,数字技术和互联网信息化受到前所未有的关注。可以合理预测,在未来,基于聊天机器人的数字心理治疗将在精神卫生保健领域发挥重要作用[
目前,有许多心理内容优秀的数字化治疗手段,对心理治疗过程中的有效因素,如情绪反应、治疗联盟、共情、个性化等关注较少。尽管人们怀疑机器是否能提供情感体验,但它们对表达情感的代理的反应通常比那些不表达情感的代理更好。
心理健康聊天机器人小e可以作为一种可行的、吸引人的、有效的大学生抑郁症状的数字干预手段。与一般聊天机器人相比,小e显示出显著的短期和长期有效性,经敏感性分析后仍保持稳健,说明心理设计和过程在数字心理健康领域的独特作用。在治疗过程中,小娥表现出了与用户建立关系、增强参与度和改善用户体验的特殊能力。需要进一步的证据来证实其长期有效性,通过更长的剂量重复试验,并探索其与其他主动对照相比的更大功效。
concont - ehealth检查表(V 1.6.1)。
人工智能
协方差分析
可接受范围内
认知行为疗法
大学生心理健康筛查量表
网络认知行为疗法
意向处理
潜在狄利克雷分配
随机失踪
完全随机失踪
多个归责
思念不是随意的
自然语言处理
9项患者健康问卷
按方案
用户体验的可用性指标——lite
虚拟现实
工作联盟问卷
本研究由人工智能与可持续发展目标(AI4SDGs)研究计划和国家社会科学基金(批准号:14AZD111,批准号:21B[GL0031]0)资助。我们感谢小米公司对聊天机器人的技术支持,感谢天津安定医院对心理健康内容的监督,感谢张鹏教授、王博副教授对小鄂的设计和开发提出的宝贵建议,感谢张强、李彤的统计学专业知识,感谢方正、胡晓军在试验实施过程中的努力。
YH, LY和BW对该研究的构想做出了贡献。YH, LY和TT设计了小e干预的过程和内容。SZ为XiaoE的发展做出了贡献。YH设计了试验并起草了手稿。XZ参与了参与者的招募和筛选。YH、XZ、CQ、TT进行试验。LY, BW和SZ对试验的设计进行了评论,并监督了数据的收集和分析。YH和CQ分析了数据。所有作者都对内容进行了严格的修改,并通过了最终版本。
没有宣布。