这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
文本挖掘方法,如主题建模,可以提供关于互联网提供的认知行为疗法(iCBT)如何工作以及对谁工作的有价值的信息。尽管iCBT处理为主题建模提供了方便的数据,但很少在这种情况下使用。
我们的目的是将主题建模应用于来自iCBT的广泛性焦虑障碍的书面作业文本,并探索由此产生的主题与治疗反应的关联。由于主题数量的预先确定在主题建模中是一个相当大的挑战,我们还旨在探索一种新的主题数量选择方法。
我们定义了两个潜在的狄利克雷分配(LDA)主题模型,使用一种新的数据驱动和一种更常用的基于可解释性的主题编号选择方法。我们使用多水平模型将主题与连续值治疗反应联系起来,连续值治疗反应定义为在整个治疗过程中GAD-7和评分的每节变化率。
我们的分析包括1686例患者。我们从数据驱动的LDA模型中观察到2个与平均治疗反应相关的主题:“家庭、宠物和亲人的福祉”(B= -0.10 SD/会议/∆主题;95% CI -016至-0.03)和基于可解释性模型的“儿童,家庭问题”(B= -0.18 SD/session/∆topic;95% CI -0.31 ~ -0.05)。有两个主题与较差的治疗反应相关:来自数据驱动模型的“思想和担忧的监测”(B=0.06 SD/会议/∆主题;95% CI 0.01 ~ 0.11)和基于可解释性模型的“网络治疗”(B=0.27 SD/session/∆topic;95% CI 0.07 ~ 0.46)。
两个LDA模型在可解释性和主题的广度方面有所不同,但都以可解释的方式包含与治疗反应相关的主题。我们的工作表明,主题建模非常适合iCBT研究,并有潜力在大量文本数据中暴露临床相关信息。
互联网提供的认知行为疗法(iCBT)是治疗广泛性焦虑症(GAD)的有效方法[
以前许多使用计算机方法分析心理治疗文本的研究都依赖于文本分类中预先确定的单词类别[
主题模型,如潜在狄利克雷分配(LDA),是一种无监督的机器学习模型,通过将文本表达为潜在主题的混合来降低数据维数[
以前的心理治疗主题建模研究使用了来自整个治疗过程的文本数据,其中言语相对自由。这种类型的数据是丰富的,并有可能揭示心理治疗过程中语言使用的广泛内容。然而,我们认为更加结构化的iCBT数据有一些好处。首先,内容范围太广的数据在探索性统计分析方面可能不是理想的,这是由于一种被称为“维度的统计诅咒:如果数据有维度。
不管具体的应用程序上下文如何,估计LDA主题模型都需要分析人员指定模型中潜在主题的数量。这在使用大型自然数据集(如iCBT文本)时提出了一个挑战,因为在这些数据中几乎不可能预先确定不同的语义内容。选题数量的选择需要谨慎,选题过少和过多都会影响LDA模型估计的可靠性[
在本文中,我们将主题建模应用于来自iCBT的广泛性焦虑症的大型自然文本数据集,该数据集作为芬兰公共卫生保健的一部分提供[
数据是作为治疗师辅助的广泛性焦虑症iCBT常规护理的一部分获得的,由HUS赫尔辛基大学医院(HUS-iCBT)制造和交付。hhs - icbt治疗广泛性焦虑症是一种标准化治疗,包括12周疗程和治疗结束后3个月的随访疗程。该治疗是芬兰公共专业精神卫生保健的一部分,针对症状轻微至中重度的成年患者和16岁及以上的未成年人。排除标准为自杀倾向、急性精神病、严重人格障碍和影响认知功能的神经或神经精神障碍。有关治疗的更详细描述,请参见Ritola等[
原始数据集包括2218名患者,他们在2015年1月至2019年9月期间进入、完成或退出了治疗。由于我们对实际观察到的每次症状下降感兴趣,我们在多级模型中有效地使用了所有可用数据(参见治疗反应模型部分)。我们的目标是以自然的方式对完成者和辍学者的症状变化进行建模,因此我们没有归因任何缺失的数据。由于患者需要完成症状问卷,以便在每个治疗阶段继续治疗,因此可以从每个患者完成的所有治疗阶段获得完整的症状数据。
我们的文本数据来自焦虑日记任务表,在整个治疗过程中,它被用作3个不同的会话间任务的一部分。作业是(1)简单的担忧日记,患者写下对自己的担忧和相关行为的观察,(2)通过在一天的特定时间内写担忧日记来推迟担忧,以及(3)练习解决问题的技能。患者不需要在治疗期间完成任务,他们可以随心所欲地使用任务表。有关担忧日记的更详细描述,请参见
在每个疗程开始时,使用广泛性焦虑障碍7项量表(GAD-7)评估患者的焦虑症状[
本研究是一项研究项目的一部分,该项目已获得HUS赫尔辛基大学医院伦理委员会使用数据的许可(批准号HUS/1861/2020)。
我们的文本语料库由担忧日记任务表条目(
我们使用LDA对忧虑日记条目进行主题建模[
如前所述,选题的数量
可用数据的数量会影响一个复杂模型的值有多大
无担忧日记的患者不包括在LDA建模语料库中。为了对写作活动进行全方位建模,我们将这些患者纳入多层建模数据集。为了治疗反应效应大小的可解释性,我们根据GAD-7基线测量标准对GAD-7总和评分进行了标准化。为了便于在治疗开始时将模型截取的数据解释为焦虑,我们将治疗会话的运行次数设置为0。
为了模拟写作活动,我们为担心日记条目的数量定义了4个变量。第一个是整个治疗过程中的条目总数,标记为总条目。然后,我们根据不同的忧虑日记任务分配划分了条目的数量,并为条目的数量创建了3个额外的变量:条目1(忧虑日记),条目2(忧虑延迟)和条目3(问题解决)。
为了使用来自LDA模型的主题作为治疗反应的相关因素,我们通过计算LDA模型的主题概率参数θ在患者担忧日记条目上的平均值来评估每个患者的主题的平均发生率。对于无条目的患者,将各主题的出现次数设为0。
我们定义了2个基线治疗反应模型,包括会话次数作为固定效应协变量,患者内时间平均焦虑水平作为随机截距[
我们使用2个单独的模型估计了忧虑日记书写活动与治疗反应之间的关联。模型2将总条目作为固定效应相关项。在模型3中,我们使用其他3个条目变量作为固定效应相关来估计不同担忧日记任务分配的影响。
然后,我们估计了来自2个LDA模型的主题与治疗反应的关联。每个主题分别被添加为基础模型的固定效应相关(模型4)。然后,我们调整了3个输入变量的模型,以将不同任务下主题与治疗反应的独立关联与其与写作活动的关联分开(模型5)。在同一LDA模型中,对具有显著治疗-反应效应的主题与其他显著主题进行了额外调整,以考虑主题之间潜在的混淆效应(模型6)。所有分析均使用R(3.6.3版本,R统计计算基础)[
数据预处理后的基线特征。
|
多级建模数据集(n=1686一个) | 乔治。b建模语料库(n=1448) | 0个条目的患者(n=239) | ||||
|
|||||||
|
女 | 1322 (78) | 1155 (80) | 165 (69) | |||
|
男性 | 364 (22) | 239 (20) | 74 (31) | |||
年龄(年),平均值(SD) | 33.2 (12.0) | 33.5 (12.0) | 31.7 (11.7) | ||||
完成的会话数,平均值(SD) | 7.8 (4.4) | 8.6 (4.0) | 3.2 (3.2) | ||||
完成全部12次治疗n (%) | 730 (43) | 712 (49) | 16 (0.1) | ||||
|
7.1 (8.7) | 8.2 (8.9) | 0 | ||||
|
条目1(忧虑日记) | 4.7 (5.3) | 5.5 (5.4) | 0 | |||
|
条目2(担心延期) | 1.6 (4.2) | 1.9 (4.5) | 0 | |||
|
条目3(解决问题) | 0.7 (1.6) | 0.9 (1.7) | 0 | |||
GAD-7c治疗开始时,平均值(SD) | 13.1 (3.6) | 13.1 (3.6) | 13.2 (3.4) |
一个排除背景资料缺失(n=11)或GAD-7评分< 8 (n=521)的患者。
bLDA:潜狄利克雷分配。
cGAD-7:广泛性焦虑障碍7项。
我们选择7个作为数据驱动模型的最佳主题数量,使用贝叶斯方法进行主题数量选择(
患者之间的症状轨迹存在异质性,模型1与模型0相比具有更好的随机斜率拟合(仅随机截距;χ22= 760.17;
在模型2中,忧虑日记的总数具有显著的治疗-反应调节效应(B=0.001;95%置信区间0.000至0.002;对于按条目会话交互)。效应大小是适度的:在总条目数量中增加1个条目,与焦虑的平均下降速度慢0.001标准偏差相关。在模型3中,只有在治疗后期阶段写下的条目数量仍然是显著的治疗-反应调节因子(任务分配担心延迟和问题解决;
一个多水平回归模型,将连续值治疗反应与不同焦虑日记任务分配期间的写作活动联系起来(n=1686)。观测数(GAD-7测量)=13,205。
效果 | 估计一个 | 95%可信区间 |
|
||||
|
|||||||
|
拦截 | −0.087 | −0.260 ~ 0.087 | .33 | |||
|
会话数量 | −0.147 | −0.158 ~ 0.135 | <措施 | |||
|
治疗调节效果,条目1(变化/会话)b | −0.001 | −0.002 ~ 0.001 | 23) | |||
|
治疗调节效果,条目2(变化/会话) | 0.002 | 0.000至0.003 | 03 | |||
|
治疗调节效果,条目3(变化/会话) | 0.005 | 0.001 ~ 0.010 | 02 | |||
|
基线效应,条目1 | 0.014 | 0.004 ~ 0.023 | .006 | |||
|
基线效应,条目2 | −0.003 | −0.017 ~ 0.010 | 收 | |||
|
基线效应,条目3 | −0.031 | −0.066 ~ 0.004 | 。08 | |||
|
年龄 | −0.009 | −0.013 ~−0.005 | <措施 | |||
|
性 | 0.086 | −0.029 ~ 0.201 | .14点 | |||
|
|||||||
|
剩余方差 | 0.64 | - - - - - -c | - - - - - - | |||
|
患者间截距标准差 | 0.90 | - - - - - - | - - - - - - | |||
|
患者间斜率标准差 | 0.10 | - - - - - - | - - - - - - | |||
|
Intercept-slope相关性 | −0.15 | - - - - - - | - - - - - - |
一个估算:回归系数。
b会话数与每个输入变量之间的相互作用被解释为治疗调节效应。
c不适用。
两个LDA模型都包含2个调节治疗反应的主题。有关这些主题的描述,请参见
潜在狄利克雷分配模型中调节治疗反应的主题。
模型和主题 | 十大热门词汇一个 | 内容解读b | 例子c | ||||
|
|||||||
|
1 | 孩子,汽车,生活,儿子,父亲,狗,丈夫,家,母亲,儿子 | 家庭、宠物和爱人的幸福 | “如果我爸爸出车祸了怎么办?” | |||
|
4 | 自我,事物,思想,生活,思想,事物,尝试,感觉,自己,只有 | 监控思想和担忧 | “我再一次回想起我生命中所有的错误。” | |||
|
|||||||
|
21 | 写作,网络治疗,治疗,担心,担心日记,写/书/信,信息,任务,这个,部分 | 网络疗法 | “恐怕网络疗法对我不起作用。” | |||
|
24 | 孩子,父亲,母亲,如何,母亲的,丈夫的,儿子,女儿,孩子的,孩子 | 孩子,家庭问题 | “因为带女儿去日托所的事和丈夫吵了一架。” |
一个词语从芬兰语翻译过来,并在潜在狄利克雷分配模型中根据其词-主题概率降序出现。
b内容的解释是基于对日记条目的定性检查,每个主题都有很强的代表性。
c示例由第一作者生成,并基于代表每个主题的典型日记条目。
主题1被解释为对家人和爱人福祉的担忧,与每节课的焦虑下降速度快于平均水平相关(B= -0.10 SD/节/∆θ;95% CI -016至-0.03)。也就是说,平均而言,一个只写了主题1的假设患者(主题1的平均主题概率θ =1)比一个从未写过主题的患者(主题1的平均主题概率θ =0)恢复速度快0.1 GAD-7个标准差。该主题的平均主题概率的观察范围为0.0007至0.90。主题4(思想和担忧的监测)与每节课的焦虑下降速度低于平均水平相关(B=0.06 SD/节/∆θ;95% CI 0.01 ~ 0.11)。在对不同任务分配期间的条目数量进行调整后,只有主题1仍然是治疗反应的显著调节者(
来自数据驱动的潜在狄利克雷分配模型的主题作为治疗反应的调节因子,在不同的担忧日记任务分配期间根据写作活动进行调整。
主题21(网络治疗)与每节焦虑下降速度低于平均水平相关(B=0.27 SD/ (θ);95% CI 0.07至0.46),而话题24(儿童,家庭问题)与焦虑的下降快于平均水平相关(B= -0.18 SD/次/∆θ;95% CI -0.31 ~ -0.05)。在调整了不同任务分配期间的条目数量后,这两个主题仍然是治疗反应的重要调节因素(
来自基于可解释性的潜在狄利克雷分配模型的主题作为治疗反应的调节因子,在不同的担忧日记任务分配期间根据写作活动进行调整。
在这项研究中,我们使用主题建模来分析来自广泛性焦虑症iCBT治疗期间撰写的担忧日记的文本数据。治疗结束时较高的忧虑日记书写活动与较差的治疗反应弱相关,定义为每个疗程症状变化较慢。我们的主题模型成功地从iCBT文本中提取了有意义的主题,其中一些主题以可解释的方式与治疗反应相关。这与之前的心理治疗主题建模研究一致[
两个LDA模型都包含一个主题,反映了对他人的担忧,并且与症状比平均水平更快的减轻有关。对于数据驱动的模型,这个主题被标记为“家庭、宠物和爱人的幸福”,基于代表该主题的条目内容。在基于可解释性的模型中,这个主题被标记为“孩子,家庭问题”,因为它更狭隘地关注与亲密家庭有关的担忧。反思性自我关注与抑郁、焦虑和消极情绪有关。
数据驱动的模型包含了另一个调节治疗反应的主题,标记为“思想和担忧的监测”,这与较差的治疗反应有关。代表这一主题的条目通常是对患者反复关注担忧的描述,表现为反刍性自我关注的表现[
然而,在控制了整体写作活动后,上述与思想监控相关的调节效应不再显著。忧虑日记的总数越多,症状减轻的速度就越慢,这可以通过治疗后期的写作活动来解释。这表明,“监测思想和担忧”主题的出现可能与持续到治疗后期的高水平写作活动有关。换句话说,晚期高度活跃的作者似乎包括一组患者,他们没有从治疗中获得最佳收益,但表现出持续的担忧监控行为。这可能部分解释了较高的写作活动和较差的治疗反应之间的反直觉联系。
除了可能表明持续的焦虑,高写作活动与“思想监控”主题的联系也可能与任务相关的问题有关。例如,一些患者可能很难坚持推迟忧虑任务,这可能会导致许多沉思条目,而条目的数量应该是有限的。对于一些患者来说,在治疗开始时使用忧虑日记也有可能导致对忧虑的关注增加,从而导致沉思的恶性循环。无论如何,我们的研究结果表明,患者写的内容可能比他们写的多少更有意义,这支持了这样一种观点,即在评估家庭作业-结果关系时,心理治疗家庭作业完成的质量是有意义的。
基于解释的模型还包含另一个主题,调节治疗反应,称为“互联网疗法”。这与较差的治疗反应有关。这个话题通常与对治疗的抱怨或对治疗的帮助性的担忧有关。我们的发现与Atzil-Slonim等人的发现一致[
在定义主题模型时,我们特别关注于通过采用带有贝叶斯方法的数据驱动选择方法来定义无偏倚的主题数量[
然而,我们基于可解释性的模型也包含了一些特殊的主题,这些主题强烈地反映了一个或少数患者的写作(
我们研究的优势包括我们数据的性质,这些数据来自作为国家公共卫生保健的一部分而提供的iCBT的自然主义和全国性设置。因此,我们的数据可能构成了目标患者群体的代表性样本。就个体患者而言,我们的数据集也相当大,与之前使用主题建模预测100例以下患者样本结果的研究相比,提高了我们结果的泛化性[
尽管与之前的研究相比,我们的样本量很大,但对于机器学习来说,它仍然是一个相当中等大小的数据集。在主题建模方面,与之前Atzil-Slonim等人的研究相比,我们的研究中每个患者产生的文本量较少[
如前所述,主题数选择方法对主题模型估计有影响。未来的iCBT主题建模研究应注意这些对主题质量和概括性的影响及其与治疗结果的关系。此外,我们的研究表明,当使用广泛性焦虑症iCBT中的担忧日记文本时,主题建模是实用的和有信息的。在未来,主题建模可以用于不同疾病特异性或跨诊断iCBT项目的研究。主题建模也可以提供一种方法来检查和比较不同治疗方案内或跨不同的基于文本的任务的相对重要性和意义,这可以在治疗发展方面提供有价值的信息。
本研究表明,主题建模是一种适合于iCBT数据的实用研究方法。我们从广泛性焦虑症iCBT的单一重复担忧日记任务中发现了与治疗结果相关的主题。写下对与患者关系密切的人的担忧与更好的治疗反应有关。相比之下,监测对治疗的担忧和担忧与较差的治疗反应相关。这种类型的内容信息具有潜在的实际意义,例如让临床医生了解患者写作行为中有意义的模式。这些主题也使其他研究变量,如患者的写作活动,更具解释性。
详细描述主题建模过程,多层模型方程和主题建模结果的补充材料。
广泛性焦虑障碍- 7项
由HUS赫尔辛基大学医院制造和提供的互联网提供的认知行为疗法
互联网提供的认知行为疗法
潜在狄利克雷分配
TR和SM由芬兰科学院资助(TR资助334057和335901)。VR、GJ和JHS得到了芬兰政府的TYH2019104和TYH2015218赠款的支持。研究所得到赫尔辛基大学医院HUS/441/2022赠款的支持。NOC得到了挪威研究委员会288083的资助。
SM、TR和SES对研究进行了概念化和规划。SM在TR的咨询支持下进行了分析。SM撰写了原始草案。SM、TR、VR、GJ、JHS、OAS、NOC、SES为手稿提供了重要内容和修改。
没有宣布。