这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
近年来,冥想应用程序越来越受欢迎,越来越多的人求助于这些应用程序来应对压力,包括在COVID-19大流行期间。冥想应用程序是治疗抑郁和焦虑最常用的心理健康应用程序。然而,很少有人知道谁适合这些应用程序。
这项研究旨在开发和测试一种数据驱动的算法,以预测哪些人最有可能从基于应用程序的冥想训练中受益。
使用随机对照试验数据,比较一个为期4周的冥想应用程序(健康心灵计划[HMP])和学校系统员工的仅评估对照条件(n=662),我们开发了一种算法来预测谁最有可能从HMP中受益。基线临床和人口统计学特征提交给机器学习模型,以开发“个性化优势指数”(PAI),反映个体从HMP与对照组的预期痛苦减少(主要结果)。
一个显著的群体× PAI相互作用出现(
总的来说,研究结果揭示了数据驱动算法的潜力,它可以告诉哪些人最有可能从冥想应用程序中受益。这样的算法可以用来客观地向个人传达预期的好处,让他们对冥想应用程序是否适合自己做出更明智的决定。
ClinicalTrials.gov NCT04426318;https://clinicaltrials.gov/ct2/show/NCT04426318
精准医学涉及利用个体差异来指导预防和治疗,在过去几年里在健康科学中获得了动力[
长期以来,精神病学和临床心理学一直希望能更好地为患者提供干预措施。许多研究都检查了患者水平的因素(如人口学、临床和神经生物学特征)作为治疗反应的预测因素[
机器学习已经成为一种很有前途的分析方法,非常适合处理和集成大量预测变量,包括相关预测变量,这些预测变量单独可能只能适度预测感兴趣的结果,但可以集体预测患者结果的显著差异[
为了追求精确的心理健康,研究人员利用机器学习方法来优化治疗建议[
使用PAI及相关方法进行的前期研究[
最近对现有心理健康应用程序的分析显示,冥想和正念训练(以及日志和情绪跟踪)是应用程序中最常见的功能。
这项研究涉及一项大规模随机对照试验(RCT)的二次分析,比较了基于冥想的智能手机应用程序“健康思维计划”(HMP)与仅评估的对照条件[
在2020年6月中旬至2020年8月下旬期间,通过电子邮件和其他电子媒体招募威斯康星州学区员工(有关研究程序的完整描述,请参阅Hirshberg等人的研究[
该试验在ClinicalTrials.gov网站(NCT04426318)和开放科学框架进行了预注册[
HMP包括冥想练习,旨在建立支持幸福的4个支柱的技能:意识,联系,洞察力和目的[
该研究程序得到了威斯康星大学麦迪逊分校机构审查委员会(编号2020-0533)的批准。
参与者在基线时报告了他们的年龄、性别认同、种族和民族、婚姻状况和收入。
父母RCT中预先指定的主要结果是心理压力,这是PROMIS焦虑和PROMIS抑郁测量的计算机自适应版本的组合[
一些额外的自我报告问卷评估了次要结果和候选中介,理论上与HMP中培训的幸福支柱相关。15项持之以恒思维问卷[
预测变量包括干预前痛苦(综合测量)、焦虑(PROMIS)、抑郁(PROMIS)、压力(感知压力量表)、重复消极思维(PTQ)、有意识行为的正念方面(五方面正念问卷)、孤独(美国国立卫生研究院工具箱孤独)、融合(德雷克塞尔融合量表)、存在感(MLQ)、寻找意义(MLQ)、自我同情(自我同情量表简表)、幸福感(世界卫生组织5项调查)、年龄、性别、种族、婚姻状况和收入。
使用基于随机森林的imputation (R中的MissForest包[
为了预测结果,2个预后模型(使用弹性净正则化回归[ENR];在R中开发了glmnet包:一个用于接受HMP的参与者,另一个用于接受仅评估对照条件的参与者。以尽量减少过度拟合,这可能发生在传统
前面提到的步骤为HMP参与者生成预测的HMP结果,并为对照组参与者生成预测的对照条件结果。为了对反事实条件(即没有接受的治疗条件)产生预测结果,为一组(即完整的HMP或对照样本)开发了ENR模型,并用于预测另一组参与者的结果。
作为前面提到的预测模型的最终产物,每个参与者都有2个预测结果分数:一个是HMP,一个是对照条件。与以往类似研究一致[
我们将上述多变量机器学习(ENR)模型与一个简单的线性回归进行了比较,其中基线重复消极思维(PTQ)分数作为唯一的预测因子(即,重复上述步骤为每个参与者生成PAI分数),通过10倍CV(重复100次以生成稳定的估计值)实现。在这个基于先前研究的比较模型中,重复的消极思维被选为预测因素,表明它预测了对正念应用程序的反应[
所有分析均采用R软件(4.0.2版本)[
大多数(523/662,79%)参与者报告的抑郁或焦虑症状在基线时高于PROMIS抑郁和PROMIS焦虑测量的临床截止值(
在人口统计学或临床变量方面,两组在基线时没有差异(
健康心理项目的描述性统计和基线评估对照。
变量 | 健康心灵计划 | 控制 |
|
|||||||
|
N值, | 值,n (%) | 值,平均值(SD) | N值, | 值,n (%) | 值,平均值(SD) |
|
|||
年龄(年) | 344 | - - - - - - | 42.47 (11.06) | 318 | - - - - - - | 42.70 (10.23) | 尾数就 | |||
性别(女) | 344 | 299 (86.9) | - - - - - - | 318 | 279 (87.7) | - - - - - - | 综合成绩 | |||
非西班牙裔白人 | 344 | 304 (88.4) | - - - - - - | 318 | 268 (84.3) | - - - - - - | 13。 | |||
结婚了 | 344 | 243 (70.6) | - - - - - - | 318 | 216 (67.9) | - - - - - - | 。45 | |||
大学教育 | 343 | 308 (89.8) | - - - - - - | 316 | 281 (88.9) | - - - - - - | 开市 | |||
|
||||||||||
|
≤50000 | 344 | 56 (16.3) | - - - - - - | 318 | 55 (17.3) | - - - - - - | 收 | ||
|
50000 - 100000 | 344 | 141 (41.0) | - - - - - - | 318 | 129 (40.6) | - - - - - - | 点 | ||
|
100000 - 150000 | 344 | 104 (30.2) | - - - - - - | 318 | 96 (30.2) | - - - - - - | 获得 | ||
|
≥150000 | 344 | 40 (11.6) | - - - - - - | 318 | 37 (11.6) | - - - - - - | 获得 | ||
|
||||||||||
|
抑郁症 | 342 | - - - - - - | 55.37 (6.20) | 315 | - - - - - - | 55.47 (6.43) | .85 | ||
|
焦虑 | 342 | - - - - - - | 59.83 (6.95) | 315 | - - - - - - | 60.00 (7.11) | 综合成绩 | ||
感知压力量表 | 342 | - - - - - - | 2.89 (0.56) | 315 | - - - - - - | 2.87 (0.60) | i = | |||
痛苦c(综合) | 342 | - - - - - - | 0.00 (0.88) | 315 | - - - - - - | 0.00 (0.91) | .97点 | |||
毅力思维问卷 | 342 | - - - - - - | 29.89 (10.43) | 315 | - - - - - - | 29.62 (11.29) | .76 | |||
五方面正念问卷-意识行为子量表 | 342 | - - - - - - | 24.80 (5.93) | 315 | - - - - - - | 24.56 (6.12) | .62 | |||
国家卫生研究院工具箱孤独 | 342 | - - - - - - | 2.53 (0.77) | 315 | - - - - - - | 2.58 (0.77) | 。45 | |||
德雷克塞尔熔解量表 | 342 | - - - - - - | 24.83 (7.89) | 315 | - - - - - - | 24.50 (8.16) | .60 | |||
|
||||||||||
|
存在 | 342 | - - - - - - | 26.20 (5.44) | 315 | - - - - - - | 25.81 (5.46) | 36 | ||
|
寻找意义 | 342 | - - - - - - | 21.63 (6.61) | 315 | - - - - - - | 22.09 (6.79) | 38 | ||
世界卫生组织福利 | 341 | - - - - - - | 12.76 (4.71) | 315 | - - - - - - | 12.47 (4.33) | 点 | |||
自我同情规模 | 342 | - - - - - - | 2.98 (0.69) | 315 | - - - - - - | 2.93 (0.70) | .37点 |
一个
bPROMIS:患者报告结果信息系统。
c抑郁:由PROMIS抑郁、PROMIS焦虑和感知压力量表组成。
dMLQ:人生意义问卷。
在HMP中,更高的痛苦、抑郁和压力基线水平预示着更好的结果(即,更大程度的痛苦减轻)。
弹性净模型中保留的基线变量预测每种条件的结果一个.
预测 | 健康心智计划模型,系数 | 控制模型、系数 | |
年龄(年) | - - - - - -b | - - - - - - | |
性别 | - - - - - - | - - - - - - | |
比赛 | - - - - - - | - - - - - - | |
婚姻状况 | - - - - - - | −0.006 | |
收入 | - - - - - - | - - - - - - | |
|
|||
|
抑郁症 | −0.012 | −0.005 |
|
焦虑 | - - - - - - | −0.007 |
感知压力量表 | −0.003 | −0.006 | |
痛苦d(综合) | −0.011 | −0.008 | |
毅力思维问卷 | - - - - - - | 0.012 | |
五方面正念问卷-意识行为子量表 | - - - - - - | - - - - - - | |
国家卫生研究院工具箱孤独 | - - - - - - | −0.002 | |
德雷克塞尔熔解量表 | - - - - - - | −0.011 | |
|
|||
|
存在 | - - - - - - | −0.008 |
|
寻找意义 | - - - - - - | - - - - - - |
世界卫生组织福利 | - - - - - - | - - - - - - | |
自我同情规模 | - - - - - - | −0.002 |
一个相对于健康心理计划(HMP)组,应用于对照组参与者的弹性净正则化回归模型中保留的基线预测因子更大,这是因为前一组的最佳拟合模型具有更低的基线预测因子
b弹性净模型中没有保留的变量。
cPROMIS:患者报告结果信息系统。
d抑郁:由PROMIS抑郁、PROMIS焦虑和感知压力量表组成。
eMLQ:人生意义问卷。
PAI平均得分为−0.07 (SD 0.03;范围为−0.17至0.03),表明该模型预测HMP冥想应用程序比仅评估对照条件的平均症状改善更大。除5人(657/662,99.2%)外,模型对所有参与者推荐HMP (PAI<0)。
在预测结果中出现了显著的组× PAI相互作用(
群体×个性化优势指数(PAI)交互作用。随着PAI评分的降低(即反映出对健康心理计划[HMP]应用程序的相对更强的建议),观察结果的组间差异增加,有利于HMP。
在应用于HMP组的线性回归比较模型中,较高水平的重复消极思维与a显著相关
预测对照条件结果与观察结果之间的相关性为
在预测遇险变化时出现了显著的组× PAI相互作用(
群体×个性化优势指数(PAI)相互作用的比较模型(即,线性回归与基线重复消极思维[PTQ]分数作为唯一的预测因素)。随着PAI评分的降低(即反映出对健康心理计划[HMP]应用程序的相对更强的建议),观察结果的组间差异增加,有利于HMP。
为了证明将预测模型转换为个性化建议,我们使用上述回归模型中的参数估计来估计基于新个体干预前重复消极思维得分的HMP与仅评估条件下的预测痛苦变化。鉴于更简单的回归模型与更复杂的多变量ENR模型表现相似,我们使用前一个模型进行演示。
首先,如图所示
举个具体的例子,一个重复性消极思维(PTQ)得分高于平均值(即41)1个标准差的人,PAI得分为- 0.10(在的“绿色区域”内)
个性化优势指数(PAI)得分与每个条件的结果之间的关系图,以告知个性化建议。灰色虚线表示两条回归线相交的点(引导95% CI的左边缘用红色虚线表示)。实线垂直灰线(与红线相邻)来自Johnson-Neyman技术,表示调节因子(PAI)的值,组间结果差异变得具有统计学意义。请参阅文本中的详细描述,并以个性化健康心灵计划(HMP)推荐为例。
越来越多的人开始求助于冥想应用程序来缓解他们的情绪困扰。冥想应用是治疗抑郁和焦虑最常用的心理健康应用。
关键的是,只包含重复消极思维基线水平信息的比较线性回归模型与多变量机器学习模型相比表现得相当好(相反,参考Webb等人的研究[
如
尽管在鼓励最佳利用用户的时间和注意力方面可能有用,但告诉一些人使用冥想应用程序可能对他们没有好处,不太可能被许多干预开发者所接受。然而,这些模型可以很容易地扩展到比较一个或多个移动健康干预措施的实例。考虑到数以千计的心理健康应用程序[
除了为消费者的选择提供信息外,预测谁最有可能从特定干预中受益的能力还可以为医疗保健政策和决策提供信息。与阶梯式护理模式相反,在阶梯式护理模式中,治疗强度根据干预措施的反应而逐步升级,预测模型可用于最初根据患者的基线特征(即分层护理)将患者分配到预计可为其产生最佳结果的治疗中[
未来研究的另一个重要途径是测试这些发现在多大程度上可以推广到其他冥想应用程序(例如Headspace和Calm)。在许多方面,HMP与其他冥想应用程序相似。它包括正念和连接(例如,爱心,同情)的训练,这些练习也可以在流行的正念应用程序中使用,如Headspace和Calm。一个不同之处在于,HMP包括专门为培养健康的自我意识(洞察模块)以及生活的目标和意义(目的模块)而设计的实践。这些实践的纳入源于HMP所基于的基于神经科学的幸福模型[
最后,鉴于之前缺乏预测心理健康应用程序结果的研究,需要进一步研究来测试预测正念应用程序预后对患者结果的影响。例如,在使用正念应用程序之前,患者可以随机分配接收他们预测的结果或不接收这些信息。可以检查几个相关的结果,包括(1)症状改变的组间差异,(2)接受这些预测对治疗效果预期的影响程度,(3)预期与应用结果之间的关系,以及(4)个体使用算法推荐的干预或无视建议的程度。
这项研究有几个重要的局限性。首先,尽管从实施的角度来看,完全基于自我报告数据的模型是有吸引力的,但我们可能已经排除了其他患者特征,这些特征提供了重要的额外预测信息,以告知最佳治疗建议(例如,生物标志物和认知任务)[
这项研究展示了数据驱动方法在个性化冥想应用程序推荐方面的潜在效用。本研究的自然延伸是使用双随机设计对我们的算法进行前瞻性测试。例如,参与者可以被随机分配到(1)随机治疗分配(即治疗A或治疗B)或(2)分配到他们的算法指示的治疗。在后一种情况下,如果患者的结果显著(且具有临床意义)更好,则结果将支持基于算法的治疗建议的临床益处(关于最近一个类似设计测试患者与治疗师预测匹配的例子,请参阅Constantino等人的研究[
其他可能富有成效的未来方向包括评估以前显示或假设的更广泛的患者特征,以预测对不同干预措施的反应可能性[
补充。
配偶电子健康检查表。
认知行为疗法
试验报告综合标准
交叉验证
健康心灵计划
移动健康
人生意义问卷
个性化优势指数
患者报告结果信息系统
毅力思维问卷
随机对照试验
研究电子数据采集
均方根误差
这项研究得到了国家补充和综合健康中心拨款K23AT010879 (SBG),国家心理健康研究所拨款R01MH43454 (RJD), Chan Zuckerberg倡议拨款2020-218037 (RJD),国家教育学院/斯宾塞博士后奖学金(MJH)以及威斯康星州教育研究中心(SBG)的资助。第一作者(CAW)得到了国家精神卫生研究所R01MH116969、国家补充和综合健康中心R01AT011002、汤米·福斯基金和脑与行为研究基金会NARSAD青年研究员基金的部分支持。SBG部分得到了“希望抑郁症研究基金会,战胜抑郁症奖”的支持。
RJD是非营利组织健康思想创新公司的创始人、总裁和董事会成员。MJH一直是健康思维创新公司的有偿顾问,从事与本研究无关的工作。