原始论文
摘要
背景:各种行为感知研究发现,抑郁症状与人类智能手机互动行为有关,包括在独特的物理位置缺乏多样性、在每个位置花费的时间熵、睡眠中断、会话持续时间和打字速度。这些行为测量通常是针对抑郁症状的总分进行测试的,而在纵向数据中分解个人内部和个人之间影响的推荐做法往往被忽视。
摘要目的:我们的目的是将抑郁理解为一个多维过程,并探索从被动感知的人类智能手机交互中计算出的特定维度和行为测量之间的关联。我们还旨在强调心理过程的非遍历性,以及分析中分解人与人之间和人与人之间影响的重要性。
方法:本研究中使用的数据是由Mindstrong Health收集的,这是一家专注于严重精神疾病患者的远程医疗服务提供商。抑郁症状采用《精神障碍诊断与统计手册第五版》(DSM-5)自评一级交叉症状测量-成人调查,每60天测量一次,持续一年。被动记录参与者与智能手机的互动,并根据理论命题或先前的经验证据制定了5种行为测量方法,并期望与抑郁症状相关。采用多水平模型来探索抑郁症状严重程度与这些行为测量之间的纵向关系。此外,内部和人与人之间的影响被分解,以适应在心理过程中常见的非遍历性。
结果:本研究包括982份DSM一级抑郁症状测量记录和142名参与者(年龄29-77岁;平均年龄55.1岁,SD 10.8岁;96名女性参与者)。对愉快活动失去兴趣与应用程序数量(γ10=−0.14;P= . 01;within-person效果)。抑郁情绪与打字时间间隔(γ05= 0.88;P= .047;内部效应)和会话持续时间(γ05=−0.37;P= .03点;人的效果)。
结论:本研究从维度角度为人类智能手机交互行为与抑郁症状严重程度之间的关联提供了新的证据,并强调了考虑心理过程的非遍历性以及分别分析人与人之间和内部影响的重要性。
doi: 10.2196/42935
关键字
介绍
抑郁症是一种多维度的情感障碍,通常表现为在某些或所有活动中无法体验到快乐,情绪低落,睡眠紊乱,疲劳或精力丧失[
]。抑郁症状严重程度的评估传统上是通过临床访谈或自我报告问卷进行的。此外,新的经验证据支持使用被动感知信号来解释或预测抑郁症状的严重程度[ ]。我们将这些研究称为基于先前建议的“行为感知”研究[ ]。潜在的前提是,来自低水平传感器的被动感知信号可能预示着高水平的行为标记,而这些高水平的行为标记被认为与抑郁的不同维度有关(关于行为感知的综述,参见先前的文章)。 ])。我们将简要回顾实证研究,检查抑郁症状和从被动感知信号计算的行为措施之间的关联。首先,无法体验快乐(或失去兴趣)是重度抑郁症的主要诊断标准之一[
]。这个量表是用来衡量无法体验快乐的程度的,它通过一系列令人愉快的活动来评估快乐体验的程度,这些活动包括食物/饮料、消遣/兴趣、社会互动和愉快的感官体验[ - ]。根据这一理论观点和测量量表,对令人愉快的活动失去兴趣的个人可能不太可能离开家,去公共场所,如餐馆和剧院,或拜访朋友和家人。这种行为已经在使用被动感知的GPS数据测量抑郁症状的实证研究中得到了报道。Nickels等人[ ]报告了抑郁症状与独特位置簇的数量之间的负相关。Meyerhoff等[ ]报告了抑郁症状与唯一GPS位置的数量之间的负相关,以及抑郁症状与在每个位置花费的时间熵之间的负相关。熵通常用来量化能量在系统中分散的程度。Zhang等[ ]报告了抑郁症状与在每个地点花费的时间熵之间的负相关。其他一些研究通过机器学习方法支持独特物理位置的重要性。例如,Opoku Asare等[ 的研究报告指出,上网的规律性,即访问不同地点的例行性,是抑郁症状最重要的预测因素。基于先前报道的抑郁症状与物理位置缺乏多样性之间的关联,我们提出,当人们在智能手机上与数字世界互动时,对愉快活动失去兴趣也可能表现出来。智能手机应用程序有助于人们参与愉快的活动(例如,参与社交互动、听音乐、购物),而智能手机应用程序使用的多样性缺乏可能被用来衡量人们对愉快活动失去兴趣,这是抑郁症的一种症状。媒体心理学的使用与满足理论(Use and Gratification Theory)也表明,智能手机应用的使用情况是抑郁症症状的一个指标。该理论认为,个人的媒体行为通常被认为是主动有意选择的产物,目的是满足某些需求,包括寻求信息、放松、社交互动、转移注意力或逃避。
]。在这个类比中,智能手机应用程序是允许人们与环境互动以满足这些需求的媒体,这类似于允许人们满足特定需求的物理位置(例如,社交互动,购物和娱乐)。因此,我们假设描述应用使用情况的行为指标,如独特应用数量(或应用计数)和在每个应用上花费的时间熵(或应用熵),将与抑郁症状指标(如对愉快活动缺乏兴趣)相关。第二,抑郁情绪,指的是感到悲伤、无助和绝望,是抑郁症的另一个重要诊断标准。有人认为,被动感知信号对情绪的一致和准确评估是具有挑战性的,因为情绪与行为感知中通常使用的传感器和特征(除了语音记录;有关回顾,请参阅先前的文章[
])。如果我们把范围缩小到抑郁症状,而不是特别关注抑郁情绪,有一些经验证据表明,抑郁症状可能与睡眠时间、身体活动、心率和社会互动有关[ - ]。一项研究报告称,通过可穿戴设备计算出的较长的睡眠时间,结合对情绪(唤醒和效价)的生态瞬间评估,作为预测因素,与较高的抑郁症状相关[ ]。Narziev等[ 的研究报告称,通过被动感应测量的身体活动和心率可以预测抑郁症状。Bai等[ 报告称,通过被动感知测量的通话记录(社会互动)、步数(身体活动)、心率和睡眠可以预测情绪的稳定性。Jacobson等[ 据报道,活动描记术(身体运动)与抑郁症状有关。在其中一些研究中,使用了机器学习方法,但抑郁症状与被动感知信号之间的方向性尚未明确[ , , ];因此,了解抑郁情绪与被动感知测量之间的具体联系是具有挑战性的。最后,从被动感知测量中计算出的睡眠中断和精神运动功能被认为与抑郁症状有关。例如,失眠是抑郁症的一种常见症状(嗜睡或睡眠过多也可能是抑郁症的一种症状),据报道,在睡眠窗口使用手机(包括数量和持续时间)与主观睡眠质量差有关[
]。此外,Giancardo等[ 表明,在自然打字过程中,通过手指与电脑键盘的相互作用来检测由于睡眠惯性造成的精神运动障碍是可行的。容器等[ 的研究报告称,敲击键盘的动态,包括较慢的打字速度、较高的打字速度可变性、较短的会话持续时间和较低的准确性,与更严重的抑郁症有关。Zulueta等[ 研究报告显示,较高的平均键间延迟(较慢的打字速度)与更严重的抑郁症状相关。基于这些发现,我们假设与睡眠中断和精神运动功能相关的行为测量将与抑郁症状测量相关。总之,在这项工作中,我们基于理论命题和先前引入的经验证据,探讨了自我报告的抑郁症状与人类智能手机交互行为之间的关系。具体来说,我们从被动感知的人类智能手机交互数据中建立了我们认为表明对愉快活动失去兴趣的行为测量(例如,较低的应用程序数量和较低的应用程序熵),睡眠中断(例如,夜间较高的手机使用量)和精神运动功能(例如,较慢的打字速度和较短的会话持续时间),我们假设这些测量将与对愉快活动失去兴趣和抑郁情绪有关。为了适应重复纵向数据的嵌套性质(嵌套在人体内的自我报告和行为测量),在多层次建模框架内检验了假设[
, ]。遵循建议的做法[ ],将预测变量分为人内变化(时变成分)和人间差异(时变成分),作为单独的预测因子输入到多层模型中。将检查行为测量和抑郁症状测量之间的人与人之间和人与人之间的关联,并用于确定与较高程度的抑郁症状相关的行为特征。方法
参与者
在这项回顾性观察性研究中,纳入了142名在Mindstrong health (Mindstrong)接受虚拟精神卫生保健的患者。Mindstrong是一家专门从事严重精神疾病的远程医疗服务提供商,通过移动应用程序使用被动传感技术来通知治疗。本组患者年龄29 ~ 77岁,平均55.1岁(SD 10.8)。142例患者中,女性96例(67.6%),男性43例(30.3%),身份不明3例(2.1%)。此外,白人87例(61.3%),非裔11例(7.8%),西班牙/拉丁裔6例(4.2%),身份不明38例(26.8%)。这些患者在2020年10月至2021年9月期间在Mindstrong Health接受了治疗。最初的诊断是由Mindstrong的有执照的精神卫生提供者在治疗开始时确定的。在该样本中,83例(58.5%)患者的主要诊断为重度抑郁症,45例(31.7%)患者的主要诊断为双相情感障碍,14例(9.9%)患者的主要诊断为精神分裂症。这些患者来自美国11个不同的州。
过程
所有患者都安装了Mindstrong Health应用程序,并在注册服务之前提供了在研究和产品开发中使用数据的知情同意。该分析是根据二级数据分析方案进行的,以确定Mindstrong主动和被动数据收集的临床相关关联。
作为常规临床护理的一部分,患者被要求每60天通过移动应用程序通过精神疾病诊断与统计手册第五版(DSM-5)自评一级交叉症状测量-成人调查(DSM- L1)报告他们的精神疾病症状。鉴于严重精神疾病人群可能带来的患者负担,我们选择DSM L1作为常规临床筛查,以全面评估广泛的临床领域,同时确保评估的简捷性。具体来说,DSM L1由23个问题组成,评估13个临床领域,包括抑郁、愤怒、躁狂、焦虑、躯体症状、自杀意念、精神病、睡眠问题、记忆、重复思想和行为、分离、人格功能和物质使用(平均每个临床领域有1-3个项目)[
]。DSM L1中的抑郁领域有2个项目,评估对愉快活动的兴趣丧失和抑郁情绪(感到悲伤)。这两个项目与病人健康问卷(PHQ2) [ ]。DSM L1问卷由患者通过Mindstrong应用程序每60天完成一次。Mindstrong应用程序中DSM L1问卷的截图见 。在1年的时间里,共有984个抑郁症状评估被纳入本分析。在这项回顾性观察性研究中,患者是根据DSM L1的高依从性来选择的。我们有意选择具有较高依从性的个体,因为较高的依从性(或在同一个人中进行更多的重复测量)允许检查抑郁症状自我报告与从人类智能手机交互计算的行为测量之间的个人内部关联。
因为DSM L1提示参与者报告他们在过去2周(或14天)内发生的抑郁症状,我们在分析中包括了每个抑郁症状测量日期(症状-日期)之前14天的智能手机交互数据。DSM L1调查和智能手机元数据之间的时间一致性显示在
一个。该应用程序收集智能手机元数据,并以一种不引人注目的方式包含有关与智能手机互动的信息。这些设备使用和触摸屏的元数据是由Android操作系统上的专有软件收集的,不引人注目。元数据包括各种触摸屏行为(例如,点击和滚动),设备级行为(例如,打开智能手机屏幕和关闭智能手机屏幕),屏蔽键盘行为(例如,从智能手机键盘的左侧或右侧输入字符,而不是确切的字符),以及前台应用程序的更改(例如,短信应用程序和娱乐应用程序)。每次使用智能手机设备及其触摸屏的开始时间都以毫秒级的时间戳记录下来。这些元数据在患者的智能手机上本地收集,然后通过加密传输到符合HIPAA和ISO 27001标准的云存储服务(亚马逊网络服务)。所有能够访问患者元数据和评估数据(包括诊断、人口统计和自我报告的调查数据)的人员都要完成年度HIPAA培训。分析前对数据进行鉴定。
![](https://asset.jmir.pub/assets/d0bf46dd91c75a6fe717b3dee346608f.png)
![](https://asset.jmir.pub/assets/c1bbedd9469e60c6843838145c40b235.png)
伦理批准
该分析已被WCG机构审查委员会(Puyallup, WA)审查并批准为豁免。
测量
抑郁症状
用DSM L1自我报告问卷中的2个项目评估抑郁症状[
],与PHQ2 [ ]。DSM L1是一份包含23个项目的问卷,评估响应者被13个临床领域的症状困扰的程度或频率。在这个分析中,我们只使用了对抑郁领域的回答,它有两个问题( ).两个问题都包含“在过去两周内”的提示。第1项衡量的是失去兴趣,它提示“你有多少次对做某事没有兴趣或乐趣?”第二项测量抑郁情绪,提示“你多久感到沮丧、沮丧或绝望?”参与者使用5分李克特量表在应用程序中选择他们的回答(0=根本没有/没有;1=罕见,少于一两天/轻微;2 =几天/轻微;3=超过一半的天/中等;几乎每天/严重)。应用数
应用数量被定义为在一个小时内出现的唯一前景应用的数量。该指标旨在捕捉人们在智能手机上的各种活动,如信息搜索、娱乐和社交互动。
]。一天的应用程序使用示例如下 B,每种颜色代表一个独特的应用程序。应用熵(标准化)
应用熵(App entropy)捕获了特定小时内应用使用的可变性和复杂性[
]。较高的应用熵表明每个应用的时间分配更均匀,而较低的应用熵表明应用的使用更不均匀。应用熵定义为应用前景行为香农熵的标准化版本,定义如下:花费在特定应用上的时间占使用所有应用的总时间的比例是多少N在给定的时间内。为了避免唯一应用数量带来的熵测量偏差(即应用数量越多,应用熵就越大),我们通过除以唯一应用总数的对数来标准化应用熵。的例子说明了一天的数据价值
B,每种颜色代表一个不同的应用程序(例如,社交媒体应用程序用洋红色标记)。与更均匀分布的应用使用情况相比,在一个小时内花费最多时间在一款应用上产生的应用熵更低。夜间使用智能手机
为了测量在假定睡眠期间与手机相关的睡眠中断,我们使用了从午夜(上午12点)到早上6点的人类智能手机互动来近似睡眠窗口,并总结了每天这6小时内的活跃屏幕时间。以一天的应用使用情况为例
B,我们可以观察到有相当大的空白,表明没有使用智能手机设备。另一方面,偶尔会在夜间使用手机(用紫色和绿色的条表示) B)午夜到早上6点之间。会议持续时间
智能手机会话测量智能手机活动序列的长度。这个指标被定义为从打开智能手机屏幕到关闭智能手机屏幕的时间[
]。因为基于时间的变量通常呈指数分布,并且中位数比平均值更准确,所以我们选择中位数来表示一小时内的会话持续时间。中说明了一个示例会话 C,其中发生了一系列交互事件,包括打字、视图更改、滚动以及从消息传递到社交媒体的应用程序更改。打字速度
打字行为的时间间隔被认为是衡量处理速度作为精神运动功能的一个指标[
- ]。智能手机上的输入行为包括用户使用键盘输入字符、数字或其他键(如删除键和退格键)的行为。输入行为的时间间隔计算为从输入事件的开始时间到下一个事件的开始时间的时间差。这种类型行为通常发生在毫秒级的时间尺度上。为了避免由于打字分心而导致的异常大的值,我们将打字行为的时间间隔限制为5秒(5000毫秒)。中所示的示例会话 在C中,当发生输入事件时,输入时间间隔由白线表示。数据预处理
选择标准
先前发表的关于被动感知行为测量的文献[
]建议在特定时间范围内提供足够数量的被动传感数据,以排除传感器因某些原因(例如,一周有3天,每天有18个小时的标准)而不能连续收集数据的情况[ ])。由于人-智能手机交互传感只会在参与者积极与手机交互时产生数据,因此获取24小时的活动数据是不太可能的;因此,我们将被动传感数据的选择标准放宽为每天至少3个唯一小时,并且在每次DSM L1测量的14天窗口内至少3个唯一天。结果,进入多层次建模分析的样本有142名参与者和984次抑郁症状测量,其中每次抑郁症状评估在DSM L1测量之前每天至少有3个不同的天和3个不同的小时的电话互动数据(总计12,098人日和196,673人时)。
偏度和异常值
由于与时间相关的度量(例如,夜间电话使用,会话持续时间和打字时间间隔)分布的不均匀,对数变换应用于数据作为预处理方法。由于打字通常发生在毫秒级的时间尺度上,当打字时间间隔很长时,可能由于手机故障或打字时分心而存在异常值,因此我们将打字时间间隔限制在5秒[
]。与抑郁症状相一致的行为测量的集合
在每次DSM L1测量前14天,我们计算了测量部分中描述的每项行为测量的平均值,以便我们可以将行为测量作为预测因素,并将抑郁症状作为多水平模型的结果。
分析计划
为了适应重复纵向数据的嵌套性质(142人嵌套的984份自我报告和行为测量),在多层次建模框架内检验了假设[
, ]。在纵向数据分析中,强烈建议将两类促成因素分解,即人内效应和人间效应[ ]。Within-person效果指一个预测器的时变部分对结果的影响,它指的是当一个人与自己在不同时间点上进行比较时,结果与变化之间的关联。人之间的影响指预测器的时变部分(例如,类性状的稳定特征)对结果的影响,指结果与两个人比较时的差异之间的关联[ ]。将人与人之间的影响分开的原因是,心理过程通常是非遍历的,这意味着人与人之间的影响很少与人与人之间的影响相同[ ]。这两种效应解释了不同的机制,例如,人谁有一个一致的特征,比如低应用程序数量可能会有个人手机使用习惯,这与抑郁症没有什么关系,但是当人们突然使用的应用程序减少了,他们可能对愉快的活动失去了兴趣,这可能表明抑郁症状加剧的风险。我们分别测试了人类智能手机互动行为与抑郁症状之间的联系,包括对愉快活动失去兴趣和抑郁情绪。因此,我们测试了2个多水平模型,其中第一个模型使用对愉快活动失去兴趣作为因变量,第二个模型使用抑郁情绪作为因变量,而预测因子保持不变。然后使用以下形式的两级模型检查扩展变量集之间的关系:
{Loss_of_Interest它,Depressed_Mood它} =β 0 我+β 1 我×wp。AppCount它+β 2 我×wp。AppEntropy它+β 3. 我×wp。N我ghttimePhoneUse它+β 4 我×wp。SessionDuration它+β 5 我×wp。TypingInterval它+e它 (2)
β 0 我=γ 00+γ 01×英国石油公司。AppCount我+γ 02×英国石油公司。AppEntropy我+γ 03×英国石油公司。N我ghttimePhoneUse我+γ 04×英国石油公司。SessionDuration我+γ 05×英国石油公司。TypingInterval我+u 0 我 (3)
β 1 我=γ 10+u 1 我 (4)
β 2 我=γ 20.+u 2 我 (5)
β 3. 我=γ 30.+u 3. 我 (6)
β 4 我=γ 40+u 4 我 (7)
β 5 我=γ 50+u 5 我 (8)
对愉快的活动失去兴趣的重复测量(简称为对简洁的方程失去兴趣)或个人的抑郁情绪呢我在时间t,Loss_of_Interest它或Depressed_Mood它,被建模为个人特定拦截的函数,β0我显示抑郁症状的基线水平和个人特定系数,β1我来β5我这表明了人类智能手机互动行为与抑郁症状之间的人际关系程度。γ00来γ50是样本级参数。u0我来u5我残差是否为无法解释的人与人之间的差异,是否假设为多元正态,均值等于零,方差为零。
模型与数据拟合lme4package in R(版本1.1-29;R统计计算计划)[
],不完整数据(0.2%)被视为随机缺失。个人特定的截距和系数分别作为预测因子的人与人之间和人与人之间部分的函数同时建模。在模型的简洁性,特别是随机效应的协方差结构和数据的拟合优度之间需要权衡。为了测试人-智能手机交互行为与抑郁症状之间的关联,重要的是要包括个人预测因子的随机斜率,以允许人-智能手机交互行为与抑郁症状之间的异质性个体特异性关联。然而,本研究并未关注随机斜率的协方差。因此,我们选择了一个独立的随机效应结构来简化模型,并有能力对随机斜率进行建模。
结果
测量数据汇总统计
人类智能手机交互行为测量的汇总统计数据,包括平均值、标准差、最小值、最大值和偏度,以及与愉悦活动或抑郁情绪丧失兴趣的相关性
。经过日志转换后,行为度量(夜间电话使用、会话持续时间和打字时间间隔)的偏度减小到小于1。对愉快活动失去兴趣的严重程度平均为2.24 (SD 1.21),抑郁情绪的严重程度平均为2.08 (SD 1.24)。行为测量与对愉快活动或抑郁情绪失去兴趣之间的相关性也显示在
。为了证明预测因子的内部和之间部分的差异,我们包括了所有三种类型的相关性,即对愉快活动(或抑郁情绪)失去兴趣与原始预测因子(没有分解内部和之间的部分)之间的相关性,对愉快活动(或抑郁情绪)失去兴趣与预测因子的内部部分之间的相关性,以及对愉快活动(或抑郁情绪)失去兴趣与预测因子的人际关系部分之间的关系。在分解了个人内部和个人之间的部分之后,结果(对愉快活动或抑郁情绪失去兴趣)与预测因素(人类智能手机互动行为)之间的相关性不同于结果与个人内部部分或个人之间部分( ).例如,对令人愉悦的活动失去兴趣与原始应用数量的相关性为- 0.01,但与应用数量的人际部分的相关性为- 0.07,与应用数量的人际部分的相关性为0.02。测量 | 价值 | 偏态 | 与对愉快活动失去兴趣有关 | 与抑郁情绪的相关性 | |||||||||
意思是(SD) | 范围(最小最大) | 生 | 在 | 之间的 | 生 | 在 | 之间的 | ||||||
应用数 | 7.53 (2.06) | 2.20 - -15.55 | 0.76 | −0.01 | −0.07 | 0.02 | −0.02 | −0.04 | −0.005 | ||||
应用熵归一化 | 0.48 (0.09) | 0.20 - -0.70 | −0.34 | −0.01 | −0.0009 | −0.007 | −0.02 | −0.009 | −0.02 | ||||
夜间使用手机a、b | 1.70 (1.36) | 0.00 - -5.27 | 0.57/2.31c | 0.03 | 0.02 | 0.02 | −0.02 | −0.02 | −0.02 | ||||
会议持续时间a、b | 1.35 (0.67) | 0.19 - -4.11 | 0.63/2.20c | −0.09 | −0.02 | −0.09 | −0.12 | −0.02 | −0.12 | ||||
打字时间间隔,维 | 0.43 (0.15) | 0.00 - -1.03 | 0.64/4.76c | −0.02 | 0.06 | −0.04 | −0.03 | 0.05 | −0.05 |
一个日志转换。
b单位为分钟。
c对数变换前的偏度。
d单位为秒。
对愉快活动失去兴趣与人类智能手机互动行为之间的联系
在模型1的结果中(详情见= 0.06)。这种差异在 应用程序数量的个人变化与对愉快活动失去兴趣之间存在异质关联。另一方面,对令人愉快的活动失去兴趣与应用程序数量之间的人际关系是γ01= 0.05 (P= 0.51),这表明应用程序数量较少的参与者对愉快活动的兴趣丧失程度并不高。人与人之间的联系是可视化的 B。
标准化应用程序熵与对愉快活动失去兴趣之间的人际关系为γ20.= 1.35 (P =.18),人际交往为γ02=−1.64 (P= .35点)。这表明,标准化应用程序熵的变化与对愉快活动的不同程度的兴趣丧失无关,无论是在与自己比较还是与他人比较时。
夜间使用手机与对愉快活动失去兴趣之间的个人联系是γ30.= 0.07 (P=.10),人际关联为γ03= 0.06 (P=。45)。这表明,无论是将一个人与自己比较,还是将一个人与他人比较,夜间使用手机的变化与对愉快活动失去兴趣的不同程度无关。
会话持续时间和对愉快活动失去兴趣之间的个人关系是γ40= 0.08 (P=.49),人际相关性为γ04=−0.29 (P= . 07)。这表明,无论是将一个人与自己比较,还是将一个人与他人比较,会话持续时间的变化与对愉快活动失去兴趣的不同程度无关。
打字时间间隔和对愉快活动失去兴趣之间的个人联系是γ50= 0.88 (P=.08),人际相关性为γ05=−0.34 (P= 58)。这表明打字时间间隔的变化与对愉快活动失去兴趣的程度无关,无论是将一个人与自己比较还是将一个人与他人比较。
参数一个 | 模型1b | 模型2c | |||||
估计 | SEd | P价值 | 估计 | SEd | P价值 | ||
拦截,γ00 | 2.24 | 0.08 | <措施 | 2.09 | 0.08 | <措施 | |
wp。AppCount,γ10 | −0.14 | 0.05 | . 01 | −0.03 | 0.05 | .57 | |
wp。AppEntropy,γ20. | 1.35 | 1.01 | 只要 | −0.20 | 1.06 | .85 | |
wp。N我ghttimePhoneUse,γ30. | 0.07 | 0.04 | .10 | −0.02 | 0.04 | .62 | |
wp。SessionDuration,γ40 | 0.08 | 0.12 | 报 | −0.03 | 0.12 | .80 | |
wp。TypingInterval,γ50 | 0.88 | 0.47 | 。08 | 0.88 | 0.44 | 0。 | |
英国石油公司。AppCount,γ01 | 0.05 | 0.07 | .51 | 0.05 | 0.08 | 50 | |
英国石油公司。AppEntropy,γ02 | −1.64 | 1.74 | .35点 | −1.98 | 1.82 | 陈霞 | |
英国石油公司。N我ghttimePhoneUse,γ03 | 0.06 | 0.07 | 。45 | 0.02 | 0.08 | 综合成绩 | |
英国石油公司。SessionDuration,γ04 | −0.29 | 0.16 | 07 | −0.37 | 0.17 | 03 | |
英国石油公司。TypingInterval,γ05 | −0.34 | 0.60 | 。45 | −0.42 | 0.63 | 50 |
一个共对142人进行982次重复测量。
b因变量是对愉快活动失去兴趣。
c因变量是抑郁情绪。
d固定效果的标准误差。
参数一个 | 模型1b | 模型2c | |||
估计 | CId | 估计 | CId | ||
截距方差,![]() |
0.86 | 0.06 - -1.09 | 0.95 | 0.74 - -1.24 | |
随机斜率wp的方差。AppCount,![]() |
0.06 | 0.00 - -0.13 | 0.05 | 0.00 - -0.12 | |
随机斜率wp的方差。AppEntropy,![]() |
14.81 | 0.00 - -38.86 | 26.30 | 0.34 - -53.54 | |
随机斜率wp的方差。NighttimePhoneUse,![]() |
0.003 | 0.00 - -0.05 | 0.00 | 0.00 - -0.09 | |
随机斜率wp的方差。SessionDuration,![]() |
0.16 | 0.00 - -0.43 | 0.03 | 0.00 - -0.42 | |
随机斜率wp的方差。TypingTimeInterval,![]() |
0.84 | 0.00 - -6.48 | 0.00 | 0.00 - -4.53 | |
残差方差,![]() |
0.54 | 0.47 - -0.59 | 0.55 | 0.47 - -0.59 |
一个共对142人进行982次重复测量。
b因变量是对愉快活动失去兴趣。
c因变量是抑郁情绪。
dCI:随机效应95% CI。
![](https://asset.jmir.pub/assets/6eb1a29576dbdccf309fed99cf8187bd.png)
抑郁情绪与人类智能手机互动行为的关系
在模型2的结果中(详情见
和 ),典型个体的抑郁情绪水平为γ00= 2.09 (P< 0.001),分值从0到4。应用数量和抑郁情绪之间的个人关系是γ10=−0.03 (P=.57),人际相关性为γ01= 0.08 (P= 50)。这表明,无论是将一个人与自己比较,还是将一个人与他人比较,应用程序数量的变化与抑郁情绪的不同程度无关。标准化应用程序熵与抑郁情绪之间的人内关联为γ20.=−0.20 (P=.85),人际关联为γ02=−1.98 (P=陈霞)。这表明,无论是将一个人与自己比较,还是将一个人与他人比较,标准化应用程序熵的变化都与不同程度的抑郁情绪无关。
夜间使用手机和抑郁情绪之间的个人关系是γ30.=−0.02 (P=.62),人际关联为γ03= 0.08 (P=综合成绩)。这表明,无论是将一个人与自己比较,还是将一个人与他人比较,夜间使用手机的变化与抑郁情绪的不同程度无关。
治疗持续时间与抑郁情绪之间的个人关系为γ40=−0.03 (P=.80),人际关联为γ04=−0.37 (P= 03)。这表明,通常治疗时间较短的个体抑郁情绪水平较高。
打字时间间隔与抑郁情绪之间的人内关联为γ50= 0.88 (P=.047),人际相关性为γ05=−0.42 (P= 50)。这表明,当将一个人与自己进行比较时,打字时间间隔的增加(打字速度的减慢)与更高程度的抑郁情绪有关。然而,打字速度较慢的人并没有更高程度的抑郁情绪。
讨论
主要研究结果
在本文中,我们提出了人与智能手机互动行为与抑郁症状之间的理论联系,建议在纵向分析中分解人与人之间和人与人之间的影响,并分析了142个个体的984个抑郁症状测量值与他们1年的人与智能手机互动行为之间的关系。结果表明,人与人之间应用程序使用多样性的减少与对愉快活动的兴趣丧失有关,打字速度的下降(或打字时间间隔的增加)和会话持续时间的差异(例如,更短的会话持续时间)与更高的抑郁情绪有关。
从智能手机行为了解抑郁症
我们发现,对令人愉悦的活动失去兴趣(抑郁症的一个关键诊断标准)与应用程序数量的个人内部变化有关,这证实了我们的假设,即兴趣丧失的程度可以体现在个人使用智能手机来满足各种目的和需求上。人类与智能手机的互动行为,特别是人们如何使用应用程序来满足他们的需求,可以作为衡量抑郁症状的行为衡量标准。我们发现,对令人愉快的活动失去兴趣的方向与此相同,但在夜间使用手机频率较高的情况下,这一点并不重要(γ30.= 0.07;P= 10)。这一方向与以往文献的研究结果一致[
据报道,在睡眠窗口使用手机与主观睡眠质量差有关。此外,我们发现对令人愉快的活动失去兴趣的方向是相同的,但在较短的智能手机会话时间和较长的打字时间间隔(较慢的打字速度)方面没有达到显著性。这一方向与以往文献的研究结果一致[ 据报道,抑郁症状与打字时间较短和打字速度较慢有关。最后,在先前的文献中,发现独特物理位置的熵与抑郁症状呈负相关[ , ,这可能是由于大部分时间呆在家里,避免去那些曾经令人愉快的地方。然而,我们没有发现独特应用使用熵与兴趣丧失之间存在显著关联,这意味着更集中地使用一个或几个特定应用并不意味着兴趣丧失。未来的分析可以进一步调查访问物理地点与数字应用程序的异同,因为这与他们对愉快活动失去兴趣的联系有关。抑郁情绪是抑郁症的另一个关键诊断标准,基于先前的文献,预计从人与智能手机的互动行为中预测抑郁情绪是具有挑战性的[
, ]。我们发现,高水平的抑郁情绪与表明更差的精神运动功能的行为测量相关,包括打字时间间隔更长和使用智能手机的时间更短。先前针对老年人的实证研究报告了情绪与认知功能之间的经验关系[ ]。然而,测试这些行为测量与精神运动功能或注意力集中困难之间的联系将更加直接和引人注目。由于本研究中使用的DSM L1不包括集中困难的评估,因此我们无法测试这种关联。对于有这种症状测量的研究,例如,患者健康问卷(PHQ) [ ],我们建议直接测试这种症状和难以集中注意力的行为测量之间的联系。总之,这些发现强调了被动感知数据的实用性,特别是人类智能手机交互的被动感知,作为抑郁症的持续监测工具,并有可能在检测到抑郁症状升高时作为及时干预工具。此外,研究结果表明,采取抑郁的维度视角可能会告知被动感知行为测量的可解释性,并提高评估特定抑郁症状的准确性。
分析抑郁的纵向过程
由于心理过程的非遍历性,我们强调了在行为纵向分析中分离人内效应和人间效应的推荐做法。该分析提供的证据表明,这两种影响确实在抑郁症状方面有所不同,并提供了经验证据,表明抑郁症发展与人类智能手机互动之间的关联的行为过程可能是不可遍历的。以应用数量为例,应用数量(游戏邦注:即用户使用的唯一应用数量)与用户兴趣损失之间的个人内部关联显著且为负值,但相同行为测量与用户兴趣损失之间的个人之间关联不显著且为正值。从这个结果中,我们可以推断,只有当人们使用的应用程序比自己少时,才会表明失去兴趣的风险更高,但对于那些习惯性使用应用程序比别人少的人来说,这并不意味着失去兴趣的风险更高。在我们的分析中,这种非遍历性不仅体现在应用数量上,还体现在其他预测指标上,比如会话持续时间(只有人与人之间的联系与抑郁情绪显著相关)和打字时间间隔(只有人与人之间的联系与抑郁情绪显著相关)。这些发现强调了在纵向研究中分解人内部和人之间的影响以得出准确的统计推断的重要性。
不遵循这一建议的做法有两种主要的风险,包括将人内和人之间的部分混合作为一个预测因素。首先,当同一预测器的内部和人与人之间的部分作为单一测量输入模型时,存在识别假阳性病例的风险。假设,如果应用程序数量和兴趣丧失之间存在显著的负相关,而不区分人与人之间和人与人之间的部分,我们就会错误地将有抑郁风险的人与习惯上使用较少应用程序的人区分开来。其次,一个重要的预测因素可能会被忽视,因为结果和预测因素之间的相关性可能会在预测因素被分为个人之间和个人内部部分之前描绘出一幅模糊的画面。这种情况通常发生在人内部或人之间的联系方向不同时,这是一种特殊的非遍历性形式。例如,应用数量与人际关系呈负相关(γ10=−0.15),人际关系呈正相关(γ01=0.05),但原始应用数量与兴趣损失之间的相关性为- 0.01 (
).考虑到结果与行为测量之间的相关性在行为感知研究中经常被报道,并被用作特征选择标准,我们建议在纵向研究中,对预测者的人内部分和人之间部分分别计算相关性或其他统计关联(例如,在多层次模型框架中),并建议在适用的情况下使用各自的相关性作为特征选择标准。在行为感知文献中,研究抑郁症状的纵向数据以及与被动感知信号的关联的建模方法往往忽略了对人与人之间和人与人之间影响的分解。重要的是要指出,由于心理过程的非遍历性,区分人内部和人之间的影响是一种建模选择,不仅适用于统计推断(例如,多层次建模),也适用于机器学习方法,其中时变预测因子具有人内部和人之间的部分,并且它们将与结果变量具有独特的关联。
限制
这项回顾性研究的结果必须考虑到一些局限性来解释。首先,我们使用我们专有软件的被动传感数据建立行为测量,这有望捕获抑郁症状的组成部分。还有其他旨在进行行为感知或数字表型研究的平台和软件,如Beiwe系统[
],灯[ ]、风险状态简易评估系统(ear) [ ]和BiAffect app [ ]。根据研究者对软件或平台的选择,以及数据的可用性和特征来创建测量或特征,目前在行为感知研究中是一种常见的做法。在行为感知文献中,已经提出了对经验研究中测量的这种特殊发展的普遍性的关注[ , ]。考虑到数据收集平台/软件存在的异质性,确保每项研究的数据源符合相同的数据收集方法或标准是具有挑战性的。相反,在确保跨研究的行为测量具有相同的概念意义和可比性方面找到共同点可能更为现实和合理。作为第一步,我们旨在通过几种方法来增强本研究的可复制性,包括明确说明测量的概念意义,行为测量的时间尺度(例如,小时)和计算方法(例如,应用程序熵方程),并报告统计摘要(例如,均值,SD,范围和偏度)。进一步提高这些测量方法的普遍性,可以检验行为测量方法的心理测量特征,如信度和效度。此外,值得注意的是,还有其他一些行为指标也被认为与抑郁症状有关,但这些指标尚未得到探讨,包括社会互动[ ],通常从可穿戴设备收集的生理或运动数据[ ]和每天看屏幕的总时间[ (我们用每天从午夜到早上6点看屏幕的时间总和来衡量睡眠中断程度)。第二,本研究的参与者是患有严重精神疾病的老年人。老年人与智能手机互动行为的特征可能与年轻人或青少年不同。此外,可能影响人类智能手机互动的临床信息(例如,痴呆和视力障碍)并未作为Mindstrong常规护理的一部分收集;因此,我们不能排除该样本中可能存在医学合并症,并可能影响行为指标。考虑到精神疾病的历史及其对行为的影响,抑郁症患者是否与以前没有抑郁症的人具有相同的行为特征还没有得到充分的研究。需要进一步的比较来提高本研究结果的普遍性,特别是老年人和年轻人之间的比较,以及临床抑郁症样本和亚急性或非临床抑郁症样本之间的比较。
第三,行为感知文献中很少讨论行为测量的适当时间尺度,并且从理论和经验的角度来看,尚不清楚较短的时间尺度(例如,从每小时到每天和每周)与结果之间的关系。之前大多数研究智能手机行为和抑郁症的文献都使用每天或每小时的时间尺度来汇总行为测量[
, , ]。考虑到讨论和推荐的稀缺性,我们选择在每小时的水平上计算几个行为度量(例如,应用数量、应用熵、会话持续时间和打字速度),因为每小时的水平提供了更多关于人类智能手机交互行为的时间分辨率。未来的分析可以研究行为测量的多个时间尺度及其与抑郁症状的关系。最后,由于抑郁症的性质,这个样本中的每个人的样本量是一个挑战。由于丧失兴趣的经历可能会影响个人完成自我报告的动机,因此在抑郁症状严重的日子里收集密集的纵向数据是一项挑战。为了发现有意义的人际关系,每个人的自我报告的数量是必要的,但往往是稀缺的。这就是为什么我们只选择调查依从性高的个人的原因之一。未来的研究需要开发创造性的方法来收集抑郁症状数据,减轻数据缺失问题,并纳入临床医生对患者抑郁症状的评估。
结论
由于有可能使用被动感知作为一种低负担的方法来识别心理健康风险,研究已经开发并确定了评估抑郁症状升高风险的行为措施。基于抑郁症理论和之前的经验文献,我们提出了一套基于人类智能手机交互的行为测量方法,随后发现有证据表明,应用程序的使用与对愉快活动的兴趣丧失有关,而打字速度和会话持续时间与抑郁情绪有关。我们还强调了纵向分析中分解人内效应和人间效应的方法学考虑,提供了证据来支持这两种效应的差异,并讨论了在分析中不分解它们的风险。在这一领域的理论和方法问题上存在着重要的开放性问题,我们期望对这些问题的追求将在未来几年推动行为感知研究的科学发现。
利益冲突
所有作者都是Mindstrong Health的员工,并获得了Mindstrong Health的私募股权期权。
参考文献
- 精神疾病诊断与统计手册,第五版。华盛顿:美国精神病学协会;2013.
- zzarate D, Stavropoulos V, Ball M, de Sena Collier G, Jacobson NC。探索抑郁症的数字足迹:对经验证据的PRISMA系统文献综述。中华医学会精神病学杂志[j]; 2009;22(1):421 [j]免费全文] [CrossRef] [Medline]
- 刘建军,刘建军。数字表现型、行为感知或个人感知:数字时代的名字和透明度。中华数字医学杂志2020年3月25日;3(1):45 [j]免费全文] [CrossRef] [Medline]
- 张明,张晓明,张晓明。个人感知:利用无处不在的传感器和机器学习了解心理健康。临床精神病学杂志2017年5月8日;13:23-47 [j]免费全文] [CrossRef] [Medline]
- 陈建军,陈建军,陈建军,等。抑郁障碍中快感缺失的研究进展。中华精神病学杂志,2020;33 (5):391 - 391 [j]免费全文] [CrossRef] [Medline]
- 李建军,李建军,李建军。抑郁症患者快感缺乏症的研究进展。中国生物医学工程学报(英文版);2016;25 (5):559 - 564 [j]免费全文] [CrossRef] [Medline]
- 刘建军,刘建军,刘建军,等。有或无精神疾病的成人快感缺乏的评估:一项系统回顾和荟萃分析。JAMA网络开放2020 Aug 03;3(8):e2013233 [j]免费全文] [CrossRef] [Medline]
- 李建军,李建军,李建军,李建军,李建军,李建军,李建军。中华精神病学杂志2002;16(1):1 - 3。[CrossRef] [Medline]
- Nickels S, Edwards MD, Poole SF, Winter D, gronshbell J, Rozenkrants B,等。面向现实世界抑郁症数字测量的移动平台:以用户为中心的设计、数据质量、行为和临床建模。中华医学杂志;2011;8(8):827589 [j]免费全文] [CrossRef] [Medline]
- Meyerhoff J, Liu T, Kording KP, Ungar LH, Kaiser SM, Karr CJ,等。使用智能手机传感器特征评估抑郁、焦虑和社交焦虑的变化:纵向队列研究[J] Med Internet Res 2021 Sep 03;23(9):e22844 [J]免费全文] [CrossRef] [Medline]
- 张勇,孙绍平,张建军,张建军,张建军,张建军,张勇。抑郁症状严重程度与手机测量活动能力的纵向关系:动态结构方程模型研究。中华医学杂志;2009;9(3):398 [j]免费全文] [CrossRef] [Medline]
- 李建军,李建军,李建军,李建军。基于智能手机行为特征的智能手机抑郁预测研究[J]。JMIR Mhealth Uhealth 2021七月12;9(7):e26540 [j]免费全文] [CrossRef] [Medline]
- 使用与满足:一个理论视角。国际传播协会年鉴1984;8(1):20-55。[CrossRef]
- Moshe I, Terhorst Y, Opoku Asare K, Sander LB, Ferreira D, Baumeister H,等。利用智能手机和可穿戴设备数据预测抑郁和焦虑症状。前沿精神病学2021;12:625247 [j]免费全文] [CrossRef] [Medline]
- 李建军,李建军,李建军。基于被动感知的STDD短期抑郁检测方法。传感器(巴塞尔)2020 Mar 04;20(5):1396 [免费全文] [CrossRef] [Medline]
- 白锐,肖林,郭勇,朱鑫,李宁,王勇,等。使用被动数字数据的机器学习模型跟踪和监测重度抑郁症患者的情绪稳定性:前瞻性自然多中心研究。JMIR Mhealth Uhealth 2021 Mar 08;9(3):e24365 [j]免费全文] [CrossRef] [Medline]
- 杨建军,杨建军,杨建军,等。利用数字表型准确检测抑郁症的严重程度。中国生物医学工程学报,2019;31(6):893-896。[CrossRef]
- 王晓明,王晓明,王晓明,等。基于移动感知的主观睡眠质量与情绪跟踪研究。[J]互联网研究与发展[J]; 2009;24(3): 563 - 563 [J]免费全文] [CrossRef] [Medline]
- 胡克JM,胡国强,胡国强,胡国强,胡国强,Sánchez-Ferro A。在自然打字过程中,通过手指与电脑键盘的相互作用来检测精神运动损伤。科学通报2015年4月16日;5:6 678 [免费全文] [CrossRef] [Medline]
- 张建军,李建军,李建军,等。在大型开放科学样本中,情绪和衰老对击键动力学元数据及其日模式的影响:一项BiAffect iOS研究。医学信息学报,2020,01;27(7):1007-1018 [J]免费全文] [CrossRef] [Medline]
- Zulueta J, Piscitello A, Rasic M, Easter R, Babu P, Langenecker SA,等。用手机击键元数据预测情绪障碍严重程度:一项双影响数字表型研究。中国医学信息学报,2018;20(7):e241 [J]免费全文] [CrossRef] [Medline]
- Snijders TAB, Bosker RJ。多层次分析:介绍基本和高级多层次建模。加利福尼亚州千橡市:SAGE出版有限公司;2011.
- 博尔格N,劳伦索JP。密集的纵向方法:介绍日记和经验抽样研究。纽约:吉尔福德出版社;2013.
- 柯伦PJ,鲍尔DJ。纵向变化模型中人内效应和人间效应的分解。精神病学杂志2011;62:583-619 [j]免费全文] [CrossRef] [Medline]
- DSM-5自评一级横切症状测量作为筛查工具。中华精神病学杂志2018;19(1):111-115。[CrossRef] [Medline]
- 克伦克K,斯皮策R,威廉姆斯JB。患者健康问卷-2抑郁症两项筛选的效度。医疗保健2003;41(11):1284-1292 [j]免费全文] [CrossRef]
- Molenaar PCM。把心理学作为具体科学的宣言:把人带回科学心理学,这次是永远的。测量:跨学科研究与展望2004;2(4):201-218。[CrossRef]
- 王晓明,王晓明,王晓明,等。线性混合效应模型的拟合。[j] .软件工程学报,2015;37(1):1- 8。[CrossRef]
- 李建军,李建军,李建军,李建军。焦虑和抑郁症状的人际差异和个人变化对老年认知表现的影响Psychol。中国医学杂志2017;38(8):1350-1358。[CrossRef]
- 克伦克K,斯皮策RL,威廉姆斯JBW。PHQ-9:一个简短的抑郁症严重程度测量的有效性。实习医学杂志2001;16(9):606-613 [J]免费全文] [CrossRef] [Medline]
- 李建军,李建军,李建军,等。Beiwe:高通量数字表型数据采集平台。软件学报(英文版);2013;6(6):347。[CrossRef]
- Torous J, Wisniewski H, Bird B, Carpenter E, David G, Elejalde E,等。为心理健康和多样化医疗需求创建数字健康智能手机应用程序和数字表型平台:一种跨学科和协作的方法。j .抛光工艺。Behav。科学通报2019;4(2):73-85 [j]免费全文] [CrossRef]
- Lind MN, Byrne ML, Wicks G, Smidt AM, Allen NB。毫不费力的风险状态评估(ear)工具:移动传感的人际方法。中华医学杂志2018年8月28日;5(3):e10334 [j]免费全文] [CrossRef] [Medline]
- 数字化表型数据收集与分析的机遇与挑战。神经精神药理学2021 1月17日;46(1):45-54 [j]免费全文] [CrossRef] [Medline]
- hukvale K, Venkatesh S, Christensen H.走向临床数字表型:考虑目的、质量和安全性的及时机会。中华医学杂志2019年9月6日;2(1):88 [j]免费全文] [CrossRef] [Medline]
- 王伟,王伟,王志军。基于智能手机体验抽样和GPS跟踪的移动行为与主观幸福感的关系研究。Eur J per 2020 Sep 01;34(5):714-732。[CrossRef]
- 吴晓,陶生,张勇,张生,陶峰。中国大学生低体力活动和长时间看屏幕会增加心理健康问题和睡眠质量差的风险。PLoS One 2015;10(3):e0119607 [j]免费全文] [CrossRef] [Medline]
缩写
DSM:精神障碍诊断与统计手册 |
DSM L1:精神障碍诊断与统计手册第五版自评一级交叉症状测量-成人调查 |
HIPAA:健康保险流通与责任法案 |
PHQ2:简短的病人健康问卷 |
编辑:A Mavragani;提交24.09.22;A Leow、M Kapsetaki、R Easter的同行评议;对作者19.10.22的评论;修订版本收到13.12.22;接受26.01.23;发表22.02.23
版权©肖扬,乔纳森·奈特,维多利亚·班吉瓦,维纳亚克·坎巴姆帕蒂。最初发表于JMIR Formative Research (https://formative.www.mybigtv.com), 2023年2月22日。
这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是原始作品首次发表在JMIR Formative Research上,并适当引用。必须包括完整的书目信息,到https://formative.www.mybigtv.com上原始出版物的链接,以及版权和许可信息。