原始论文gydF4y2Ba
摘要gydF4y2Ba
背景:gydF4y2Ba抑郁症是一种常见的、负担沉重的、经常复发的精神健康障碍,经常没有被发现和治疗。手机无处不在,而且传感器的数量也越来越多,这些传感器可能有助于监测可能预示抑郁症状的行为模式。gydF4y2Ba
摘要目的:gydF4y2Ba本研究的目的是探讨使用手机全球定位系统(GPS)和使用传感器检测日常生活行为标记,以及它们在识别抑郁症状严重程度方面的应用。gydF4y2Ba
方法:gydF4y2Ba我们从普通社区中招募了40名成年参与者,让他们携带装有传感器数据采集应用程序(Purple Robot)的手机2周。在这些参与者中,28人接收了足够的传感器数据进行分析。在为期两周的研究开始时,参与者完成了一份自我报告抑郁调查(PHQ-9)。从GPS定位和手机使用数据中开发和提取行为特征。gydF4y2Ba
结果:gydF4y2Ba来自GPS数据的许多特征与抑郁症状的严重程度有关,包括昼夜节律运动(24小时节律的规律性;gydF4y2BargydF4y2Ba=点,gydF4y2BaPgydF4y2Ba=.005),归一化熵(最喜欢的位置之间的流动性;gydF4y2BargydF4y2Ba=算下来,gydF4y2BaPgydF4y2Ba=.012)和位置方差(GPS移动性与位置无关;gydF4y2BargydF4y2Ba=算下来,gydF4y2BaPgydF4y2Ba= .012)。手机使用特征、使用时长和使用频率也存在相关性(gydF4y2BargydF4y2Ba= 54,gydF4y2BaPgydF4y2Ba=。011,而且gydF4y2BargydF4y2Ba=点,gydF4y2BaPgydF4y2Ba=。015,respectively). Using the normalized entropy feature and a classifier that distinguished participants with depressive symptoms (PHQ-9 score ≥5) from those without (PHQ-9 score <5), we achieved an accuracy of 86.5%. Furthermore, a regression model that used the same feature to estimate the participants’ PHQ-9 scores obtained an average error of 23.5%.
结论:gydF4y2Ba从手机传感器数据中提取的特征,包括GPS和手机使用情况,提供了与抑郁症状严重程度密切相关的行为标记。虽然这些发现必须在有确诊临床症状的参与者中进行更大规模的研究,但它们表明,手机传感器提供了大量的临床机会,包括持续监测风险人群,患者负担很少,干预措施可以及时提供服务。gydF4y2Ba
doi: 10.2196 / jmir.4273gydF4y2Ba
关键字gydF4y2Ba
简介gydF4y2Ba
抑郁症是一种常见的精神疾病。据估计,重度抑郁症12个月的患病率为6.6-10.3%,而终生风险估计为16.6-17.1% [gydF4y2Ba
-gydF4y2Ba ].阈下抑郁症状更为常见[gydF4y2Ba ],对人们的生活造成重大损害,并使他们未来面临精神健康问题的风险[gydF4y2Ba ].抑郁症无论在诊断水平还是阈值以下水平,都在成本、生产力丧失、发病率、痛苦和死亡率方面给社会带来了非常高的负担[gydF4y2Ba -gydF4y2Ba 它是全球残疾和疾病负担的主要原因[gydF4y2Ba ].据世界卫生组织估计,到2020年,抑郁症将成为全球"健康生命年数减少"的第二大原因[gydF4y2Ba ].gydF4y2Ba抑郁症可以通过多种方法治疗,包括抗抑郁药和心理治疗;然而,只有极少数需要治疗的人接受了治疗[gydF4y2Ba
].在我们的医疗系统中,抑郁症通常需要数月或数年的时间才能被识别和治疗,如果它得到了治疗[gydF4y2Ba ].治疗抑郁症最常见的环境之一是初级保健。gydF4y2Ba ,gydF4y2Ba ];然而,初级保健医生可能无法识别大多数有抑郁症状的患者[gydF4y2Ba ,gydF4y2Ba ].因此,更有效的监测方法可以大大改善向有需要的人提供服务的情况。gydF4y2Ba手机正在成为我们这个世界上最普遍的消费设备。手机,特别是智能手机,具有强大的传感、计算和通信能力,可以持续监测个人的环境,包括身体活动、位置和环境。抑郁症与多种行为成分(如活动减少、精神运动障碍、睡眠变化)和动机状态(如快感缺乏)有关,其中一些可以通过手机传感器检测到[gydF4y2Ba
,gydF4y2Ba ].因此,作为监测风险和恢复力的行为和环境指标的平台,手机具有重要的前景,可以改善抑郁症患者的长期管理和治疗。gydF4y2Ba事实上,在这一领域的一些工作已经显示出了希望。我们小组的第一项研究发现,手机传感器数据可以检测抑郁症患者的社交模式,但这是一项只有8名参与者的小型研究[gydF4y2Ba
].其他研究小组发现,手机传感器可以有效地检测抑郁症患者的社交和睡眠行为。gydF4y2Ba ,gydF4y2Ba ,这些特征与抑郁症状的严重程度显著相关[gydF4y2Ba ].gydF4y2Ba这项研究的目的是通过专门关注与地理空间运动相关的行为标记来扩展之前的工作,我们假设这将与抑郁症状的严重程度有关,因为抑郁症会导致动机下降、退缩和活跃。此外,过度使用手机被认为是强迫性行为,与某些抑郁症状有关。gydF4y2Ba
,gydF4y2Ba ].因此,我们还探索了抑郁症症状严重程度与用于收集传感器数据的手机使用情况的关系。为了实现这些目标,我们使用了我们的手机应用程序紫色机器人[gydF4y2Ba ,gydF4y2Ba ],收集抑郁症严重程度不同的参与者的全球定位系统(GPS)位置和手机使用数据。我们根据这些数据定义了一些行为特征,并建立了分类和回归模型,以检查它们与抑郁症症状严重程度的关系。gydF4y2Ba方法gydF4y2Ba
参与者gydF4y2Ba
我们从2013年4月到7月通过craigslist广告招募了40名成年参与者。如果参与者有电子邮件账户、电脑和宽带接入互联网,每天大部分时间都在蜂窝网络范围内,能够说英语和阅读英语,至少19岁,居住在美国境内,那么他们就有资格参与。参与者在网上签署了一份同意书,研究人员通过电话审阅了同意书。这项研究得到了西北大学机构审查委员会的批准。gydF4y2Ba
在研究开始时,参与者被要求完成一份由人口统计问卷和患者健康问卷-9 (PHQ-9)组成的在线评估,PHQ-9是一种常用的自我报告抑郁症状严重程度的测量方法[gydF4y2Ba
,其评分范围为0-27。5分以下为无抑郁,5-9分为轻度抑郁,10-14分为中度抑郁,15-19分为中度抑郁,20分以上为重度抑郁[gydF4y2Ba ].gydF4y2Ba如果参与者拥有并使用操作系统2.3 (Gingerbread)或更高版本的Android设备,研究人员将协助下载、安装和配置紫色机器人(参见下面的紫色机器人部分)。没有兼容手机的参与者得到了一部安装并配置了紫色机器人的安卓Nexus 4。电话要么从研究办公室取走,要么直接寄给参与者。gydF4y2Ba
参与者被要求随身携带手机,并在两周内全天充电。此外,研究人员解释说,紫色机器人将收集GPS定位和手机使用数据。这项研究的部分目的是测试紫色机器人在现场的功能,研究人员定期通过电话和电子邮件与参与者联系,以确保应用程序正常工作,并回答问题。gydF4y2Ba
紫色的机器人gydF4y2Ba
Purple Robot是我们开发的一款开源Android应用程序,用于收集手机传感器数据[gydF4y2Ba
,gydF4y2Ba ].该应用程序实现了存储转发架构,其中传感器数据被收集,存储在设备上,并在网络连接可用时传输。这使我们能够在各种无线连接场景中收集数据,并且确信间歇性的网络访问不会影响所收集数据的性质、质量或数量。gydF4y2BaPurple Robot使用标准的MD5哈希和高级加密标准,在存储和传输之前匿名化个人身份和其他敏感信息[gydF4y2Ba
)算法。一旦数据被匿名化,它们就被存储起来,然后传输到数据收集服务器,然后从设备上删除。只有在参与者使用的唯一标识符和用于加密数据的特定于研究的密钥已知的情况下,服务器上的传感器数据才能与研究期间收集的其他信息链接起来。gydF4y2Ba紫色机器人移动应用程序和支持的服务器基础设施能够收集有关用户的物理环境(如动作)、社交设置(如Facebook好友数量)和手机使用行为(如屏幕状态)的信息。它还使我们能够制定一个完整的数据收集策略,用于分析抑郁和日常生活的行为数据特征之间的关系。gydF4y2Ba
在本研究中,我们配置了紫色机器人来收集GPS定位和手机使用数据,因为本研究的目的是关注与空间移动和手机使用行为相关的行为标记。在我们的下一个研究中,我们计划使用紫色机器人从各种手机传感器收集数据。gydF4y2Ba
紫色机器人每5分钟对GPS定位传感器采样一次,通过检测屏幕开关事件收集手机使用数据。gydF4y2Ba
数据预处理gydF4y2Ba
数据预处理阶段的目标是促进从GPS位置和手机使用数据提取特征。gydF4y2Ba
对于位置数据(gydF4y2Ba
),我们使用了两种方法。第一个程序确定每个GPS定位数据样本是来自固定状态(如在办公室工作)还是过渡状态(如在街上行走)。为此,我们通过计算每个位置数据样本的时间导数来估计移动速度,然后使用一个阈值速度来定义这两种状态之间的边界。在本研究中,我们将该阈值设置为1 km/h。gydF4y2Ba第二个步骤是聚类。我们只对处于稳态的数据样本进行聚类。目的是确定参与者花时间最多的地方,如家、工作场所、公园等。我们使用了一种基于距离的聚类算法叫做gydF4y2BaKgydF4y2Ba——(gydF4y2Ba
],其中数据被划分为gydF4y2BaKgydF4y2Ba使数据点到其簇中心的总体距离最小化的簇。因为集群的数量是未知的,所以我们从一个集群开始,然后增加集群的数量,直到每个集群中最远的点到其集群中心的距离低于阈值。这个阈值决定了集群的最大半径,在我们的研究中设置为500米。gydF4y2Ba手机使用数据是通过观察手机屏幕打开的时间来收集的。gydF4y2Ba
).考虑到手机屏幕会在接收短信等应用程序的通知时继续显示,我们排除了持续时间小于30秒的非参与者发起的简短屏幕打开事件。gydF4y2Ba特征提取gydF4y2Ba
位置偏差gydF4y2Ba
我们定义了位置方差来测量参与者GPS位置的可变性。为了计算位置方差,我们只使用了定态的位置数据(参见数据预处理)。具体来说,位置方差被计算为位置数据的纬度和经度分量的统计方差之和的对数:gydF4y2Ba
位置偏差gydF4y2Ba=日志(gydF4y2BaσgydF4y2Ba纬度gydF4y2Ba2gydF4y2Ba+gydF4y2BaσgydF4y2Ba长gydF4y2Ba2gydF4y2Ba) (1)gydF4y2Ba
我们应用对数来补偿参与者位置方差分布的偏度。gydF4y2Ba
集群数量gydF4y2Ba
控件找到的位置集群的数量gydF4y2BaKgydF4y2Ba-means算法在预处理阶段。gydF4y2Ba
熵gydF4y2Ba
我们定义了熵来衡量参与者在位置集群上花费的时间的可变性。该特性是基于信息论中的熵的概念发展而来的[gydF4y2Ba
].计算方法如下:gydF4y2Ba熵gydF4y2Ba=−∑gydF4y2Ba我gydF4y2BapgydF4y2Ba我gydF4y2Ba日志gydF4y2BapgydF4y2Ba我gydF4y2Ba(2)gydF4y2Ba
其中每个gydF4y2Ba我gydF4y2Ba=1, 2,…,gydF4y2BaNgydF4y2Ba表示一个位置集群,gydF4y2BaNgydF4y2Ba表示位置集群的总数,和gydF4y2BapgydF4y2Ba我gydF4y2Ba参与者在位置集群上花费的时间百分比是多少gydF4y2Ba我gydF4y2Ba.高熵表示参与者在不同位置的集群中花费的时间更一致,而低熵表示在集群中花费的时间更不平等。例如,如果一个参与者80%的时间在家里,20%的时间在工作中,得到的熵值是−(0.8log0.8 + 0.2log0.2)≈0.500,而如果他们50%的时间在家里,50%的时间在工作中,得到的熵值是−(0.5log0.5 + 0.5log0.5)≈0.693。gydF4y2Ba
归一化熵gydF4y2Ba
我们用熵除以其最大值来定义归一化熵,最大值是簇总数的对数:gydF4y2Ba
归一化熵gydF4y2Ba=gydF4y2Ba熵gydF4y2Ba∕日志gydF4y2BaNgydF4y2Ba(3)gydF4y2Ba
与熵不同,归一化熵对簇的数量是不变的,因此仅依赖于访问的位置簇的分布。归一化熵的值范围为0-1,其中0表示所有位置数据点属于同一个集群,1表示它们在所有集群中均匀分布。gydF4y2Ba
寄宿家庭gydF4y2Ba
家庭住宿衡量的是参与者在家里度过的时间相对于其他地点集群的百分比。为了获得这个度量,我们首先需要知道哪个集群代表参与者的家。我们根据两种启发式方法确定了家庭集群:(1)家庭集群是访问量排名第一到第三的集群之一,(2)家庭集群是在上午12点到6点之间访问次数最多的集群。在我们的数据集中,不包含有夜班工作的参与者,这两个启发式导致每个参与者有且只有一个位置集群。gydF4y2Ba
生理运动gydF4y2Ba
我们定义了昼夜节律运动来捕获位置数据的时间信息。这一特征衡量了参与者的位置序列在多大程度上遵循了24小时或昼夜节律。例如,如果一个参与者每天都在同一时间出门上班和下班回家,那么他的昼夜节律就会很高。相反,在不同地点之间移动的模式更不规则的参与者的昼夜节律运动更低。gydF4y2Ba
为了计算昼夜节律,我们首先使用了最小二乘谱分析,也被称为Lomb-Scargle方法[gydF4y2Ba
],获取GPS定位数据的频谱。然后,我们计算了在24±0.5小时内落入频率箱的能量量,方法如下:gydF4y2BaEgydF4y2Ba=∑gydF4y2Ba我gydF4y2Bapsd (gydF4y2BafgydF4y2Ba我gydF4y2Ba)∕(gydF4y2Ba我gydF4y2Ba1gydF4y2Ba−gydF4y2Ba我gydF4y2Ba2gydF4y2Ba) (4)gydF4y2Ba
在哪里gydF4y2Ba我gydF4y2Ba=gydF4y2Ba我gydF4y2Ba1gydF4y2Ba,gydF4y2Ba我gydF4y2Ba1gydF4y2Ba+ 1,gydF4y2Ba我gydF4y2Ba1gydF4y2Ba+ 2,…,gydF4y2Ba我gydF4y2Ba2gydF4y2Ba,gydF4y2Ba我gydF4y2Ba1gydF4y2Ba而且gydF4y2Ba我gydF4y2Ba2gydF4y2Ba表示对应于24.5和23.5小时周期的频率箱。psd (gydF4y2BafgydF4y2Ba我gydF4y2Ba)为每个频仓的功率谱密度gydF4y2BafgydF4y2Ba我gydF4y2Ba.我们计算gydF4y2BaEgydF4y2Ba分别为经度和纬度,得到总昼夜运动为:gydF4y2Ba
厘米gydF4y2Ba=日志(gydF4y2BaEgydF4y2Ba纬度gydF4y2Ba+gydF4y2BaEgydF4y2Ba长gydF4y2Ba) (5)gydF4y2Ba
我们应用对数来解释分布中的偏度。gydF4y2Ba
过渡时间gydF4y2Ba
过渡时间表示参与者处于非平稳状态的时间百分比(参见数据预处理)。这是用处于过渡状态的GPS定位样本数除以样本总数来计算的。gydF4y2Ba
总距离gydF4y2Ba
总距离是以千米为单位的参与者所走的总距离。它是通过累积位置样本之间的距离来计算的。gydF4y2Ba
电话使用频率gydF4y2Ba
手机使用频率指的是参与者每天平均使用手机的次数。gydF4y2Ba
电话使用时长gydF4y2Ba
平均而言,手机使用时长是指参与者每天使用手机的总时间(以秒为单位)。gydF4y2Ba
抑郁特征与程度的关系gydF4y2Ba
我们进行了初步的统计分析,以找出每个特征如何对应抑郁症状的程度,以及它是否能够区分患有任何程度抑郁症的人和没有抑郁症的人。前者通过将每个特征与研究开始时获得的PHQ-9评分相关联进行调查。研究人员首先将受试者分为有抑郁症状(PHQ-9≥5)和无抑郁症状(PHQ-9 <5)的两组。使用PHQ-9评分的5分界线是因为在这个范围内的分数表明抑郁症“无症状”,而那些在治疗后达到这个范围的人被认为完全缓解。gydF4y2Ba
从特征估计抑郁状态gydF4y2Ba
分数估计模型gydF4y2Ba
我们利用从手机传感器数据中提取的特征,使用线性回归模型来估计每个参与者的PHQ-9得分。模型定义如下:gydF4y2Ba
抑郁得分=gydF4y2Ba0gydF4y2Ba+一个gydF4y2Ba我gydF4y2BaFgydF4y2Ba我gydF4y2Ba+一个gydF4y2Ba2gydF4y2BaFgydF4y2Ba2gydF4y2Ba+……+一个gydF4y2BangydF4y2BaFgydF4y2BangydF4y2Ba(6)gydF4y2Ba
在哪里gydF4y2BangydF4y2Ba就是特征的数量。系数gydF4y2Ba一个gydF4y2Ba0gydF4y2Ba,一个gydF4y2Ba1,gydF4y2Ba…gydF4y2BangydF4y2Ba通过最小化PHQ-9估计值与真实值之间的平方误差得到(见模型优化)。gydF4y2Ba
分类模型gydF4y2Ba
我们使用逻辑回归分类器来识别有抑郁症状(PHQ-9≥5)的参与者和无抑郁症状(PHQ-9 <5)的参与者。这个分类器由一个线性模型和一个逻辑sigmoid函数组成,gydF4y2Bag (x)gydF4y2Ba= 1∕(1+exp(−gydF4y2BaxgydF4y2Ba)),产生0至1之间的数值,表示参与者出现抑郁症状的可能性:gydF4y2Ba
P (gydF4y2Ba抑郁症状gydF4y2Ba) =gydF4y2BaggydF4y2Ba(gydF4y2BabgydF4y2Ba0gydF4y2Ba+gydF4y2BabgydF4y2Ba1gydF4y2BaFgydF4y2Ba1gydF4y2Ba+gydF4y2BabgydF4y2Ba2gydF4y2BaFgydF4y2Ba2gydF4y2Ba+…+gydF4y2BabgydF4y2BangydF4y2BaFgydF4y2BangydF4y2Ba) (7)gydF4y2Ba
当P (gydF4y2Ba抑郁症状gydF4y2Ba)高于0.5时,我们认为参与者有抑郁症状。否则,我们认为没有抑郁的迹象。gydF4y2Ba
我们使用了一个优化程序来调整参数gydF4y2BabgydF4y2Ba0gydF4y2Ba,gydF4y2BabgydF4y2Ba1gydF4y2Ba,…,gydF4y2BabgydF4y2BangydF4y2Ba(参见模型优化)。gydF4y2Ba
模型优化gydF4y2Ba
我们使用最小二乘方法来调整评分估计和分类模型的参数。只要特征的数量相对于样本的数量较低,这种方法就能很好地执行。否则,模型会过度拟合数据。为了减小过拟合问题,在特征数量较多的情况下,采用了弹性网正则化方法。gydF4y2Ba
弹性网正则化通过在成本函数中添加以下惩罚项来防止系数变得太大:gydF4y2Ba
H (K,λgydF4y2Ba1gydF4y2Ba,λgydF4y2Ba2gydF4y2Ba) =λgydF4y2Ba1gydF4y2BaK | | | |gydF4y2Ba1gydF4y2Ba+λgydF4y2Ba1gydF4y2BaK | | | |gydF4y2Ba2gydF4y2Ba(8)gydF4y2Ba
在哪里gydF4y2BaKgydF4y2Ba=gydF4y2BakgydF4y2Ba0gydF4y2Ba,gydF4y2BakgydF4y2Ba1gydF4y2Ba,…,gydF4y2BakgydF4y2BangydF4y2Ba向量是否包含回归或分类模型参数,‖gydF4y2BaKgydF4y2Ba为gydF4y2Ba1gydF4y2Ba=∑gydF4y2Ba我gydF4y2Ba|gydF4y2BakgydF4y2Ba我gydF4y2Ba|和‖gydF4y2BaKgydF4y2Ba为gydF4y2Ba2gydF4y2Ba=√∑gydF4y2Ba我gydF4y2BakgydF4y2Ba我gydF4y2Ba2gydF4y2Ba是其第一(L1)和第二(L2)规范(gydF4y2Ba我gydF4y2Ba= 1,2,…,gydF4y2BangydF4y2Ba).系数gydF4y2BaλgydF4y2Ba1gydF4y2Ba而且gydF4y2BaλgydF4y2Ba2gydF4y2Ba通过对训练数据的交叉验证进行优化。弹性网正则化已被证明优于其他正则化方法,特别是在一些特征强相关的情况下[gydF4y2Ba
].gydF4y2Ba模型评价gydF4y2Ba
为了评估回归和分类模型,我们创建了1000个bootstrap特征集及其对应的PHQ-9评分。然后,我们在每个集合上训练和交叉验证模型使用一个参与者出局的方法。gydF4y2Ba
为了评估每个分数估计模型的性能,我们计算了归一化均方根偏差(NRMSD),它度量了由模型估计的测试参与者的PHQ-9分数与他们的真实分数之间的百分比差异。我们使用PHQ-9评分的观察范围(0-17)来规范化nrmsd。为了评估每个分类模型的性能,我们评估了其识别抑郁症状参与者的准确性、敏感性和特异性,与基本事实相比。gydF4y2Ba
结果gydF4y2Ba
参与者特征和依从性gydF4y2Ba
所有40名参与者完成了为期2周的研究。然而,由于许多参与者的传感器数据不足,我们考虑了其中28个用于数据分析。其中,18个用于GPS定位,21个用于手机使用数据分析。这两项分析是独立进行的。gydF4y2Ba
被排除在外的12名参与者没有为我们的分析提供足够的GPS位置和/或手机使用数据,这意味着他们的数据在超过50%的时间内是不可用的。数据无法使用的原因包括早期版本的紫色机器人与数据服务器之间的连接问题、患者没有给手机充电、某些地点长时间无法连接任何网络。gydF4y2Ba
参与分析的28名参与者中有20名女性和8名男性。年龄19 ~ 58岁,平均28.9 (SD 10.1)。他们的PHQ-9得分范围为0-17,平均值为5.57 (SD值为4.9)。28例患者中14例(50%)无抑郁症状(PHQ-9 <5),平均PHQ-9评分1.5 (SD 1.34), 14例(50%)为轻度至重度(PHQ-9≥5),平均PHQ-9评分9.64 (SD=3.54)。由于数据不充分而未被纳入任何分析的参与者与这28名参与者在年龄、性别或PHQ-9评分上没有统计学差异。gydF4y2Ba
在被考虑进行位置数据分析的参与者中,9人有抑郁症状,9人没有。对于用于手机使用数据分析的数据,这两个数字分别是10和11。gydF4y2Ba
抑郁特征与程度的关系gydF4y2Ba
GPS定位和手机使用传感器特征计算如特征提取中所述。控件找到的位置集群的数量gydF4y2BaKgydF4y2Ba-means算法的取值范围为1-9,平均值为4.06。参与者的平均每日电话使用时长约为41分钟(SD为57分钟),平均每日使用频率为14.2次(SD为8.69)。gydF4y2Ba
特征与PHQ-9评分的相关分析显示,10个特征中有6个特征与PHQ-9评分显著相关(gydF4y2Ba
).具体而言,昼夜节律运动、归一化熵和位置方差与-的Pearson相关系数具有很强的相关性。63年-。58,-.58, respectively. Both phone usage features, usage duration and usage frequency, were also significantly correlated withrgydF4y2Ba= -。54而且0.52, respectively.的gydF4y2BatgydF4y2Ba有抑郁症状的参与者和没有抑郁症状的参与者之间的测试gydF4y2Ba
)还揭示了相同的6个特征(昼夜节律运动、归一化熵、位置方差、住家时间、手机使用时长和手机使用频率)的值在无抑郁迹象(PHQ-9 <5)的参与者和其他(PHQ-9≥5)的参与者之间有显著差异。gydF4y2Ba对这些特征的相关性分析显示,其中一些特征是高度相关的(gydF4y2Ba
).值得注意的是,归一化熵、位置方差和住家时间之间存在显著相关性。这并不奇怪,因为所有这些变量都以不同的方式衡量空间的移动量。然而,昼夜节律运动和位置差异之间的显著相关性是有趣的,它表明活动能力更强的参与者也有更规律的运动模式。手机使用时间与使用频率的相关性也很高(gydF4y2BargydF4y2Ba= .89)。gydF4y2Ba从位置特征估计抑郁状态gydF4y2Ba
早期的统计分析结果表明,我们也许可以通过我们的一些特征来估计一个看不见的对象的抑郁状态。为了检验这一假设,我们使用模型评估中描述的过程训练并交叉验证了分数预测和分类模型(公式6-7)。gydF4y2Ba
我们首先在每个单独的特征上训练模型,然后将所有的特征结合在一起。结果(gydF4y2Ba
)的研究表明,以与PHQ-9分数相关性较强的特征为训练对象的模型,能够更好地区分有抑郁症状的参与者和没有抑郁症状的参与者。列2-4显示了每个分类模型(等式7)在将参与者分为有抑郁症状和无抑郁症状两组时交叉验证的准确性、敏感性和特异性。列5显示PHQ-9评分估计模型的交叉验证nrmsd(公式6)。具体来说,归一化熵、位置方差、住家时间和昼夜运动四个特征的nrmsd最低,精度最高。然而,这些性能并没有通过合并这些特性而得到改善。随着输入变量数量的增加,这可能是一些不可避免的过拟合的结果,这导致了较差的泛化。gydF4y2Ba分类(PHQ9<5 vs PHQ9≥5)gydF4y2Ba | PHQ-9评分估计gydF4y2Ba | |||
培训功能gydF4y2Ba | %平均精度(SD)gydF4y2Ba | 平均灵敏度%gydF4y2Ba | 平均特异性%gydF4y2Ba | 平均NRMSD (SD)gydF4y2Ba |
熵gydF4y2Ba | 69.7 (3.5)gydF4y2Ba | 66.8gydF4y2Ba | 72.7gydF4y2Ba | 0.262 (0.017)gydF4y2Ba |
归一化熵gydF4y2Ba | 86.5 (3.4)gydF4y2Ba | 88.4gydF4y2Ba | 84.9gydF4y2Ba | 0.235 (0.016)gydF4y2Ba |
位置偏差gydF4y2Ba | 75.7 (4.6)gydF4y2Ba | 80.2gydF4y2Ba | 71.5gydF4y2Ba | 0.229 (0.014)gydF4y2Ba |
寄宿家庭gydF4y2Ba | 75.9 (4.9)gydF4y2Ba | 80.5gydF4y2Ba | 71.7gydF4y2Ba | 0.253 (0.015)gydF4y2Ba |
过渡时间gydF4y2Ba | 41.1 (9.2)gydF4y2Ba | 43.4gydF4y2Ba | 38.7gydF4y2Ba | 0.303 (0.020)gydF4y2Ba |
总距离gydF4y2Ba | 56.4 (6.6)gydF4y2Ba | 69.6gydF4y2Ba | 43.4gydF4y2Ba | 0.343 (0.041)gydF4y2Ba |
生理运动gydF4y2Ba | 78.6 (4.1)gydF4y2Ba | 80.1gydF4y2Ba | 77.5gydF4y2Ba | 0.222 (0.014)gydF4y2Ba |
集群数量gydF4y2Ba | 41.5 (8.9)gydF4y2Ba | 47.4gydF4y2Ba | 35.5gydF4y2Ba | 0.305 (0.022)gydF4y2Ba |
所有gydF4y2Ba | 78.8 (6.2)gydF4y2Ba | 83.6gydF4y2Ba | 74.5gydF4y2Ba | 0.251 (0.023)gydF4y2Ba |
从手机使用特征估计抑郁状态gydF4y2Ba
我们对手机使用功能进行了同样的分析。由于这些特征的数量(n=2)远远小于样本的数量(n=21),因此评分预测和分类模型都可以直接应用到组合特征空间中,而无需使用弹性网正则化。研究结果(gydF4y2Ba
)显示,每个使用频率和使用持续时间特征都可以提供可接受的准确性和nrmsd,而无需通过聚合它们进一步改进。列2-4显示了每个分类模型(等式7)在将参与者分为有抑郁症状和无抑郁症状两组时交叉验证的准确性、敏感性和特异性。列5为PHQ-9评分估计模型的交叉验证nrmsd(方程6)。gydF4y2Ba分类(PHQ9<5 vs PHQ9≥5)gydF4y2Ba | PHQ9评分估计gydF4y2Ba | |||
培训功能gydF4y2Ba | %平均精度(SD)gydF4y2Ba | 平均灵敏度%gydF4y2Ba | 平均特异性%gydF4y2Ba | 平均NRMSD (SD)gydF4y2Ba |
使用时间gydF4y2Ba | 74.2 (3.4)gydF4y2Ba | 64.0gydF4y2Ba | 83.9gydF4y2Ba | 0.268 (0.018)gydF4y2Ba |
使用频率gydF4y2Ba | 68.6 (4.1)gydF4y2Ba | 56.4gydF4y2Ba | 79.6gydF4y2Ba | 0.249 (0.013)gydF4y2Ba |
所有gydF4y2Ba | 65.7 (4.9)gydF4y2Ba | 55.7gydF4y2Ba | 74.9gydF4y2Ba | 0.273 (0.019)gydF4y2Ba |
讨论gydF4y2Ba
主要研究结果gydF4y2Ba
这项研究报告了使用普遍可用的手机传感器数据的潜力,包括GPS和手机使用情况,以确定抑郁症状的严重程度。我们从这些数据中提取了一些语义上有意义的特征,并发现其中一些特征与PHQ-9得分之间有很强的相关性。这些特征包括归一化熵、位置差异、住家时间、昼夜节律运动以及手机使用时长和频率。通过训练这六个特征的评分估计模型,我们可以以相对较低的误差(NRMSD)估计未见参与者的PHQ-9分数。此外,在这些特征上训练的分类器能够区分那些有和没有症状的人,具有高度的准确性、良好的敏感性和特异性。gydF4y2Ba
归一化熵特征测量了一个人访问不同地点的频率以及该频率在不同地点的分布。在这一特征与PHQ-9分数之间发现的高度负相关表明,抑郁症状严重程度较高的人去的地方较少,更有可能喜欢某些地方而不是其他地方。这在一定程度上可能是因为有抑郁症状的人在家里呆的时间增加了,这是由住家特征来衡量的。另一方面,位置差异特征的发现表明,有抑郁症状的人倾向于在地理空间中移动较少。这些发现与抑郁症的动机丧失、活动减少和社交退缩模式一致[gydF4y2Ba
,gydF4y2Ba ].gydF4y2Ba在空间中运动的昼夜节律的发现与研究与抑郁相关的醒睡模式变化的成熟文献相吻合。gydF4y2Ba
,gydF4y2Ba ].这些数据表明,清醒时行为模式的破坏不仅包括活动的数量,还可能延伸到行为模式。这些模式的改变可能是由于遗传和激素因素[gydF4y2Ba 这些症状与抑郁症相关的昼夜节律变化有关,也可能是动机低和组织能力下降的结果。gydF4y2Ba手机使用数据也与抑郁症状严重程度密切相关。抑郁症状严重程度越高,使用手机的时间和频率越长。这一观察结果得到了此前一些研究的支持,这些研究发现手机使用与一些抑郁症状之间存在相关性[gydF4y2Ba
,gydF4y2Ba ].然而,我们应该注意到,在这种情况下,手机的使用被定义为与手机的任何交互,我们无法隔离具体的交互类型(如使用应用程序,发短信)。因此,很难确定哪些具体行为与症状严重程度相关。gydF4y2Ba限制gydF4y2Ba
虽然我们相信我们的研究已经揭示了一些可以被手机捕捉到的抑郁的日常生活相关因素,但这些结果只是非常初步的,必须提到一些注意事项。首先,这项研究只检查了自我报告的抑郁症状与地理位置和手机使用数据得出的特征之间的联系。因此,我们不能在这里推断出任何因果关系。事实上,虽然PHQ-9是一种经过充分验证的抑郁症测量方法,但我们不能排除除抑郁症状之外的其他因素导致这些关系的可能性。例如,结果可能是由于其他无法测量的因素,如慢性疾病或性格因素,这些因素会导致抑郁症状和行为模式的差异。gydF4y2Ba
第二,虽然一些参与者表现出的抑郁症状水平与临床抑郁症水平一致,但这只是一个小样本,并不一定代表抑郁症患者的典型趋势。未来的研究可能会招募更多具有代表性的抑郁症参与者,并根据地理位置(如职业地位、社交网络规模或慢性健康问题)可能影响一个人的运动模式的特征对他们进行匹配。gydF4y2Ba
最后,我们没有试图纠正多重比较可能产生的影响。然而,考虑到我们对探索抑郁症状的潜在指标的兴趣,这种纠正引入的II型错误的可能性增加可能会破坏重要的特征。这种修正的一个主要目标是增加人们对发现的信心,鉴于我们的结果的初步性质,我们敦促未来的努力在更大规模的调查中交叉验证这些关系。尽管如此,我们相信,本研究中发现的行为有意义特征(如归一化熵、昼夜运动)的计算以及这些特征与抑郁症的关系,可能为后续使用传感器数据监测和检测抑郁症的研究提供一个有价值的起点。gydF4y2Ba
结论gydF4y2Ba
尽管有这些限制,被动检测与抑郁症相关的行为因素的能力,如活动水平及其模式,开启了新一代行为干预技术的可能性,可以被动检测并积极加强可能改善抑郁症的行为(例如,参与提供快乐、成就感或涉及社会参与的活动),并在检测到风险状态时提供支持(例如,戒断,呆在家里)。这可以提高抑郁症的识别能力,提高卫生保健机构为有需要的人分配资源的能力,并克服传统心理治疗的个人和系统障碍[gydF4y2Ba
].gydF4y2Ba使用手机传感器可以捕获可能表明抑郁症状的信息,而无需使用问卷调查或要求患者使用特殊设备。手机融入了人们的生活。人们倾向于把手机全部或大部分时间都带在身边,手机可以不引人注目地提供数据,用户不需要付出任何努力。这种能力为识别与抑郁症或其他健康和精神疾病相关的人类行为模式提供了新的机会。此外,行为特征可能对一个人日常生活的变化更敏感,这些变化表明治疗的早期受益或突出潜在的改善领域。因此,随着这些特征及其与抑郁症之间的联系得到更好的理解,它们可能在理解抑郁症的发展及其对治疗的反应方面发挥重要作用。gydF4y2Ba
致谢gydF4y2Ba
这项研究由美国国家精神卫生研究所的P20 MH090318研究基金资助。SMS作者获得了国家精神卫生研究所K08 MH 102336的赠款支持。gydF4y2Ba
利益冲突gydF4y2Ba
没有宣布。gydF4y2Ba
参考文献gydF4y2Ba
- Kessler RC, Berglund P, Demler O, Jin R, Koretz D, Merikangas KR,国家共病调查复制。重性抑郁症的流行病学:来自全国共病调查复制(NCS-R)的结果。杂志2003年6月18日;289(23):3095-3105。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Kessler RC, McGonagle KA, Zhao S, Nelson CB, Hughes M, Eshleman S,等。美国DSM-III-R精神障碍的终生和12个月患病率全国共病调查结果。Arch Gen Psychiatry 1994 Jan;51(1):8-19。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Kessler RC, Berglund P, Demler O, Jin R, Merikangas KR, Walters EE。在全国共病调查复制中,DSM-IV疾病的终生患病率和发病年龄分布。Arch Gen Psychiatry 2005 Jun;62(6):593-602。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Karsten J, Hartman CA, Smit JH, Zitman FG, Beekman AT, Cuijpers P,等。精神病史和阈下症状是2年内抑郁或焦虑障碍发生的预测因素。Br J Psychiatry 2011年3月198(3):206-212 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Lewinsohn PM, Solomon A, Seeley JR, Zeiss A.“阈下”抑郁症状的临床意义。心理变态杂志2000 5月;109(2):345-351。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 王晓燕,王晓燕,王晓燕,等。克服障碍,减轻情感障碍的负担。生物学精神病学2002年9月15日;52(6):655-675。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 王鹏飞,西蒙·G,凯斯勒RC。抑郁症的经济负担和治疗的成本效益。国际J方法精神病学杂志2003;12(1):22-33。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Martin JK, Blum TC, Beach SR, Roman PM。亚临床抑郁症与工作表现。社会精神病学精神病学流行病学1996年1月31日(1):3-9。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Ferrari AJ, Charlson FJ, Norman RE, Patten SB, Freedman G, Murray CJL,等。按国家、性别、年龄和年份划分的抑郁症负担:来自2010年全球疾病负担研究的发现。PLoS Med 2013年11月10日(11):e1001547 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 世界卫生组织(日内瓦)。精神卫生:世界卫生部长的行动呼吁,2001年。URL:gydF4y2Bahttp://www.who.int/mental_health/media/en/249.pdfgydF4y2Ba[访问2015-07-09][gydF4y2BaWebCite缓存gydF4y2Ba]gydF4y2Ba
- Kessler RC, Chiu WT, Demler O, Merikangas KR, Walters EE。在全国共病调查复制中,12个月DSM-IV疾病的患病率、严重程度和共病情况。Arch Gen Psychiatry 2005 Jun;62(6):617-627 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 王淑萍,柏隆德P, Olfson M,平卡斯HA,威尔斯KB,凯斯勒RC。在全国共病调查复制中,首次出现精神障碍后初次治疗接触的失败和延迟。Arch Gen Psychiatry 2005 Jun;62(6):603-613。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 初级保健中抑郁症的识别、管理和预后。Arch Fam Med 1995 Feb;4(2):99-105。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- van Weel C, van Weel- baumgarten E, van Rijswijk E。初级保健中的抑郁症治疗。BMJ 2009; 338: b934。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Schulberg HC, Saul M, McClelland M, Ganguli M, Christy W, Frank R.在初级医疗和精神病学实践中评估抑郁症。Arch Gen Psychiatry 1985年12月42(12):1164-1170。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 韦尔斯KB,海斯RD,伯纳姆MA,罗杰斯W,格林菲尔德S,韦尔JE。对接受预付费或付费服务的患者的抑郁障碍检测。医疗结果研究的结果。JAMA 1989 12月15日;262(23):3298-3302。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Prigerson HG, Monk TH, Reynolds CF, Begley A, Houck PR, Bierhals AJ,等。生活方式的规律性和活动水平是老年丧亲相关抑郁的保护因素。1995年萧条;3(6):297 - 302。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Vallée J,卡多·E,罗斯蒂特·C, Parizot I, Chauvin P.日常流动性在心理健康不平等中的作用:活动空间和居住社区对抑郁的交互影响。社会科学与医学2011 10月;73(8):1133-1144。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Burns MN, Begale M, Duffecy J, Gergle D, Karr CJ, Giangrande E,等。利用情境感知来开发抑郁症的移动干预。J medical Internet Res 2011;13(3):e55 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 王晓燕,王晓燕,王晓燕。抑郁症患者行为改变的检测方法。: AAAI;2014年出席:AAAI现代人工智能健康分析研讨会;2014;Québec市,Québec,加拿大。gydF4y2Ba
- Rabbi M, Ali S, Choudhury T, Berke E.使用移动传感器对精神和身体健康进行被动和原位评估。: ACM;2011年出席:普适计算国际会议(UbiComp);2011;中国北京,第385-394页。gydF4y2Ba
- 王锐,陈峰,陈志,李婷,Harari G, Tignor S. StudentLife:大学生使用智能手机的心理健康、学习成绩和行为趋势评估。: ACM;2014年出席:普适与普适计算国际联合会议(UbiComp);2014;西雅图,华盛顿,美国第3-14页。gydF4y2Ba
- Thomée S, Härenstam A,哈格伯格M.年轻人使用手机与压力、睡眠障碍和抑郁症状——一项前瞻性队列研究。BMC公共卫生2011;11:66。gydF4y2Ba
- 李玉奎,张涛,林燕,程志华。使用智能手机的阴暗面:心理特征、强迫行为和技术压力。计算机在人类行为中的应用2014 Feb;31:373-383。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- CBITs科技网站,PurpleRobot。URL:gydF4y2Bahttp://tech.cbits.northwestern.edu/purple-robot/gydF4y2Ba[访问2015-01-20][gydF4y2BaWebCite缓存gydF4y2Ba]gydF4y2Ba
- 舒勒SM,贝加尔M,佩内多FJ,莫尔DC。紫色:开发和部署行为干预技术的模块化系统。J Med Internet Res 2014;16(7):e181 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 克伦克K,斯皮策RL,威廉姆斯JB。PHQ-9:一个简短的抑郁严重程度测量的有效性。实习医学2001年9月16日(9):606-613 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 美国精神病学协会。《精神疾病诊断与统计手册》(DSM-5)。华盛顿:美国精神病学协会;2013.gydF4y2Ba
- 高级加密标准(AES)。网络安全2009 12月;2009(12):8-12。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Arthur D, Vassilvitskii S. k . means++:小心播种的好处。2007年发表于:ACM-SIAM年度离散算法研讨会;2007;美国宾夕法尼亚州费城1027-1035页。gydF4y2Ba
- 王晓燕,王晓燕,王晓燕。信息-理论熵对序列变异性的影响。蛋白质1991;11(4):297 - 313。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 按WH。数字食谱第三版:科学计算的艺术。美国纽约:剑桥大学出版社;2007.gydF4y2Ba
- 邹海峰,王晓燕。基于弹性网的正则化和变量选择。皇家统计学报2005年4月;67(2):301-320。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- 昼夜节律与抑郁症:人类精神病理和动物模型。神经药理2012年1月62(1):101-114。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 拉oux N, Benoit O, Dantchev N, Denise P, Franc B, Allilaire JF,等。接受抗抑郁治疗的重度抑郁症患者运动活动的昼夜模式:活动测量与临床病程的关系。精神病学文献1994年4月52(1):85-98。[gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 情绪障碍中的生物节律紊乱。精神药理学临床2006年2月21日增刊1:S11-S15。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Mohr DC, Ho J, Duffecy J, Baron KG, Lehman KA, Jin L,等。心理治疗的感知障碍及其与抑郁症的关系。中华临床精神病学杂志2010年04月;66(4):394-409 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
gydF4y2Ba
缩写gydF4y2Ba
全球定位系统(GPS):gydF4y2Ba全球定位系统gydF4y2Ba |
NRMSD:gydF4y2Ba归一化均方根偏差gydF4y2Ba |
phq - 9:gydF4y2Ba患者健康问卷-9gydF4y2Ba |
G·埃森巴赫编辑;提交21.01.15;同行评议J Ruwaard, J Bardram;对作者26.03.15的评论;修订版收到12.05.15;接受21.06.15;发表15.07.15gydF4y2Ba
版权gydF4y2Ba©Sohrab Saeb, Mi Zhang, Christopher J Karr, Stephen M Schueller, maria E Corden, Konrad P Kording, David C Mohr。最初发表于《医学互联网研究杂志》(//www.mybigtv.com), 2015年7月15日。gydF4y2Ba
这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/2.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。gydF4y2Ba