发表在19卷第九名(2017): 9月

互联网搜索及其与老年人认知功能的关系:横断面分析

互联网搜索及其与老年人认知功能的关系:横断面分析

互联网搜索及其与老年人认知功能的关系:横断面分析

原始论文

1美国俄勒冈州波特兰市俄勒冈健康与科学大学神经内科

2佛罗里达人类与机器认知研究所,彭萨科拉,佛罗里达,美国

通讯作者:

Johanna Austin博士

神经内科

俄勒冈健康与科学大学

邦德大道西南3303号

波特兰,俄勒冈州,97239

美国

电话:1 503 418 9328

传真:1 503 418 9311

电子邮件:peterjo@ohsu.edu


背景:阿尔茨海默病(AD)对所有患者来说都是一种非常具有挑战性的经历。不幸的是,在临床治疗可能最有效的早期阶段检测阿尔茨海默病具有挑战性,因为临床评估既耗时又昂贵。最近的研究已经证明了认知功能和日常行为之间的密切关系,这一研究途径为早期发现认知衰退提供了很大的希望。随着认知能力下降而改变的一个行为领域是语言使用。使用传统的面对面认知测试,多个小组已经证明了认知功能与词汇量、语言流利性和语义能力之间的密切关系。从生态学角度来看,这种方法的另一种选择可能是利用自动计算机监控软件,在使用计算机时持续捕捉和分析语言使用。

摘要目的:这项研究的目的是了解互联网搜索作为语言和老年人认知功能之间的关系。我们假设,认知功能较差的个体在搜索时使用较少的独特术语,使用较短的单词,并在搜索中使用较少的晦涩单词。

方法:计算机监控软件(WorkTime, Nestersoft Inc)被用于持续跟踪人们在谷歌、雅虎、必应和Ask.com上进行搜索时输入的术语。对于所有搜索,标点符号、重音和非ascii字符都被删除,并且在进行任何分析之前对结果搜索词进行拼写检查。认知功能评估为z归一化总结评分,捕捉五个独特的认知领域。通过控制年龄、性别和教育程度等变量,使用线性回归来确定认知功能和互联网搜索之间的关系。

结果:在6个月的监测期内,42名参与者(平均年龄81岁[SD 10.5], 83%[35/42]女性)使用这些顶级搜索引擎进行了2915次搜索。参与者平均每次搜索3.08个单词(SD 1.6),每个单词5.77个字母(SD 2.2)。认知功能越强的人每次搜索使用的词汇越独特(beta=.39,P=.002),并且在搜索中使用较少常见的术语(beta=1.39,P= .02点)。认知功能与搜索词的长度没有显著相关性。

结论:这些结果表明,认知功能的早期衰退可以从人们使用互联网时搜索的词汇中察觉出来。通过持续跟踪互联网搜索词的基本方面,有可能比目前更早地发现认知能力下降,从而实现积极的治疗和干预。

中国医学杂志,2017;19(9):e307

doi: 10.2196 / jmir.7671

关键字



65岁以上的成年人中有九分之一被诊断患有阿尔茨海默病(AD),这是美国第六大死亡原因[1].由于这种疾病对公共卫生的重要性,人们进行了许多临床试验,以寻找有效的治疗方法。然而,从2002年到2012年,推向市场的AD药物的临床试验成功率为244个测试化合物中的1个[2],因此有人将这则广告称为“失去的十年”[3.].这在一定程度上可能是由于早期诊断AD的挑战。阿尔茨海默病的特点是发病时不明显,认知功能逐渐、微妙地下降。当通过临床评估检测到认知和功能症状时,疾病进展可能已经太过严重,无法进行最有效的治疗。因此,目前AD研究的主要重点是早期发现和预防疾病[4].

阿尔茨海默症可能是大脑神经病理病变逐渐累积的结果,最终影响认知和行为的多个方面[5].可能受这一过程影响的能力在临床评估中通常评估的许多领域都很明显,如语言处理、运动功能和执行功能。然而,在临床就诊期间的评估可能不允许检测与认知功能变化相关的现实世界行为的微妙变化。此外,情景评估只提供了认知功能的一个快照,使得发现关键变化变得困难。考虑到需要许多数据点来检测统计上显著的变化,这种情景评估范式需要多年的数据。相比之下,Dodge等人最近的工作表明,通过收集更频繁(例如,每天)的关键感兴趣变量的测量,有可能在更短的时间内(例如,几个月而不是几年)检测变量的趋势和变化,从而能够更敏感地检测衰退的早期阶段[6].由于日常功能的细微变化需要数年的时间来演变和表现出痴呆症,通过持续的家庭日常行为和活动监测来检测这些变化的能力为早期发现AD提供了很大的希望[7-10].

一个关键的行为,可以使日常功能的真实识别是计算机的使用。使用电脑需要运动功能来操作键盘和移动鼠标;语言处理:理解、选择、检索和生成适当的词语;执行功能以有意义和有效的方式计划、抑制、集中和转移注意力。因此,个人与电脑互动的方式代表了一种丰富而相对尚未开发的评估日常认知的手段,尤其是在认知能力有下降风险的老年人中。值得注意的是,尽管老年人对电脑的使用落后于年轻一代[11],随着婴儿潮一代逐渐变老,精通电脑的老年人数量可能会急剧增加。[12].因此,了解定期使用电脑和认知功能之间的关系将变得非常有价值,特别是80%的使用互联网的老年人每周至少上网3次[12].这种计算机监测方法已经开始在老年人中成功实施,通过评估一些用于索引认知变化的计算机使用指标。这些指标包括一般的时间使用指标[13]以及更具体的操作方面,例如,一个人如何完成在线任务或操作键盘[1415]或mouse [7].

在这方面,一个特别有潜力的领域是通过人们在互联网上搜索的术语来推断认知功能的各个方面,更具体地说,是语言功能。以前关于语言分析的研究(通常不使用基于计算机的监测)表明,在神经认知障碍(如AD)中,语言能力下降的某些关键方面[16].这些语言变化可能是由于大脑中负责产生和编码语言的区域被破坏了。17-20.].重要的是,在临床诊断为明显的痴呆之前,已经观察到语言功能的变化[21].语言能力下降的方面包括语义流畅性、图片命名和语音流畅性[22].最近,研究人员已经开始使用自动语音检测或识别(ASR)系统,不仅分析单词的使用,还分析停顿和语速。23]并证明了语言的这些关键方面对认知能力下降很敏感,而其他临床测试可能会发现这种疾病[2425].

所有这些最近的研究都依赖于使用正式测试范式的引出性演讲或语言。这项研究通过使用持续的计算机监测软件从人们在互联网上搜索的术语中收集语言样本,弥合了之前通过计算机使用推断认知功能的工作和关于认知能力下降对语言影响的工作之间的差距。搜索词语言与口语的不同之处在于,它通常以目标为导向,可能只使用关键词而不是完整的句子,也可能使用口语中没有使用的术语,如“df”而不是“definition”。尽管大量文献关注的是老年人如何在互联网上搜索健康信息,[26-28],相对较少的研究调查了搜索词语言的一般方面,或它们与认知功能的关系。

这篇论文的重点是确定早期的语言变化是否可以从人们在日常使用中搜索互联网的方式中检测到。特别是,我们假设认知功能受损更严重的个体将(1)每次搜索使用更少的独特搜索词,(2)在搜索中使用较短的词,以及(3)使用较少模糊的搜索词,其中模糊度被定义为在所有主题中搜索给定术语的频率的倒数。


参与者

本研究的参与者从两个正在进行的项目中招募:生命实验室队列(俄勒冈健康与科学大学(OHSU) irb# 2765)和环境独立性测量(AIMs)队列(OHSU irb# 9944)。这些研究的重点是利用家庭嵌入式传感和计算(“智能家居”)技术了解老年人日常行为与健康之间的关系[9].这两项研究的资格标准包括独自居住或独立居住在比工作室大的房子或公寓里,在迷你精神状态检查中最低得分25分,在临床痴呆评定量表中最高得分0.5分(未痴呆)。参与者还被要求独立生活,不需要家庭护理或日常活动的帮助。参与生命实验室研究的最低年龄是62岁,而AIMS队列的最低年龄是70岁。生命实验室研究的注册始于2007年,并在滚动的基础上继续。AIMs研究的注册始于2014年,并于2016年4月结束。

2015年,这两个项目中所有使用过电脑的活跃参与者都被要求参与这项额外的电脑使用监测研究。同意让他们的电脑使用监控的参与者在他们的个人电脑上接收软件(WorkTime, Nestersoft Inc),该软件记录在电脑上执行的所有活动,包括在谷歌、Yahoo、Bing和Ask.com等搜索引擎中搜索的关键词。所有受试者在参与任何研究活动前都签署了知情同意书,该研究得到了OHSU机构审查委员会(irb# 2765)的批准。共有76人同意参加。其中,54名参与者在电脑上安装软件时使用谷歌、必应、雅虎或Ask.com进行搜索。然而,这些参与者中有12人在完成神经心理学评估之前或之后的3个月内没有搜索,因此他们的网络搜索数据无法使用。因此,总共有42名参与者被纳入最终分析。参加者的人口统计特征载于表1.完成搜索的参与者比从未完成搜索的参与者更年轻,但他们在其他人口统计学特征上没有统计学上的显著差异。在完成搜索的人中,平均年龄为81.1岁(SD 10.5), 83%为女性(35/42),49%完成了大学学业(25/42)。平均认知z得分(详细定义在认知功能下图)为0.16 (SD为0.56),其中一名参与者的CDR评分至少为0.5,提示轻度认知障碍。

数据与措施

对于每位参与者,在基线时收集人口统计数据(包括年龄、性别和教育程度),每年进行临床评估,并(从2015年开始)使用WorkTime从参与者的个人电脑中持续收集数据。下面是对每种类型数据的更详细的描述。

互联网搜索

安装在参与者电脑上的WorkTime软件记录了他们访问过的网站、使用过的应用程序以及在进行互联网搜索时输入的搜索词。WorkTime从Target.com和Facebook.com等任何网站上的任何搜索浏览器收集数据。但是,在主要搜索引擎以外的网站上进行的搜索与在主要搜索引擎上进行的搜索并不代表相同的搜索查询类型。因此,我们将最终数据集限制为仅包含在主要搜索引擎中输入的搜索。谷歌搜索显示,排名靠前的搜索引擎是谷歌、必应和雅虎。因此,我们在数据集中包含了这三个搜索引擎。然后,我们对每个参与者进行了审查,以确定他们是否经常在其他主要搜索引擎上进行搜索,并发现一些参与者也使用Ask.com进行搜索。因此,我们也将这个搜索引擎产生的搜索包含在我们最终的数据集中。

最终数据集代表平均370天的连续计算机使用数据(最小:7天;最长:796天)来自76名参与者。从安装计算机软件到提取数据进行分析,54名受试者在必应、谷歌、雅虎和Ask.com上完成了8565次搜索,而22名在个人电脑上安装了WorkTime的参与者在监测期间从未在这些顶级搜索引擎中完成过一次搜索,尽管其中一些参与者在监测期间之外进行了搜索。由于我们将分析限制在面对面认知评估前后3个月的互联网搜索数据,因此只有42名在这段时间内进行了互联网搜索的参与者被纳入最终分析。

在分析之前,所有搜索词都使用3步流程进行清理。首先,从搜索词字符串中删除所有不可读的字符。这些字符包括无法使用标准英语文本分析技术读取或解释的符号和非ascii字符。在适用的情况下,重音字符或非ASCII字符被转换为字符的等价ASCII(例如,“ras”被转换为“u”)。

表1。基线时参与者的人口学特征。
特征 完成标准搜索的参与者(n=42) 从未完成搜索的参与者(n=32) P价值
年龄(年),平均值(SD) 81.1 (10.5) 88.9 (6.1) <措施
性别,女性,n (%) 35 (83) 22日(68.8) .14
教育年限,平均值(SD) 15.5 (2.0) 15.3 (2.5) .62
累积疾病评定量表(CIRS)得分,平均值(SD) 20.3 (2.6) 20.8 (2.6) .37点
简易精神状态测验(MMSE)得分,平均值(SD) 29 (1.3) 28.6 (1.7) .46
临床痴呆评分(CDR)≥0.5,n (%) 1 (3) 4 (10.3) . 21
认知z分数,平均值(SD) 0.16 (0.56) 0.08 (0.76) .60

一旦这些字符被删除,标点符号也被删除,所有的字母都被改为小写字母,整个搜索被划分为单独的、无字母组合的搜索词。例如,搜索“波特兰哪里有烹饪课?”,我们首先去掉了结尾的问号,并将“Where”和“Portland”中的大写字母改为小写字母。然后,我们将整个搜索分为各个术语:“where”、“are”、“cooking”、“classes”、“in”和“portland”。在将每个搜索结果划分为独立的术语后,我们对每个术语运行基本的拼写检查程序。拼写检查是必要的,因为我们有兴趣了解认知功能与变量之间的关系,比如搜索的唯一术语的数量——对于任何经常拼写错误的参与者来说,这个变量会变得过度膨胀。这一点尤其重要,因为随着认知功能的恶化,拼写能力可能会下降,这可能掩盖了与搜索词本身生成的真实关系,而不管它们的拼写是否正确。为了确定一个单词是否拼写错误,我们首先测试这个单词是否出现在一个大型语料库中。如果这个单词没有出现在那里,我们就认为这个单词拼写错误,并努力寻找正确的拼写。这是通过算法实现的,首先从单词中删除单个字母,然后测试新单词是否出现在大型语料库中。 If that did not find a suitable match, we swapped letters that were next to each other in order and tested each newly generated word to see whether it was in the large corpus of words. If we still did not find a match, we added individual letters to the word and tested each new generated word against the corpus of words. If none of these methods found a match, we left the word as is.

准备搜索词的最后一步是将每个词词干到词根。对于上面的搜索示例,这将需要从类中删除“es”(即,“classes”变成“class”),并从“cooking”中删除“ing”。为了解决这些问题,我们使用了作为Python自然语言工具包的一部分免费提供的WordNet lemmatizer。与其他词干提取工具不同,这个词干提取器首先检查WordNet的扩展字典,以确保词干提取的词是一个实际的词,然后再提取后缀。

我们使用清理过的搜索词计算了三个指标。首先,我们计算了每次搜索的唯一词汇的平均数量,这被定义为参与者搜索的总字数除以他们执行的总搜索次数。其次,我们计算了搜索单词的平均长度,即所有单词中的字母总数除以搜索单词的总数。这两个指标是根据每个主题计算的(例如,仅使用来自一个主题的数据来计算该主题的唯一术语的平均数量或平均单词长度)。最后,我们计算了搜索词的平均模糊度。为了计算平均术语模糊度,我们首先计算了所有科目中每个搜索词的频率。使用这个频率,我们然后计算每个项的模糊度作为频率的倒数。最后,我们计算每个参与者的平均术语模糊度,作为参与者搜索的所有单词的平均模糊度得分。

认知功能

在基线时收集所有参与者的标准化、详细的临床数据,然后每年收集参与者的适当特征[10].这些临床数据涵盖四个重要领域:健康状况、身体功能、认知和情绪。整体认知状态评估使用综合评分,包括从五个认知领域中每个领域的两到三个代表性神经心理学测试中列出的z评分。评估的认知领域包括工作记忆:字母-数字排序(WMS-III) [29后向长度(WAIS-R) [30.];关注/处理速度:数字跨距向前长度(WAIS-R)、数字符号(WAIS-R)及划线测试A部[31];内存: WMS-R逻辑记忆II故事A、WMS-R视觉再现II和CERAD单词列表回忆[32];执行功能:字母流畅性、划线测试乙部[31], Stroop色词冲突[33];而且视觉感知/建设: WAIS-R组块设计、WAIS-R图像完成和WMS-R视觉再现I.个体测试z-分数是使用所有认知完好的参与者在研究进入ORCATECH队列时原始测试分数的组均值和标准差计算的。所有个体参与者的分数被z标准化、求和和平均,以获得一个综合分数。后一个分数代表整体认知功能,下文称为认知z得分。

协变量

我们在所有模型中都包含了一些可能混淆基于互联网的搜索词和认知功能之间关系的变量。这些变量包括年龄、性别和受教育年限,因为这些变量可能与认知能力下降有关。

数据分析

我们首先计算所有变量的描述性统计量。这些数据包括对个人进行的平均搜索次数、每次搜索的平均字数、每个搜索词的平均字母数以及搜索词的平均晦涩程度。

接下来,我们进行了3次线性回归,每一次都以认知z得分作为结果变量。第一个线性回归模型建立了认知功能和每次搜索输入的唯一搜索词数量之间的关系。第二个回归模型模拟了搜索单词的平均长度和认知功能之间的关系。第三个回归模型模拟了认知功能和平均术语模糊度之间的关系。为了确保系数估计值不受多重共线性的影响,为所有自变量计算了方差膨胀因子(VIF),这是评估自变量共线性水平的标准诊断工具。所有变量的VIF均低于2.5,表明多重共线性的任何偏差都可以合理地忽略[34].所有控制年龄、性别和受教育年限的回归都在Stata 13 (Stata Corp)中使用“reg”函数进行。


描述性统计

在6个月的监测期内,参与者进行了22次(四分位数范围,IQR 7.3)的中位数搜索(表2).最常见的搜索词是“波特兰”(318次搜索)、“俄勒冈州”(175次搜索)、“如何”(40次搜索)和“电子邮件”(36次搜索)。每次搜索的平均单词数为3.08 (SD为1.6),最长的搜索包含22个单词。在所有搜索的单词中,参与者平均每个单词5.77个字母(SD 2.2)。参与者的平均术语模糊度为0.25 (SD为0.1)。

中显示了搜索词数据集的丰富性图1其中搜索在社交网络图中表示。该图是在Gephi 0.8.2中创建的,这是一个开源软件,旨在可视化社交网络图。在该图中,参与者搜索的每个唯一术语都由一个单独的节点表示,如果节点出现在同一搜索中,则将它们连接在一起(粗边表示它们出现在一起的频率更高)。节点的大小由它们的程度决定,因此较大的节点有更多独特的连接,并被着色以表示“社区”,其中社区是使用Gephi的模块化函数确定的,分辨率为1.0。“波特兰”和“俄勒冈”这两个词被频繁搜索,以至于它们盖过了其他词,因此被从图中删除,以便更好地显示网络的其余部分。从图中可以清楚地看出,人们经常搜索“照片”和“如何”,这可能表明人们正在使用互联网来查看事物的图片并决定如何做事情。

表2。模型中包含变量的描述性统计。
变量 统计 范围
(min-max)
搜索次数,中位数(IQR,四分位范围) 22日(7.3) (1 - 718)
平均搜索字数(SD) 3.08 (1.57) (22页)
每个单词的字母,平均值(SD) 5.77 (2.23) (28)
单词晦涩度,均值(SD) 0.25 (0.11) (0.52 - -0.04)
图1。过去一年参与者搜索的社交网络图。如果搜索词出现在同一个搜索中,那么它们之间就有联系,联系越强表明它们一起出现的频率越高。每个项的大小由节点的度数决定,节点的度数表示连接到该项的唯一项的数量。术语根据社区进行着色,经常一起搜索的术语被分组到同一个社区中。
查看此图

线性回归分析

所有三种线性回归的结果显示在表3.请注意,在本表中,beta系数表示每个自变量的单位变化所导致的认知z分数变化量。对于所有结果变量,我们呈现单侧P与运行模型前假设的方向关系相匹配的值。

在第一个模型中,我们测试了较高的认知功能是否与每次搜索输入的唯一搜索词更多有关。如表3,我们的结果支持了这一假设:每次搜索每增加一个独特的单词,参与者的认知z得分就会提高0.39分(P= .002)。从这个角度来看,有了这个beta系数,该模型将预测,平均每次搜索3.1个单词的参与者,与平均每次搜索0.5个单词的单词最少的参与者相比,他们的认知z得分要高1.01分。考虑到认知z分数的范围是−1.15到1.2,这种差异是显著的。R2这个模型是0.46。认知z分数和每次搜索的平均唯一单词数之间关系的散点图可以在中可视化图2

在我们的第二个模型中,我们测试了更高的认知功能是否与搜索时使用较长的单词有关。如表3,我们的结果并不支持这一假设(P= . 21)。虽然系数的方向是假设的方向,但在本队列中关系不显著。R2这个模型是0.25。认知z分数和每个单词的平均字母数之间关系的散点图可以在图2

在我们最后的回归中,我们测试了具有较高认知功能的个体在互联网搜索时是否会使用更多晦涩的单词。如表3,我们的结果支持了这一假设:搜索词的平均晦涩度每增加一个单位,参与者的认知电池得分就会提高1.39分(P= .02点)。从这个角度来看,有了这个beta系数,模型将预测平均术语模糊度最高的参与者比平均术语模糊度最低的参与者的认知z得分高0.66分。R2这个模型是0.32。认知z分数和平均术语晦涩度之间关系的散点图可以在图2

在所有模型中,年龄与认知功能显著相关,年龄较大的个体认知功能较低。在任何模型中,性别和受教育程度与认知功能都没有显著关联。

表3。网络搜索与认知功能的三个线性回归结果。
特征 模型1 模型2 模型3

Beta系数(SD) Beta系数(SD) Beta系数(SD)
常数 综合成绩(0.96) 1.24 (1.10) 1.53 (0.98)
年龄 −.024(0.007)一个 −.024(0.008)b −.024(0.007)c
性别(女) 10 (0.20) .19 (0.23) .136 (0.22)
教育 .016 (0.038) .006 (0.043) .005 (0.041)
每次搜索的唯一术语数 点(0.13)b

每个单词的平均字母数
.084 (0.806)
平均术语模糊度

1.39 (0.68)d

一个P=措施。

bP= 04。

cP= .002。

dP= .02点。

图2。认知功能与(a)每次搜索的平均唯一术语数,(b)每个单词的平均字母数,以及(c)平均术语晦涩度之间关系的散点图。观察到的每个关系的回归线也被绘制为虚线。
查看此图

研究概述

在这项研究中,我们使用WorkTime持续监测74名老年人的电脑使用情况。WorkTime记录人们在进行基于互联网的搜索时所搜索的词。使用来自42名受试者的搜索词数据,他们在认知评估前后的6个月(前3个月或后3个月)至少完成了一次搜索,我们证明了认知功能与每次搜索输入的唯一词的平均数量和搜索词的模糊性有关。据我们所知,这些结果首次表明,语言使用的一个连续方面,即互联网搜索词,与老年人的认知能力有关。后续分析应在症状出现前的老年人中对这种关系进行纵向评估,以确定是否可以使用持续的互联网搜索词评估来确定最终将过渡到轻度认知障碍的个体。

主要研究结果

我们的第一个假设是,拥有优越认知功能的人在搜索时会使用更多独特的术语。我们的研究结果支持了这一假设,其结果可能被认为与在类别和音位流畅性的标准心理测量任务中表现良好所需的词汇或生成流畅性一致。先前的研究已经证实,音位和类别流畅性测试的表现随着认知功能的改变而下降[1819]包括导致轻度认知障碍的过渡[35].类别流利性指的是说出类别成员(如动物)的能力,而音素流利性指的是说出以某个字母开头的单词的能力。这两种方法通常都是通过让参与者在固定的时间内说出尽可能多的物体或单词来进行评估。由于认知能力下降和语言使用之间的密切关系,这些测试通常是用于检测MCI或阿尔茨海默病的标准认知测试的一部分。人们可能会认为生成搜索词的任务是利用类似的认知资源,因此,随着时间的推移,本文对生成的搜索词进行了分析,这是第一次将这种流利程度(互联网搜索词的流利程度或“FIST”)与认知功能联系起来。

我们的第二个假设是,具有优越认知功能的人会使用较长的单词进行搜索。然而,我们的研究结果并不支持这一假设。这也与之前的研究一致,即单词长度与图片命名能力的关系不如术语晦涩性密切[18].也就是说,阿尔茨海默病患者的词汇量可能会随着单词的模糊性或熟悉度而不成比例地下降,而不是单词的复杂性。事实上,我们最后的假设是,具有优越认知功能的人会使用更模糊的搜索词进行搜索。我们的研究结果支持了这一假设,与多年的正规教育无关,这与之前将词汇量下降与认知功能联系起来的工作是一致的。23].

限制

这项研究有几个局限性。值得注意的是,这项研究的参与者主要是受过良好教育的白人,相对健康的老年人。这里报告的结果可能不适用于其他人群。样本量也很小,因此我们只控制了少量的变量。未来的研究应该调查诸如社会网络规模、社会经济地位、计算机流畅性或药物使用等变量是否对本文报告的结果有任何影响。计算机流利性可能尤其重要,因为使用计算机的显著差异可能不是由于认知能力下降,而是由于熟悉和接触计算机。36].

此外,我们将模型中包含的搜索词限制为来自四个主要搜索引擎的搜索词:谷歌、Bing、Yahoo和Ask.com。虽然这些是老年人使用的主要搜索引擎,但可能不是所有的搜索都被捕捉到,因为一些参与者可能使用其他不太常见的搜索引擎搜索互联网。

我们也没有办法确定参与者是否使用自动填充来自动完成搜索。一些搜索浏览器提供了对搜索中可能剩下的词给出建议的选项,通常使用参与者和广大公众的流行搜索查询来提供建议。如果参与者在进行搜索时使用这样的软件,它将在搜索词数据集中注入人工噪声。未来的研究应该验证在所有参与者浏览器中禁用自动完成功能的数据集中呈现的结果。

我们雇佣了一个基本的词干分析器和拼写检查器。这些实用程序确保词的共轭(例如“running”是“run”的共轭)在术语频率词典中不会被计算两次,并且当拼写错误的单词实际上非常频繁但拼写错误时,它们不会被视为高度模糊的术语。但是,这两个实用程序都不能完美地运行。例如,虽然词干分析器正确地将“wolves”变成了“wolf”,但它却错误地将“dies”变成了“dy”。一个更复杂的拼写检查器和词干分析器可能会加强未来的研究。

我们对词汇模糊性的衡量只是与该词在搜索数据集中出现的频率相反。这是必要的,因为像“Gmail”这样的多个单词在互联网上很常见,但没有常见的词频或罕见度指标。然而,由于主题搜索既用于开发术语频率词典,也用于评估每个主题的平均单词模糊度,因此,由于搜索短语和术语更频繁地输入数据集,搜索互联网次数更多的个体可能具有更低的平均术语模糊度。事实上,搜索次数与平均单词晦涩度呈负相关(r=−0.23)。然而,后续分析显示,数据集中的搜索次数与个人的认知z得分无关(P= .97点)。然而,未来的研究应该对每个被试的词频进行归一化,以计算每个词的相对模糊性。

WorkTime不仅可以监测人们在互联网上搜索的词汇,还可以监测电脑使用的细节,如花在网络游戏或社交网站上的时间。因此,未来的研究可能受益于评估认知功能与计算机使用的多个方面之间的关系,特别是最近的研究已经证明,在计算机上花费的总时间和计算机会话的数量与认知能力下降有关[133738].电脑使用的多变性也与认知能力下降有关。13,但很少有研究评估了电脑使用的更详细方面(如在线游戏的总时间)及其与认知功能的关系,特别是使用客观监测软件。

结论

这项工作通过基于互联网的搜索和认知功能之间的日常语言功能之间的关系进行了独特的评估。一些研究表明,词汇量、语言流畅性和语义能力等语言能力与认知功能的整体变化之间存在密切关系。这些功能通常通过标准化的情景性认知测试进行评估。以前的研究未能在为认知衰退提供可扩展的早期检测方法的水平上测定这种认知结构。这在一定程度上可能是由于缺乏提供频繁的日常语言使用样本的方法。这里提出的方法利用了计算机软件,使得在日常使用计算机时能够持续而不引人注目地捕捉语言和相关复杂认知活动的各个方面。此外,与之前的工作不同,要分析的数据本质上是生态有效的,因为它是评估个体的日常功能。通过建立在这里展示的关系,有可能开发一个系统,通过持续监测人们在互联网上搜索的术语以及日常计算机使用的其他方面,来检测阿尔茨海默病的前驱期[71314].这可以通过类似于病毒检测软件的在后台常规安全运行的算法来完成。通过开发一种自然主义技术来评估认知变化的早期症状,这种方法有可能显著推进诊断和评估过程,并提供一种新的机制,可用于改善临床试验的进行和对AD治疗发展的护理。这将对认知能力下降的老年人、他们的家庭和整个医疗保健系统产生重大而深远的影响。

致谢

这项研究部分是由俄勒冈州公民通过俄勒冈慈善支票计划的阿尔茨海默病研究基金支持的。该基金由俄勒冈州阿尔茨海默氏症研究伙伴关系管理。此外,国家老龄化研究所资助R01 AG042191, P30 AG008017和P30 AG024978在支持这项研究方面做出了重大贡献。

利益冲突

没有宣布。

  1. 阿尔茨海默病协会。2014年阿尔茨海默病事实和数据。老年痴呆症2014年3月10日(2):e47-e92。[Medline
  2. Cummings JL, Morstorf T,钟凯。阿尔茨海默病药物开发管道:很少候选,频繁失败。阿尔茨海默氏Res Ther 2014 july 03;6(4):37 [免费全文] [CrossRef] [Medline
  3. 艾森PS, Vellas B, Hampel H.朝着淀粉样蛋白靶向治疗阿尔茨海默病的早期临床试验迈进。2013年4月12日(4):324。[CrossRef] [Medline
  4. Deak F, Freeman WM, Ungvari Z, Csiszar A, Sonntag WE。了解大脑衰老的最新进展:对阿尔茨海默病和血管性认知障碍的影响。中国老年医学杂志2016 Jan;71(1):13-20 [免费全文] [CrossRef] [Medline
  5. Serra L, Musicco M, Cercignani M,躯干M, Spanò B, Mastropasqua C,等。认知储备与阿尔茨海默病风险:一项纵向研究神经生物学杂志2015年2月,36(2):592-600。[CrossRef] [Medline
  6. Dodge HH, Zhu J, Mattek NC, Austin D, Kornfeld J, Kaye JA。使用高频家庭监测数据可以减少临床试验所需的样本量。公共科学学报2015年9月17日;10(9):e0138095。[CrossRef] [Medline
  7. Seelye A, Hagler S, Mattek N, Howieson DB, Wild K, Dodge HH,等。电脑鼠标移动模式:轻度认知障碍的潜在标志。老年痴呆症(Amst) 2015 Dec 01;1(4):472-480 [免费全文] [CrossRef] [Medline
  8. Petersen J, Austin D, Mattek N, Kaye J.老年人外出时间与认知、身体和情绪健康:纵向混合效应模型。PLoS One 2015 10月05日;10(10):e0139643 [免费全文] [CrossRef] [Medline
  9. 李志强,李志强,李志强,等。普适计算技术持续评估阿尔茨海默病的进展和干预效果。前沿衰老神经科学2015年6月10日;7:102 [免费全文] [CrossRef] [Medline
  10. Kaye JA, Maxwell SA, Mattek N, Hayes TL, Dodge H, Pavel M,等。评估衰老变化的智能系统:基于家庭的、不引人注目的、持续的衰老评估。J Gerontol B精神科学与社会科学2011七月;66(增刊1):i180-i190 [免费全文] [CrossRef] [Medline
  11. 齐库尔·K,马登·m·皮尤,2012年6月6日。老年人和互联网使用网址:http://www.pewinternet.org/2012/06/06/older-adults-and-internet-use/[已访问2017-08-09][WebCite缓存
  12. 史密斯·a·皮尤互联网,2014年4月3日。老年人和技术使用URL:http://www.pewinternet.org/2014/04/03/older-adults-and-technology-use/[已访问2017-08-10][WebCite缓存
  13. Kaye J, Mattek N, Dodge HH, Campbell I, Hayes T, Austin D,等。不引人注目地测量日常使用电脑来检测轻度认知障碍。阿尔茨海默痴呆2014年1月;10(1):10-17 [免费全文] [CrossRef] [Medline
  14. Austin D, Jimison H, Hayes T, Mattek N, Kaye J, Pavel M.通过打字测量电机速度:手指敲击测试的替代品。Behav Res Methods 2011 Dec;43(4):903-909 [免费全文] [CrossRef] [Medline
  15. 李志强,李志强,李志强。基于认知推理的手指敲击状态空间模型研究。在:Conf Proc IEEE Eng Med Biol Soc. 2012年发表于:第34届IEEE医学与生物工程学会国际年会(EMBC);2012年8月28日至9月1日;美国加州圣地亚哥,第21-24页。[CrossRef
  16. 戈麦斯RG,怀特DA。使用语言流利性来检测非常轻微的阿尔茨海默类型的痴呆症。2006年12月;21(8):771-775 [免费全文] [CrossRef] [Medline
  17. 阿尔茨海默病患者的词产生和理解:语义知识的分解。Brain Lang 1983 May;19(1):124-141。[Medline
  18. 张晓明,张晓明。阿尔茨海默病动词生成障碍的行为学研究。Brain Lang 2015 10月;149:128-134。[CrossRef] [Medline
  19. Mueller KD, Koscik RL, LaRue A, Clark LR, Hermann B, Johnson SC,等。语言流畅性和早期记忆衰退:来自威斯康星州阿尔茨海默氏症预防登记处的结果。2015年8月30日(5):448-457 [免费全文] [CrossRef] [Medline
  20. 肯珀,拉巴奇,费拉罗FR,张H,张H,斯托兰德M.关于阿尔茨海默病语法保存的研究。来自书面句子的证据。神经神经科学1993年1月;50(1):81-86。[Medline
  21. Garrard P, Maloney LM, Hodges JR, Patterson K.著名作家早期阿尔茨海默病对写作特征的影响。Brain 2005 Feb;128(Pt 2):250-260。[CrossRef] [Medline
  22. 劳斯KR,邓肯A,盖尔TM。阿尔茨海默病的“正常”语义-音素流利性差异?元分析研究。皮层2010年5月;46(5):595-601。[CrossRef] [Medline
  23. 弗雷泽KC, Meltzer JA, Rudzicz F.叙述言语的语言特征识别阿尔茨海默病。老年痴呆症杂志2016;49(2):407-422。[CrossRef] [Medline
  24. Szatloczki G, Hoffmann I, Vincze V, Kalman J, Pakaski M.说到老年痴呆症,这是早期迹象吗?阿尔茨海默病语言能力变化的重要性前沿衰老神经科学2015年10月20日;7:195 [免费全文] [CrossRef] [Medline
  25. 王晓明,王晓明,王晓明。基于语言语言的轻度认知障碍检测方法研究。IEEE Trans Audio Speech Lang Process 2011 Sep 01;19(7):2081-2090 [免费全文] [CrossRef] [Medline
  26. Robertson-Lang L, Major S, Hemming H.老年人寻求在线健康信息的搜索模式和可信度问题的探索。中国老年医学杂志2011年12月30日(4):631-645。[CrossRef] [Medline
  27. 哈特JH,霍利斯索耶L.老年人在互联网上寻求医疗保健信息。中国老年教育杂志2007 6月11日;33(7):561-572。[CrossRef
  28. Flynn KE, Smith MA, Freese J.老年人什么时候转向互联网获取健康信息?来自威斯康星纵向研究的发现。J Gen实习生医学2006年12月;21(12):1295-1301 [免费全文] [CrossRef] [Medline
  29. 韦氏记忆量表(WMS-III)。圣安东尼奥,德克萨斯州:心理学公司;1997.
  30. 韦氏D. WAIS-R手册:韦氏成人智力量表修订。圣安东尼奥,德克萨斯州:心理学公司;1981.
  31. 用于评估脑损伤的某些心理测试的分析。在:心理学专著。华盛顿特区:美国心理学会;1946.
  32. Rosen WG, Mohs RC, Davis KL.一种新的阿尔茨海默病评定量表。美国精神病学杂志1984年11月;141(11):1356-1364。[CrossRef] [Medline
  33. Jensen AR, Rohwer Jr WD。Stroop色字测验:综述。心理学报1966;25(1):36-93。[Medline
  34. 《统计视野》2012年9月10日。何时可以安全地忽略多重共线性?URL:http://www.statisticalhorizons.com/multicollinearity[已访问2017-08-10][WebCite缓存
  35. Howieson DB, Carlson NE, Moore MM, Wasserman D, Abendroth CD, Payne-Murphy J,等。轻度认知障碍发病轨迹。中华神经心理杂志2008年3月14日(2):192-198。[CrossRef] [Medline
  36. van Boekel LC, Peek ST, Luijkx KG。老年人使用互联网的多样性:通过潜在阶级分析识别子群体。J Med Internet Res 2017年5月24日;19(5):e180 [免费全文] [CrossRef] [Medline
  37. Tun PA, Lachman ME。成年后使用电脑与认知之间的联系:使用电脑就不会失去它?心理老化2010九月;25(3):560-568 [免费全文] [CrossRef] [Medline
  38. Slegers K, van Boxtel MPJ, Jolles J.老年人使用计算机:6年期间认知变化的决定因素和关系。计算人类行为2012 1月28日(1):1-10。[CrossRef
  39. Gephi。Gephi:一个用于探索和操作网络的开源软件https://gephi.org/publications/gephi-bastian-feb09.pdf[访问2017-08-29][WebCite缓存


广告:阿尔茨海默病
CDR:临床痴呆等级
背景:累积疾病评定量表
MCI:轻度认知障碍
患者:简易精神状态检查
VIF:方差膨胀因子


G·艾森巴赫(G Eysenbach)编辑;提交16.03.17;同行评议:K Fraser, S Bonasera, Q Zhang;对作者27.04.17的评论;修订版本收到21.06.17;接受29.07.17;发表06.09.17

版权

©Johanna Austin, Kristy Hollingshead, Jeffrey Kaye。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2017年9月6日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map