卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J Med Internet Res

医学互联网研究杂志

1438 - 8871

卡塔尔世界杯8强波胆分析

加拿大多伦多

v19i9e307

28877864

10.2196 / jmir.7671

原始论文

互联网搜索及其与老年人认知功能的关系:横断面分析

Eysenbach

冈瑟

弗雷泽

凯萨琳

那么

斯蒂芬。

张

清

奥斯丁

约翰娜

博士学位 1

神经内科俄勒冈健康与科学大学

西南邦德大道3303号

波特兰，俄勒冈州，97239

美国 1 503 418 9328 1 503 418 9311 peterjo@ohsu.edu

http://orcid.org/0000-0002-8912-0396

hillingshead的实验

克里斯蒂

博士学位 2

http://orcid.org/0000-0002-4900-0517

凯

杰弗里

医学博士 1

http://orcid.org/0000-0002-9971-3478

¹ 神经内科俄勒冈健康与科学大学

波特兰,或

美国 ² 佛罗里达人类与机器认知研究所

佛罗里达州彭萨科拉的

美国

通讯作者:Johanna Austin peterjo@ohsu.edu

09 2017

06 09 2017

19 9

e307

16 3. 2017 27 4 2017 21 6 2017 29 7 2017

©Johanna Austin, Kristy Hollingshead, Jeffrey Kaye。原载于医学互联网研究杂志(//www.mybigtv.com)， 2017年9月6日。

2017

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品首次发表在《医学互联网研究杂志》上，并适当引用。必须包括完整的书目信息，到//www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

背景

阿尔茨海默病(AD)对所有患者来说都是一种非常具有挑战性的经历。不幸的是，在临床治疗可能最有效的早期阶段检测阿尔茨海默病是具有挑战性的，因为临床评估既耗时又昂贵。最近的研究已经证明了认知功能和日常行为之间的密切关系，这一研究途径对早期发现认知能力下降有很大的希望。随着认知能力下降而改变的行为领域之一是语言使用。多个小组使用传统的面对面认知测试证明了认知功能与词汇量、语言流畅性和语义能力之间的密切关系。另一种方法是利用自动计算机监控软件，在计算机上持续捕捉和分析语言的使用，这种方法本身就是生态有效的。

客观的

这项研究的目的是了解互联网搜索作为老年人语言和认知功能的测量之间的关系。我们假设认知功能较差的人在搜索时会使用更少的独特术语，使用更短的词，并且在搜索中使用更少的模糊词。

方法

计算机监控软件(WorkTime, Nestersoft Inc .)被用来持续跟踪人们在谷歌、雅虎、必应和Ask.com上进行搜索时输入的术语。对于所有搜索，删除了标点符号、重音和非ascii字符，并在进行任何分析之前对结果搜索项进行拼写检查。认知功能被评估为捕获五个独特认知域的z归一化汇总得分。通过控制年龄、性别和教育等变量，使用线性回归来确定认知功能与互联网搜索之间的关系。

结果

在6个月的监测期间，42名参与者(平均年龄81岁[SD 10.5]， 83%[35/42]女性)使用这些热门搜索引擎进行了2915次搜索。参与者平均每次搜索3.08个单词(SD 1.6)和5.77个字母(SD 2.2)。认知功能较高的人每次搜索使用的独特术语更多(beta= 0.39， P=.002)，并在搜索中使用不太常见的术语(beta=1.39， P= .02点)。认知功能与搜索中使用的单词长度没有显著关联。

结论

这些结果表明，认知功能的早期衰退可以从人们使用互联网时搜索的术语中检测出来。通过持续跟踪互联网搜索词的基本方面，有可能比目前更早地发现认知能力下降，从而使积极的治疗和干预成为可能。

互联网老年病学认知执行功能

介绍

65岁以上的成年人中有九分之一被诊断患有阿尔茨海默病(AD)，这是美国第六大死亡原因。 1]。由于这种疾病对公共卫生的重要性，许多临床试验已经进行，以寻找有效的治疗方法。然而，从2002年到2012年，在244种被测试的化合物中，只有1种阿尔茨海默病药物进入市场的临床试验成功[ 2]，导致一些人称这则广告为“失去的十年”[ 3.]。这在一定程度上可能是由于阿尔茨海默病的早期诊断存在挑战。阿尔茨海默病的特点是发病隐匿，认知功能逐渐、微妙地下降。当通过临床评估检测到认知和功能症状时，疾病进展可能已经太迟，无法进行最有效的治疗。因此，目前阿尔茨海默病研究的一个主要重点是早期发现和预防疾病[ 4]。

阿尔茨海默病可能是大脑神经病理病变进行性累积的结果，最终影响认知和行为的多个方面[ 5]。可能受此过程影响的能力在临床评估中通常评估的许多领域都很明显，如语言处理、运动功能和执行功能。然而，在门诊就诊期间的评估可能无法检测到与认知功能变化相关的现实世界行为的细微变化。此外，情景评估只提供了认知功能的一个快照，使得关键变化的检测变得困难。鉴于需要许多数据点来检测统计上的重大变化，这种情景评估范式需要多年的数据。相比之下，Dodge等人最近的工作表明，通过更频繁地(例如，每天)收集感兴趣的关键变量的测量，可以在更短的时间内(例如，数月而不是数年)检测到变量的趋势和变化，从而更敏感地检测到衰退的早期阶段[ 6]。由于日常功能的细微变化需要数年才能演变并表现为痴呆症，因此通过持续的家庭监测日常行为和活动来检测这些变化的能力对于早期发现阿尔茨海默氏症具有很大的希望[ 7- 10]。

一个关键的行为，可能使日常功能的真实世界的识别是使用计算机。使用电脑需要运动功能来操作键盘和移动鼠标;语言处理，理解，选择，检索，并产生适当的单词;执行功能以有意义和有效的方式计划、抑制、集中和转移注意力。因此，个人与电脑互动的方式代表了一种丰富而相对未开发的评估日常认知能力的手段，尤其是在有认知能力下降风险的老年人中。值得注意的是，尽管老年人对电脑的采用落后于年轻一代[ 11随着婴儿潮一代的年龄增长，精通电脑的老年人的数量可能会急剧增加。 12]。因此，了解经常使用电脑与认知功能之间的关系将变得非常有价值，特别是80%使用互联网的老年人每周至少上网3次[ 12]。这种计算机监测方法已经开始在老年人中成功实施，通过评估一些计算机使用指标来索引认知变化。这些指标包括一般的时间使用指标[ 13]以及更具体的操作方面，例如，一个人如何完成在线任务或操作键盘[ 14， 15]或鼠标[ 7]。

在这方面，一个特别有潜力的领域是通过人们在互联网上搜索的术语来推断认知功能的各个方面，更具体地说，是语言功能。先前的语言分析研究(通常不是使用基于计算机的监测)表明，在AD等神经认知障碍患者中，语言能力下降的某些关键方面[ 16]。这些语言变化可能是由于大脑中负责产生和编码语言的区域受到破坏[ 17- 20.]。重要的是，在临床诊断出明显痴呆之前，就已经观察到语言功能的变化[ 21]。语言衰退的方面包括语义流畅性、图片命名和语音流畅性[ 22]。最近，研究人员开始使用自动语音检测或识别(ASR)系统，不仅分析单词使用，还分析停顿和语音节奏。 23并且已经证明，在其他临床测试可能检测到这种疾病之前，语言的这些关键方面对认知能力下降很敏感[ 24， 25]。

所有这些最近的研究都依赖于使用正式测试范式的引出语音或语言。本研究通过使用连续的计算机监测软件从人们在互联网上搜索的术语中收集语言样本，弥补了先前从计算机使用推断认知功能和认知衰退对语言影响的工作之间的差距。搜索词语言与口语的不同之处在于，它经常是目标导向的，可能只使用关键词而不是完整的句子，也可能使用口语中不使用的术语，如“df”而不是“definition”。尽管大量文献关注老年人如何在互联网上搜索健康信息[ 26- 28]，相对较少的研究调查了搜索词语言的一般方面或它们与认知功能的关系。

本文的重点是确定早期的语言变化是否可以从人们在日常使用中搜索互联网的方式中检测出来。特别是，我们假设认知功能受损更严重的个体将(1)每次搜索使用更少的唯一搜索词，(2)在搜索中使用更短的词，以及(3)使用更少模糊的搜索词，其中模糊被定义为在所有主题中搜索给定术语的频率的倒数。

方法参与者

本研究的参与者从两个正在进行的项目中招募:生命实验室队列(俄勒冈健康与科学大学(OHSU) IRB #2765)和环境独立性措施(AIMs)队列(OHSU IRB #9944)。这些研究的重点是利用家庭嵌入式传感和计算(“智能家居”)技术了解老年人的日常行为与健康之间的关系[ 9]。这两项研究的资格标准包括独自或独立居住在大于工作室的房子或公寓中，在迷你精神状态检查中最低得分为25分，在临床痴呆评定量表中最高得分为0.5分(未痴呆)。参与者还被要求独立生活，不需要家庭护理或日常活动的帮助。参与生命实验室研究的最低年龄为62岁，而AIMS队列的最低年龄为70岁。生命实验室研究的登记于2007年开始，并以滚动的方式继续进行。AIMs研究的报名于2014年开始，并于2016年4月结束。

2015年，两个项目中所有表示使用电脑的积极参与者都被要求参加这个额外的电脑使用监测研究。同意监控电脑使用情况的参与者会在他们的个人电脑上收到一个软件(WorkTime, Nestersoft Inc .)，该软件会记录他们在电脑上的所有活动，包括在谷歌、雅虎、必应和Ask.com等搜索引擎上搜索过的词条。所有受试者在参加任何研究活动前都签署了知情同意书，并且该研究得到了OHSU机构审查委员会(IRB #2765)的批准。总共有76人同意参加。其中，54名参与者在安装软件的同时在谷歌、必应、雅虎或Ask.com上进行搜索。然而，这些参与者中有12人在完成神经心理学评估之前或之后的3个月内没有进行搜索，因此他们的互联网搜索数据无法使用。因此，总共有42名参与者被纳入最终分析。参与者的人口统计学特征见表1。那些完成搜索的参与者比那些从未完成搜索的参与者年轻，但他们在其他人口统计学特征上没有统计学上的显著差异。在完成搜索的人中，平均年龄为81.1岁(标准差10.5)，83%为女性(35/42)，49%为大学毕业生(25/42)。平均认知z分数(详细定义见认知功能在该队列中，CDR评分为0.16 (SD为0.56)，其中一名参与者的CDR评分至少为0.5，表明存在轻度认知障碍。

数据和措施

对于每个参与者，在基线时收集人口统计数据(包括年龄、性别和教育程度)，每年进行临床评估，并(从2015年开始)使用WorkTime从参与者的个人电脑中连续收集数据。下面是对每种类型的数据的更详细的描述。

互联网搜索

在参与者的计算机上安装的WorkTime软件记录访问过的网站、使用过的应用程序以及在进行基于互联网的搜索时输入的搜索词。WorkTime从任何网站(如Target.com和Facebook.com)上的任何搜索浏览器收集数据。然而，在主要搜索引擎以外的网站上的搜索并不代表与主要搜索引擎中相同类型的搜索查询。因此，我们将最终数据集限制为仅包含在主要搜索引擎中输入的搜索。谷歌搜索显示，排名前三位的搜索引擎是谷歌、必应和雅虎。因此，我们在数据集中包括了这三个搜索引擎。然后我们检查了每个参与者，以确定他们是否经常在其他主要搜索引擎上进行搜索，并发现一些参与者也使用Ask.com进行搜索。因此，我们在最终数据集中也包括了由该搜索引擎产生的搜索。

最终数据集代表平均370天的连续计算机使用数据(最短7天;76名参与者的最长时间:796天)。从安装计算机软件到提取数据进行分析，54名受试者在必应、谷歌、雅虎和Ask.com上完成了8565次搜索，而在个人电脑上安装了WorkTime的22名参与者在监测期间从未完成过这些顶级搜索引擎之一的搜索，尽管其中一些参与者确实在监测期间外进行了搜索。由于我们将分析限制在亲身认知评估之前或之后的3个月的互联网搜索数据，因此只有42名在此期间进行互联网搜索的参与者被纳入最终分析。

在分析之前，所有搜索项都使用一个3步过程进行清理。首先，从搜索词的字符串中删除所有不可读的字符。这些字符包括符号和非ascii字符，这些字符无法使用标准的英语文本分析技术读取或解释。在适用的情况下，重音字符或非ASCII字符被转换为与该字符等价的ASCII字符(例如，" ß "被转换为" u ")。

表1

基线时参与者的人口学特征。

特征	完成标准搜索的参与者(n=42)	从未完成搜索的参与者(n=32)	P价值
平均年龄(SD)	81.1 (10.5)	88.9 (6.1)	<措施
性别，女性，n (%)	35 (83)	22日(68.8)	.14点
平均受教育年限(SD)	15.5 (2.0)	15.3 (2.5)	.62
累积疾病评定量表(CIRS)评分，平均值(SD)	20.3 (2.6)	20.8 (2.6)	.37点
简易精神状态检查(MMSE)得分，平均值(SD)	29 (1.3)	28.6 (1.7)	.46
临床痴呆评分(CDR)评分≥0.5,n (%)	1 (3)	4 (10.3)	. 21
认知z-score, mean (SD)	0.16 (0.56)	0.08 (0.76)	.60

一旦这些字符被删除，标点符号也被删除，所有的字母都变成小写，完整的搜索被分成单独的、单字母的搜索项。例如，搜索“波特兰哪里有烹饪课?”我们首先去掉了末尾的问号，并将“Where”和“Portland”中的大写字母改为小写字母。然后，我们将整个搜索结果划分为单独的术语:“在哪里”、“在哪里”、“烹饪”、“班级”、“在哪里”和“波特兰”。每次搜索被分成单独的词后，我们对每个词运行一个基本的拼写检查程序。拼写检查是必要的，因为我们感兴趣的是了解认知功能与变量之间的关系，比如搜索的唯一术语的数量——对于任何经常拼错单词的参与者来说，这个变量会变得过高。这一点尤其重要，因为随着认知功能的恶化，拼写能力可能会下降，潜在地掩盖了与搜索词本身生成的真实关系，而不管拼写是否正确。为了确定一个单词是否拼写错误，我们首先测试了这个单词是否出现在一个大的单词语料库中。如果没有出现这个单词，我们就认为这个单词拼写错误，并努力找到正确的拼写。这是通过算法完成的，首先从单词中删除单个字母，然后测试新单词是否出现在大量的单词语料库中。 If that did not find a suitable match, we swapped letters that were next to each other in order and tested each newly generated word to see whether it was in the large corpus of words. If we still did not find a match, we added individual letters to the word and tested each new generated word against the corpus of words. If none of these methods found a match, we left the word as is.

搜索词准备的最后一步是将每个词的词根提取到词根。对于上面的搜索示例，这将需要从类中删除“es”(即，“classes”变成“class”)，并从“cooking”中删除“ing”。为了整理单词，我们使用了WordNet词法分析器，它是Python自然语言工具包中免费提供的一部分。与其他词干提取工具不同，这个词干提取工具首先检查WordNet的扩展字典，以确保词干提取的单词是一个实际的单词，然后再提取后缀。

我们使用清理后的搜索词计算了三个指标。首先，我们计算了每次搜索的唯一字词的平均数量，它被定义为参与者搜索的字词总数除以他们执行的搜索总数。其次，我们计算了搜索到的单词的平均长度，即所有单词中的字母总数除以搜索到的单词总数。这两个指标是在每个受试者的基础上计算的(例如，仅使用来自一个受试者的数据来计算该受试者的平均唯一术语数或平均单词长度)。最后，我们计算了搜索词的平均模糊度。为了计算平均术语模糊度，我们首先计算所有主题中每个搜索词的频率。使用这个频率，我们计算出每个词的模糊度作为频率的倒数。最后，我们计算了每个参与者的平均术语模糊度，作为参与者搜索的所有单词的平均模糊度得分。

认知功能

在基线时收集所有参与者的标准化、详细的临床数据，然后每年对参与者进行适当的描述[ 10]。这些临床数据涵盖四个重要领域:健康状况、身体功能、认知和情绪。全球认知状态使用综合评分进行评估，其中包括五个认知领域中每个领域的两个或三个代表性神经心理学测试的z分数表。被评估的认知领域包括工作记忆:字母-数字排序(WMS-III) [ 29]和数字跨度向后长度(WAIS-R) [ 30.]; 关注/处理速度:数字跨距前向长度(WAIS-R)、数字符号(WAIS-R)和造径测试A部分[ 31]; 内存: WMS-R逻辑记忆II故事A、WMS-R视觉再现II和CERAD词表回忆[j] 32]; 执行功能:字母流利度(CFL)，试笔测试乙部[ 31]，以及Stroop颜色-词冲突[ 33];和视觉感知/建设: WAIS-R块设计、WAIS-R图片补全和WMS-R视觉再现1 .个体测试z分数的计算采用ORCATECH队列研究开始时所有认知完整参与者的原始测试分数的组平均值和标准差。所有个体参与者得分进行z归一化、求和和平均，以获得综合得分。后一个分数代表整体认知功能，以下简称认知z分数。

协变量

我们在所有模型中都包含了几个变量，这些变量可能会混淆基于互联网的搜索词与认知功能之间的关系。这些变量包括年龄、性别和受教育年限，因为这些变量可能与认知能力下降有关。

数据分析

我们首先计算了所有变量的描述性统计。其中包括对个人进行的平均搜索次数，每次搜索的平均单词数，搜索的每个单词中的平均字母数，以及搜索的术语的平均晦涩程度。

接下来，我们运行了3个线性回归，每个回归都以认知z分数作为结果变量。第一个线性回归模型建立了认知功能与每次搜索输入的唯一搜索词数量之间的关系。第二次回归模拟了搜索单词的平均长度与认知功能之间的关系。第三次回归模拟了认知功能和平均术语模糊之间的关系。为了确保系数估计不受多重共线性的偏倚，对所有自变量计算方差膨胀因子(VIF)，这是评估自变量共线性水平的标准诊断工具。所有变量的VIF都小于2.5，表明任何多重共线性的偏差都可以合理地忽略[ 34]。所有控制年龄、性别和受教育年限的回归都在Stata 13 (Stata Corp)中使用函数“reg”进行。

结果描述性统计

在6个月的监测期间，参与者进行了中位数为22次(四分位数间距，IQR 7.3)的搜索( 表2)。最常见的搜索词是“波特兰”(318次搜索)、“俄勒冈”(175次搜索)、“如何”(40次搜索)和“电子邮件”(36次搜索)。每次搜索的平均字数为3.08 (SD 1.6)，最长的搜索包含22个单词。在所有搜索的单词中，参与者平均每个单词有5.77个字母(标准差为2.2)。参与者的平均术语模糊度为0.25(标准差为0.1)。

中展示了搜索词数据集的丰富程度图1其中搜索在社交网络图中表示。这个图是在Gephi 0.8.2中创建的，这是一个用于可视化社交网络图的开源软件。在此图中，参与者搜索的每个唯一术语由单个节点表示，如果节点出现在同一搜索中，则将它们连接在一起(更粗的边表示它们一起出现的频率更高)。节点按其程度大小划分，这样较大的节点有更多独特的连接，并用颜色表示“社区”，其中社区是使用分辨率为1.0的Gephi模块化函数确定的。“波特兰”和“俄勒冈”这两个词的搜索频率如此之高，以至于它们盖过了其他词的风头，因此被从图表中删除，以便更好地显示网络的其余部分。从图中可以清楚地看出，人们经常搜索“照片”和“如何”，这可能表明人们使用互联网是为了看到事物的图片，并决定如何做事情。

表2

模型中包含的变量的描述性统计。

变量	统计	范围(min-max)
搜索次数，中位数(IQR，四分位数范围)	22日(7.3)	(1 - 718)
平均搜索字数(SD)	3.08 (1.57)	(22页)
每个单词的平均字母数(SD)	5.77 (2.23)	(28)
单词晦涩，意思(SD)	0.25 (0.11)	(0.52 - -0.04)

图1

过去一年参与者搜索的社交网络图。如果搜索词出现在同一搜索中，它们就会相互连接，而更强的连接表明它们一起出现的频率更高。每个项的大小由节点的度数确定，它表示连接到该项的唯一项的数量。术语按社区着色，经常一起搜索的术语被分组到同一个社区中。

线性回归分析

三种线性回归的结果见表3。请注意，在此表中，beta系数表示每个自变量发生单位变化时认知z分数的变化量。对于所有的结果变量，我们呈现单侧 P与运行模型之前假设的方向关系相称的值。

在第一个模型中，我们测试了更高的认知功能是否与每次搜索输入的唯一搜索词有关。如图所示表3，我们的结果支持了这个假设:每次搜索中每多搜索一个独特的单词，参与者的认知z得分就会提高0.39分( P= .002)。从这个角度来看，有了这个beta系数，该模型将预测，与平均每次搜索最不独特的术语(每次搜索0.5个术语)的参与者相比，平均每次搜索最不独特术语的参与者在认知z分数上的得分将高出1.01分。考虑到认知z分数的范围从- 1.15到1.2，这种差异是显著的。R²该模型为0.46。认知z分数与每次搜索的平均唯一单词数之间关系的散点图可以在图2。

在我们的第二个模型中，我们测试了更高的认知功能是否与搜索时使用较长的单词有关。如图所示表3但是，我们的研究结果并不支持这个假设。 P= . 21)。虽然系数的方向与假设的方向一致，但在本队列中关系不显著。R²这个模型是0.25。认知z分数与每个单词的平均字母数之间关系的散点图可以在图2。

在我们最后的回归中，我们测试了具有更高认知功能的个体在搜索互联网时是否会使用更多模糊的词。如图所示表3，我们的研究结果支持了这个假设:搜索单词的平均模糊度每增加一个单位，参与者的认知能力得分就会提高1.39分。 P= .02点)。从这个角度来看，有了这个beta系数，该模型将预测，与平均术语模糊度最低的参与者(0.044)相比，平均术语模糊度最高的参与者(0.52)在认知z分数上的得分将高出0.66分。R²该模型为0.32。认知z分数与平均术语模糊度之间关系的散点图可以在图2。

在所有模型中，年龄与认知功能显著相关，因此老年人的认知功能较低。在任何模型中，性和教育都与认知功能没有显著关联。

表3

三个有关网络搜索与认知功能的线性回归结果。

特征	模型1	模型2	模型3
	Beta系数(SD)	Beta系数(SD)	Beta系数(SD)
常数	综合成绩(0.96)	1.24 (1.10)	1.53 (0.98)
年龄	−.024(0.007)^一个	−.024(0.008)^b	−.024(0.007)^c
性别(女)	10 (0.20)	.19 (0.23)	.136 (0.22)
教育	.016 (0.038)	.006 (0.043)	.005 (0.041)
每次搜索的唯一词数	点(0.13)^b
每个单词的平均字母数		.084 (0.806)
平均术语模糊度			1.39 (0.68)^d

^一个 P=措施。

^b P= 04。

^c P= .002。

^d P= .02点。

图2

认知功能与(a)每次搜索的平均唯一词数，(b)每个单词的平均字母数，以及(c)平均术语模糊度之间关系的散点图。观察到的每个关系的回归线也绘制为虚线。

讨论研究概述

在这项研究中，我们使用WorkTime连续监测74名老年人的电脑使用情况。WorkTime记录人们在进行基于互联网的搜索时所搜索的术语。使用来自42名受试者的搜索词数据，他们在6个月内完成了至少一次搜索(3个月前或3个月后)认知评估，我们证明了认知功能与每次搜索输入的唯一术语的平均数量和搜索词的模糊程度有关。这些结果首次向我们展示了语言使用的一个连续方面，即网络搜索词，与老年人的认知能力有关。后续分析应该在症状前的老年人中纵向评估这种关系，以确定是否可以使用持续的互联网搜索词评估来识别最终会过渡到轻度认知障碍的个体。

主要研究结果

我们的第一个假设是，拥有更高认知功能的人会在搜索中使用更独特的术语。我们的结果支持这一假设，其结果可能被认为与在类别和音素流利性的标准心理测量任务中表现良好所需的词汇或生成流利性一致。先前的研究已经证实，音位和类别流畅性测试的表现会随着认知功能的改变而下降[ 18， 19]包括导致轻度认知障碍的转变[ 35]。类别流利是指能够说出一个类别的成员(如动物)的名字，而音位流利是指能够说出以某个字母开头的单词的名字。这两种测试都是通过让参与者在一段固定的时间内说出尽可能多的物体或单词来评估的。由于认知能力下降和语言使用之间的密切关系，这些测试通常是用于检测轻度认知障碍或阿尔茨海默病的标准认知测试的一部分。人们可能会考虑生成搜索词的任务，以利用类似的认知资源，因此，随着时间的推移而生成的搜索词的分析，并在这里提出，代表了这种流利度(互联网搜索词的流利度或“拳头”)的测量首次与认知功能联系起来。

我们的第二个假设是，拥有优越认知功能的人会使用较长的单词进行搜索。然而，我们的结果并不支持这一假设。这也与之前的研究一致，即单词长度与图片命名能力的关系不如术语模糊程度[ 18]。也就是说，阿尔茨海默病患者的词汇量可能会随着单词模糊或熟悉程度而不成比例地下降，而不是单词复杂程度。事实上，我们最后的假设是，拥有更高认知功能的人会使用更模糊的搜索词进行搜索。我们的研究结果支持这一假设，不受正规教育年限的影响，这与之前将词汇量下降与认知功能联系起来的研究结果是一致的。 23]。

限制

这项研究有几个局限性。值得注意的是，这项研究的参与者主要是受过良好教育的白人，相对健康的老年人。这里报告的结果可能不适用于其他人群。样本量也很小，因此我们只控制了少数变量。未来的研究应该调查诸如社会网络规模、社会经济地位、计算机流利程度或药物使用等变量是否对本文报道的结果有任何影响。计算机流畅性可能尤其重要，因为在计算机使用方面可能存在显著差异，而不是由于认知能力下降，而是由于熟悉和接触计算机[ 36]。

此外，我们将模型中包含的搜索词限制为仅来自四个主要搜索引擎的搜索词:Google、Bing、Yahoo和Ask.com。虽然这些是这些老年人使用的主要搜索引擎，但可能不是所有的搜索都被捕获，因为一些参与者可能使用其他不太常见的搜索引擎搜索互联网。

我们也没有办法确定参与者是否使用自动填充来自动完成他们的搜索。一些搜索浏览器提供了对搜索中可能剩下的词给出建议的选项，通常使用来自参与者和更大的公众的流行搜索查询来通知建议。如果参与者在进行搜索时使用这种软件，它将向搜索词数据集中注入人工噪声。未来的研究应该在所有参与的浏览器中禁用自动完成功能的数据集中验证这里给出的结果。

我们使用了一个基本的词干和拼写检查器。这些实用程序确保单词的共轭词(例如“running”是“run”的共轭词)不会在术语频率字典中被计算两次，并且当拼写错误的单词实际上非常频繁但拼写错误时，它们不会被视为高度模糊的术语。然而，这两个实用程序都不能完美地执行。例如，当词干器正确地将“wolves”拼写为“wolf”时，它错误地将“dies”拼写为“dy”。一个更复杂的拼写检查器和词干器可能会加强未来的研究。

我们对术语模糊度的测量仅仅是该词在搜索数据集中出现频率的倒数。这是必要的，因为像“Gmail”这样的多个单词在互联网上很常见，但却没有常见的单词频率或罕见度衡量标准。然而，由于主题搜索既用于开发术语频率字典，又用于评估每个主题的平均单词晦涩度，因此搜索互联网的个人可能拥有较低的平均术语晦涩度，因为他们的搜索短语和术语更频繁地输入数据集。事实上，搜索次数与平均单词模糊度呈负相关( r=−0.23)。然而，后续分析显示，数据集中的搜索次数与个体的认知z得分无关( P= .97点)。然而，未来的研究应该规范化每个主题的词频，以计算每个词的相对晦涩度。

WorkTime不仅可以监控人们在互联网上搜索的术语，还可以监控电脑使用的详细方面，如花在在线游戏或社交网站上的时间。因此，未来的研究可能会受益于评估认知功能与电脑使用的多个方面之间的关系，特别是最近的研究表明，花在电脑上的总时间和电脑会话次数与认知能力下降有关[ 13， 37， 38]。电脑使用的变化也与认知能力下降有关[ 13]，但很少有研究(如果有的话)评估了电脑使用的更详细方面(例如，在线游戏的总时间)及其与认知功能的关系，特别是使用客观监测软件。

结论

这项工作独特地评估了日常语言功能之间的关系，通过基于互联网的搜索和认知功能。一些研究表明，词汇量、语言流畅性和语义能力等语言能力与认知功能的整体变化之间存在密切关系。这些功能通常通过标准化的间歇性认知测试来评估。以前的研究无法在一定水平上分析这种认知结构，从而为认知衰退提供可扩展的早期检测方法。这可能部分是由于缺乏提供日常语言使用频繁样本的方法。本文提出的方法利用了计算机软件的优势，它可以在日常计算机使用过程中持续而不显眼地捕获语言和相关复杂认知活动的各个方面。此外，与之前的工作不同，要分析的数据本质上是生态有效的，因为正在评估的是个体的日常功能。在这里展示的关系的基础上，有可能开发出一种系统，通过持续监测人们在互联网上搜索的术语以及日常计算机使用的其他方面，来检测阿尔茨海默病的前驱阶段。 7， 13， 14]。这可以通过类似于病毒检测软件的常规和安全后台运行的算法来完成。通过开发一种自然的技术来评估认知变化的早期症状，这种方法有可能显著推进诊断和评估过程，并提供一种新的机制，可用于改善临床试验的进行和AD治疗开发的护理。这将对经历认知衰退的老年人、他们的家庭和整个医疗保健系统产生重大而深远的影响。

缩写

阿尔茨海默病

CDR

临床痴呆评分

圆形的

累积疾病评定量表

MCI

轻度认知障碍

患者的

简易精神状态检查

VIF

通货膨胀系数

这项研究得到了俄勒冈州公民通过俄勒冈慈善支票计划的阿尔茨海默病研究基金的部分支持。该基金由俄勒冈州阿尔茨海默病研究伙伴关系管理。此外，美国国家老龄研究所拨款R01 AG042191、P30 AG008017和P30 AG024978也为支持本研究做出了重要贡献。

没有宣布。

阿尔茨海默氏症协会

2014年阿尔茨海默病的事实和数据

预防老年痴呆症 2014 03 10 2 e47 92

24818261

S1552526014000624

卡明斯

莱托

Morstorf

钟

阿尔茨海默病药物开发管道:候选药物少，频繁失败

阿尔茨海默氏症 2014 07 03 6 4 37

10.1186 / alzrt269

25024750

alzrt269

PMC4095696

爱森

维拉拉

Hampel

淀粉样蛋白靶向治疗阿尔茨海默病的早期临床试验

Nat Rev药物发现 2013 04 12 4 324

10.1038 / nrd3842-c1

23493086

nrd3842-c1

迪克

弗里曼

Ungvari

Csiszar

一个

星期日

我们

理解脑老化的最新进展:对阿尔茨海默病和血管性认知障碍的影响

[J]刘文华，刘志刚，刘志刚，等 2016 01 71 1 13 20.

10.1093 /赫罗那/ glv206

26590911

glv206

PMC4851715

塞拉

Musicco

米

Cercignani

米

躯干

米

斯帕诺

Mastropasqua

Giulietti

马拉

布鲁诺

科赫

卡沃

Bozzali

米

认知储备与阿尔茨海默病风险:一项纵向研究

一般人衰老 2015 02 36 2 592 600

10.1016 / j.neurobiolaging.2014.10.010

25433459

s0197 - 4580 (14) 00648 - 4

道奇

朱

Mattek

数控

奥斯丁

Kornfeld

凯

晶澳

使用高频家庭监测数据可以减少临床试验所需的样本量

《公共科学图书馆•综合》 2015 09 17 10 9 e0138095

10.1371 / journal.pone.0138095

26379170

玉米饼- d - 15 - 13785

PMC4574479

Seelye

一个

Hagler

年代

Mattek

Howieson

野生

道奇

凯

晶澳

电脑鼠标运动模式:轻度认知障碍的潜在标志

阿尔茨海默氏症(老年痴呆症) 2015 12 01 1 4 472 480

10.1016 / j.dadm.2015.09.006

26878035

PMC4748737

彼得森

奥斯丁

Mattek

凯

外出时间与老年人的认知、身体和情感健康:纵向混合效应模型

《公共科学图书馆•综合》 2015 10 05 10 10 e0139643

10.1371 / journal.pone.0139643

26437228

玉米饼- d - 15 - 24979

PMC4593630

里昂

是

奥斯丁

Seelye

一个

彼得森

Yeargers

莱利

沙玛

Mattek

野生

道奇

凯

晶澳

普适计算技术持续评估阿尔茨海默病的进展和干预效果

神经科学 2015 06 10 7 102

10.3389 / fnagi.2015.00102

26113819

PMC4462097

凯

晶澳

麦克斯韦

Mattek

海斯

道奇

帕维尔

米

Jimison

乙肝

野生

博伊西

Zitzelberger

助教

用于评估老龄化变化的智能系统:基于家庭的、不引人注目的、连续的老龄化评估

[J]陈晓华，陈晓华 2011 07 66 增刊1 i180 90

10.1093 / geronb / gbq095

21743050

gbq095

PMC3132763

Zickuhr

马登

米

皮尤互联网 2012 06 06

2017-08-09

老年人和互联网使用 http://www.pewinternet.org/2012/06/06/older-adults-and-internet-use/

史密斯

一个

皮尤互联网 2014 04 03

2017-08-10

老年人和技术使用 http://www.pewinternet.org/2014/04/03/older-adults-and-technology-use/

凯

Mattek

道奇

坎贝尔

我

海斯

奥斯丁

Hatt

野生

Jimison

帕维尔

米

对日常电脑使用情况进行不显眼的测量，以检测轻度认知障碍

预防老年痴呆症 2014 01 10 1 10 7

10.1016 / j.jalz.2013.01.011

23688576

s1552 - 5260 (13) 00043 - 5

PMC3872486

奥斯丁

Jimison

海斯

Mattek

凯

帕维尔

米

通过打字测量电机速度:手指敲击测试的替代品

行为Res方法 2011 12 43 4 903 9

10.3758 / s13428 - 011 - 0100 - 1

21494919

PMC3151309

奥斯丁

彼得森

Jimison

帕维尔

米

手指敲击的状态空间模型及其在认知推理中的应用

IEEE工程医学与生物学报 2012

第34届IEEE医学与生物工程学会年会(EMBC)

2012年8月28日至9月1日

圣地亚哥，加州，美国

21 4

10.1109 / EMBC.2012.6345861

戈麦斯

白色

达

使用语言流畅性来检测非常轻微的阿尔茨海默氏症

神经心理学家 2006 12 21 8 771 5

10.1016 / j.acn.2006.06.012

17011743

s0887 - 6177 (06) 00131 - 4

马丁

一个

Fedio

阿尔茨海默病的词语产生和理解:语义知识的分解

大脑朗 1983 05 19 1 124 41

6860932

碧碧

公元前

克鲁兹

一个

查维斯

毫升

阿尔茨海默病中动词产生缺陷性质的行为研究

大脑朗 2015 10 149 128 34

10.1016 / j.bandl.2015.07.010

26291288

s0093 - 934 x (15) 00168 - 6

穆勒

Koscik

们

一个

克拉克

赫尔曼

约翰逊

塞奇

妈

语言流利和早期记忆衰退:来自威斯康星州阿尔茨海默氏症预防登记的结果

神经心理学家 2015 08 30. 5 448 57

10.1093 / arclin / acv030

26025231

acv030

PMC4592319

20.

坎伯

年代

LaBarge公司

费拉罗

张

Storandt

米

关于阿尔茨海默病的句法保存。来自书面句子的证据

拱神经 1993 01 50 1 81 6

8418805

的Garrard

马宏升

霍奇斯

小

帕特森

早期阿尔茨海默病对著名作家写作特点的影响

大脑 2005 02 128 Pt - 2 250 60

10.1093 /大脑/ awh341

15574466

awh341

法律

基米-雷克南

邓肯

一个

盖尔

阿尔茨海默病的“正常”语义-音位流畅性差异?元分析研究

皮质 2010 05 46 5 595 601

10.1016 / j.cortex.2009.04.009

19560132

s0010 - 9452 (09) 00148 - 8

弗雷泽

Meltzer

晶澳

Rudzicz

叙事性言语的语言特征可识别阿尔茨海默病

阿尔茨海默病 2016 49 2 407 22

10.3233 / jad - 150520

26484921

JAD150520

Szatloczki

霍夫曼

我

Vincze

卡尔曼

Pakaski

米

就老年痴呆症而言，这是早期征兆吗?阿尔茨海默病中语言能力变化的重要性

神经科学 2015 10 20. 7 195

10.3389 / fnagi.2015.00195

26539107

PMC4611852

罗克

米切尔

米

Hosom

摩根大通

hillingshead的实验

凯

口语衍生的检测轻度认知障碍的方法

IEEE跨音频语音语言处理 2011 09 01 19 7 2081 2090

10.1109 / TASL.2011.2112351

22199464

PMC3244269

Robertson-Lang

主要

年代

卷边

探索老年人在线健康信息的搜索模式和可信度问题

衰老吗? 2011 12 30. 4 631 45

10.1017 / S071498081100050X

22085455

S071498081100050X

哈特

Hollis-Sawyer

老年人在互联网上寻找医疗保健信息

建造Gerontol 2007 06 11 33 7 561 72

10.1080 / 0360127070136462

弗林

柯

史密斯

妈

弗里兹

老年人什么时候会转向互联网获取健康信息?威斯康星纵向研究的发现

J Gen实习医学 2006 12 21 12 1295 301

10.1111 / j.1525-1497.2006.00622.x

16995892

JGI622

PMC1924748

韦氏

韦氏记忆量表(WMS-III) 1997

圣安东尼奥，德克萨斯州

心理上的公司

30.

韦氏

WAIS-R手册:韦氏成人智力量表修订版 1981

圣安东尼奥，德克萨斯州

心理上的公司

阿米蒂奇

年代

对用于评估脑损伤的某些心理测试的分析

心理专著 1946

华盛顿特区

美国心理学会

罗森

工作组

莫氏

钢筋混凝土

戴维斯

吉隆坡

一种新的阿尔茨海默病评定量表

精神病学杂志 1984 11 141 11 1356 64

10.1176 / ajp.141.11.1356

6496779

詹森

基于“增大化现实”技术

小Rohwer说道

斯特鲁普色字测试:回顾

心理学报(英文版) 1966 25 1 36 93

5328883

埃里森

统计的视野 2012 09 10

2017-08-10

什么时候可以安全地忽略多重共线性? http://www.statisticalhorizons.com/multicollinearity

Howieson

卡尔森

不

摩尔

毫米

沃瑟曼

Abendroth

Payne-Murphy

凯

晶澳

轻度认知障碍的发病轨迹

[J]神经心理学杂志 2008 03 14 2 192 8

10.1017 / S1355617708080375

18282317

S1355617708080375

范Boekel

信用证

偷看

圣

Luijkx

公斤

老年人互联网使用的多样性:通过潜在类分析确定亚群

J Med Internet Res 2017 05 24 19 5 e180

10.2196 / jmir.6853

28539302

v19i5e180

PMC5463053

桶

巴勒斯坦权力机构

拉克曼

我

成年后使用电脑与认知之间的关系:使用电脑就不会失去它?

Psychol老化 2010 09 25 3. 560 8

10.1037 / a0019543

20677884

2010-15973-001

PMC3281759

Slegers

范·波斯特

MPJ

Jolles

老年人电脑使用:决定因素及其与6年认知变化的关系

计算人类行为 2012 01 28 1 1 10

10.1016 / j.chb.2011.08.003

Gephi 2017-08-29 Gephi:一个用于探索和操纵网络的开源软件 https://gephi.org/publications/gephi-bastian-feb09.pdf