这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
阿尔茨海默病(AD)对所有患者来说都是一种非常具有挑战性的经历。不幸的是,在临床治疗可能最有效的早期阶段检测阿尔茨海默病是具有挑战性的,因为临床评估既耗时又昂贵。最近的研究已经证明了认知功能和日常行为之间的密切关系,这一研究途径对早期发现认知能力下降有很大的希望。随着认知能力下降而改变的行为领域之一是语言使用。多个小组使用传统的面对面认知测试证明了认知功能与词汇量、语言流畅性和语义能力之间的密切关系。另一种方法是利用自动计算机监控软件,在计算机上持续捕捉和分析语言的使用,这种方法本身就是生态有效的。
这项研究的目的是了解互联网搜索作为老年人语言和认知功能的测量之间的关系。我们假设认知功能较差的人在搜索时会使用更少的独特术语,使用更短的词,并且在搜索中使用更少的模糊词。
计算机监控软件(WorkTime, Nestersoft Inc .)被用来持续跟踪人们在谷歌、雅虎、必应和Ask.com上进行搜索时输入的术语。对于所有搜索,删除了标点符号、重音和非ascii字符,并在进行任何分析之前对结果搜索项进行拼写检查。认知功能被评估为捕获五个独特认知域的z归一化汇总得分。通过控制年龄、性别和教育等变量,使用线性回归来确定认知功能与互联网搜索之间的关系。
在6个月的监测期间,42名参与者(平均年龄81岁[SD 10.5], 83%[35/42]女性)使用这些热门搜索引擎进行了2915次搜索。参与者平均每次搜索3.08个单词(SD 1.6)和5.77个字母(SD 2.2)。认知功能较高的人每次搜索使用的独特术语更多(beta= 0.39,
这些结果表明,认知功能的早期衰退可以从人们使用互联网时搜索的术语中检测出来。通过持续跟踪互联网搜索词的基本方面,有可能比目前更早地发现认知能力下降,从而使积极的治疗和干预成为可能。
65岁以上的成年人中有九分之一被诊断患有阿尔茨海默病(AD),这是美国第六大死亡原因。
阿尔茨海默病可能是大脑神经病理病变进行性累积的结果,最终影响认知和行为的多个方面[
一个关键的行为,可能使日常功能的真实世界的识别是使用计算机。使用电脑需要运动功能来操作键盘和移动鼠标;语言处理,理解,选择,检索,并产生适当的单词;执行功能以有意义和有效的方式计划、抑制、集中和转移注意力。因此,个人与电脑互动的方式代表了一种丰富而相对未开发的评估日常认知能力的手段,尤其是在有认知能力下降风险的老年人中。值得注意的是,尽管老年人对电脑的采用落后于年轻一代[
在这方面,一个特别有潜力的领域是通过人们在互联网上搜索的术语来推断认知功能的各个方面,更具体地说,是语言功能。先前的语言分析研究(通常不是使用基于计算机的监测)表明,在AD等神经认知障碍患者中,语言能力下降的某些关键方面[
所有这些最近的研究都依赖于使用正式测试范式的引出语音或语言。本研究通过使用连续的计算机监测软件从人们在互联网上搜索的术语中收集语言样本,弥补了先前从计算机使用推断认知功能和认知衰退对语言影响的工作之间的差距。搜索词语言与口语的不同之处在于,它经常是目标导向的,可能只使用关键词而不是完整的句子,也可能使用口语中不使用的术语,如“df”而不是“definition”。尽管大量文献关注老年人如何在互联网上搜索健康信息[
本文的重点是确定早期的语言变化是否可以从人们在日常使用中搜索互联网的方式中检测出来。特别是,我们假设认知功能受损更严重的个体将(1)每次搜索使用更少的唯一搜索词,(2)在搜索中使用更短的词,以及(3)使用更少模糊的搜索词,其中模糊被定义为在所有主题中搜索给定术语的频率的倒数。
本研究的参与者从两个正在进行的项目中招募:生命实验室队列(俄勒冈健康与科学大学(OHSU) IRB #2765)和环境独立性措施(AIMs)队列(OHSU IRB #9944)。这些研究的重点是利用家庭嵌入式传感和计算(“智能家居”)技术了解老年人的日常行为与健康之间的关系[
2015年,两个项目中所有表示使用电脑的积极参与者都被要求参加这个额外的电脑使用监测研究。同意监控电脑使用情况的参与者会在他们的个人电脑上收到一个软件(WorkTime, Nestersoft Inc .),该软件会记录他们在电脑上的所有活动,包括在谷歌、雅虎、必应和Ask.com等搜索引擎上搜索过的词条。所有受试者在参加任何研究活动前都签署了知情同意书,并且该研究得到了OHSU机构审查委员会(IRB #2765)的批准。总共有76人同意参加。其中,54名参与者在安装软件的同时在谷歌、必应、雅虎或Ask.com上进行搜索。然而,这些参与者中有12人在完成神经心理学评估之前或之后的3个月内没有进行搜索,因此他们的互联网搜索数据无法使用。因此,总共有42名参与者被纳入最终分析。参与者的人口统计学特征见
对于每个参与者,在基线时收集人口统计数据(包括年龄、性别和教育程度),每年进行临床评估,并(从2015年开始)使用WorkTime从参与者的个人电脑中连续收集数据。下面是对每种类型的数据的更详细的描述。
在参与者的计算机上安装的WorkTime软件记录访问过的网站、使用过的应用程序以及在进行基于互联网的搜索时输入的搜索词。WorkTime从任何网站(如Target.com和Facebook.com)上的任何搜索浏览器收集数据。然而,在主要搜索引擎以外的网站上的搜索并不代表与主要搜索引擎中相同类型的搜索查询。因此,我们将最终数据集限制为仅包含在主要搜索引擎中输入的搜索。谷歌搜索显示,排名前三位的搜索引擎是谷歌、必应和雅虎。因此,我们在数据集中包括了这三个搜索引擎。然后我们检查了每个参与者,以确定他们是否经常在其他主要搜索引擎上进行搜索,并发现一些参与者也使用Ask.com进行搜索。因此,我们在最终数据集中也包括了由该搜索引擎产生的搜索。
最终数据集代表平均370天的连续计算机使用数据(最短7天;76名参与者的最长时间:796天)。从安装计算机软件到提取数据进行分析,54名受试者在必应、谷歌、雅虎和Ask.com上完成了8565次搜索,而在个人电脑上安装了WorkTime的22名参与者在监测期间从未完成过这些顶级搜索引擎之一的搜索,尽管其中一些参与者确实在监测期间外进行了搜索。由于我们将分析限制在亲身认知评估之前或之后的3个月的互联网搜索数据,因此只有42名在此期间进行互联网搜索的参与者被纳入最终分析。
在分析之前,所有搜索项都使用一个3步过程进行清理。首先,从搜索词的字符串中删除所有不可读的字符。这些字符包括符号和非ascii字符,这些字符无法使用标准的英语文本分析技术读取或解释。在适用的情况下,重音字符或非ASCII字符被转换为与该字符等价的ASCII字符(例如," ß "被转换为" u ")。
基线时参与者的人口学特征。
特征 | 完成标准搜索的参与者(n=42) | 从未完成搜索的参与者(n=32) |
|
平均年龄(SD) | 81.1 (10.5) | 88.9 (6.1) | <措施 |
性别,女性,n (%) | 35 (83) | 22日(68.8) | .14点 |
平均受教育年限(SD) | 15.5 (2.0) | 15.3 (2.5) | .62 |
累积疾病评定量表(CIRS)评分,平均值(SD) | 20.3 (2.6) | 20.8 (2.6) | .37点 |
简易精神状态检查(MMSE)得分,平均值(SD) | 29 (1.3) | 28.6 (1.7) | .46 |
临床痴呆评分(CDR)评分≥0.5,n (%) | 1 (3) | 4 (10.3) | . 21 |
认知z-score, mean (SD) | 0.16 (0.56) | 0.08 (0.76) | .60 |
一旦这些字符被删除,标点符号也被删除,所有的字母都变成小写,完整的搜索被分成单独的、单字母的搜索项。例如,搜索“波特兰哪里有烹饪课?”我们首先去掉了末尾的问号,并将“Where”和“Portland”中的大写字母改为小写字母。然后,我们将整个搜索结果划分为单独的术语:“在哪里”、“在哪里”、“烹饪”、“班级”、“在哪里”和“波特兰”。每次搜索被分成单独的词后,我们对每个词运行一个基本的拼写检查程序。拼写检查是必要的,因为我们感兴趣的是了解认知功能与变量之间的关系,比如搜索的唯一术语的数量——对于任何经常拼错单词的参与者来说,这个变量会变得过高。这一点尤其重要,因为随着认知功能的恶化,拼写能力可能会下降,潜在地掩盖了与搜索词本身生成的真实关系,而不管拼写是否正确。为了确定一个单词是否拼写错误,我们首先测试了这个单词是否出现在一个大的单词语料库中。如果没有出现这个单词,我们就认为这个单词拼写错误,并努力找到正确的拼写。这是通过算法完成的,首先从单词中删除单个字母,然后测试新单词是否出现在大量的单词语料库中。 If that did not find a suitable match, we swapped letters that were next to each other in order and tested each newly generated word to see whether it was in the large corpus of words. If we still did not find a match, we added individual letters to the word and tested each new generated word against the corpus of words. If none of these methods found a match, we left the word as is.
搜索词准备的最后一步是将每个词的词根提取到词根。对于上面的搜索示例,这将需要从类中删除“es”(即,“classes”变成“class”),并从“cooking”中删除“ing”。为了整理单词,我们使用了WordNet词法分析器,它是Python自然语言工具包中免费提供的一部分。与其他词干提取工具不同,这个词干提取工具首先检查WordNet的扩展字典,以确保词干提取的单词是一个实际的单词,然后再提取后缀。
我们使用清理后的搜索词计算了三个指标。首先,我们计算了每次搜索的唯一字词的平均数量,它被定义为参与者搜索的字词总数除以他们执行的搜索总数。其次,我们计算了搜索到的单词的平均长度,即所有单词中的字母总数除以搜索到的单词总数。这两个指标是在每个受试者的基础上计算的(例如,仅使用来自一个受试者的数据来计算该受试者的平均唯一术语数或平均单词长度)。最后,我们计算了搜索词的平均模糊度。为了计算平均术语模糊度,我们首先计算所有主题中每个搜索词的频率。使用这个频率,我们计算出每个词的模糊度作为频率的倒数。最后,我们计算了每个参与者的平均术语模糊度,作为参与者搜索的所有单词的平均模糊度得分。
在基线时收集所有参与者的标准化、详细的临床数据,然后每年对参与者进行适当的描述[
我们在所有模型中都包含了几个变量,这些变量可能会混淆基于互联网的搜索词与认知功能之间的关系。这些变量包括年龄、性别和受教育年限,因为这些变量可能与认知能力下降有关。
我们首先计算了所有变量的描述性统计。其中包括对个人进行的平均搜索次数,每次搜索的平均单词数,搜索的每个单词中的平均字母数,以及搜索的术语的平均晦涩程度。
接下来,我们运行了3个线性回归,每个回归都以认知z分数作为结果变量。第一个线性回归模型建立了认知功能与每次搜索输入的唯一搜索词数量之间的关系。第二次回归模拟了搜索单词的平均长度与认知功能之间的关系。第三次回归模拟了认知功能和平均术语模糊之间的关系。为了确保系数估计不受多重共线性的偏倚,对所有自变量计算方差膨胀因子(VIF),这是评估自变量共线性水平的标准诊断工具。所有变量的VIF都小于2.5,表明任何多重共线性的偏差都可以合理地忽略[
在6个月的监测期间,参与者进行了中位数为22次(四分位数间距,IQR 7.3)的搜索(
中展示了搜索词数据集的丰富程度
模型中包含的变量的描述性统计。
变量 | 统计 | 范围 |
搜索次数,中位数(IQR,四分位数范围) | 22日(7.3) | (1 - 718) |
平均搜索字数(SD) | 3.08 (1.57) | (22页) |
每个单词的平均字母数(SD) | 5.77 (2.23) | (28) |
单词晦涩,意思(SD) | 0.25 (0.11) | (0.52 - -0.04) |
过去一年参与者搜索的社交网络图。如果搜索词出现在同一搜索中,它们就会相互连接,而更强的连接表明它们一起出现的频率更高。每个项的大小由节点的度数确定,它表示连接到该项的唯一项的数量。术语按社区着色,经常一起搜索的术语被分组到同一个社区中。
三种线性回归的结果见
在第一个模型中,我们测试了更高的认知功能是否与每次搜索输入的唯一搜索词有关。如图所示
在我们的第二个模型中,我们测试了更高的认知功能是否与搜索时使用较长的单词有关。如图所示
在我们最后的回归中,我们测试了具有更高认知功能的个体在搜索互联网时是否会使用更多模糊的词。如图所示
在所有模型中,年龄与认知功能显著相关,因此老年人的认知功能较低。在任何模型中,性和教育都与认知功能没有显著关联。
三个有关网络搜索与认知功能的线性回归结果。
特征 | 模型1 | 模型2 | 模型3 |
|
Beta系数(SD) | Beta系数(SD) | Beta系数(SD) |
常数 | 综合成绩(0.96) | 1.24 (1.10) | 1.53 (0.98) |
年龄 | −.024(0.007)一个 | −.024(0.008)b | −.024(0.007)c |
性别(女) | 10 (0.20) | .19 (0.23) | .136 (0.22) |
教育 | .016 (0.038) | .006 (0.043) | .005 (0.041) |
每次搜索的唯一词数 | 点(0.13)b |
|
|
每个单词的平均字母数 |
|
.084 (0.806) |
|
平均术语模糊度 |
|
|
1.39 (0.68)d |
一个
b
c
d
认知功能与(a)每次搜索的平均唯一词数,(b)每个单词的平均字母数,以及(c)平均术语模糊度之间关系的散点图。观察到的每个关系的回归线也绘制为虚线。
在这项研究中,我们使用WorkTime连续监测74名老年人的电脑使用情况。WorkTime记录人们在进行基于互联网的搜索时所搜索的术语。使用来自42名受试者的搜索词数据,他们在6个月内完成了至少一次搜索(3个月前或3个月后)认知评估,我们证明了认知功能与每次搜索输入的唯一术语的平均数量和搜索词的模糊程度有关。这些结果首次向我们展示了语言使用的一个连续方面,即网络搜索词,与老年人的认知能力有关。后续分析应该在症状前的老年人中纵向评估这种关系,以确定是否可以使用持续的互联网搜索词评估来识别最终会过渡到轻度认知障碍的个体。
我们的第一个假设是,拥有更高认知功能的人会在搜索中使用更独特的术语。我们的结果支持这一假设,其结果可能被认为与在类别和音素流利性的标准心理测量任务中表现良好所需的词汇或生成流利性一致。先前的研究已经证实,音位和类别流畅性测试的表现会随着认知功能的改变而下降[
我们的第二个假设是,拥有优越认知功能的人会使用较长的单词进行搜索。然而,我们的结果并不支持这一假设。这也与之前的研究一致,即单词长度与图片命名能力的关系不如术语模糊程度[
这项研究有几个局限性。值得注意的是,这项研究的参与者主要是受过良好教育的白人,相对健康的老年人。这里报告的结果可能不适用于其他人群。样本量也很小,因此我们只控制了少数变量。未来的研究应该调查诸如社会网络规模、社会经济地位、计算机流利程度或药物使用等变量是否对本文报道的结果有任何影响。计算机流畅性可能尤其重要,因为在计算机使用方面可能存在显著差异,而不是由于认知能力下降,而是由于熟悉和接触计算机[
此外,我们将模型中包含的搜索词限制为仅来自四个主要搜索引擎的搜索词:Google、Bing、Yahoo和Ask.com。虽然这些是这些老年人使用的主要搜索引擎,但可能不是所有的搜索都被捕获,因为一些参与者可能使用其他不太常见的搜索引擎搜索互联网。
我们也没有办法确定参与者是否使用自动填充来自动完成他们的搜索。一些搜索浏览器提供了对搜索中可能剩下的词给出建议的选项,通常使用来自参与者和更大的公众的流行搜索查询来通知建议。如果参与者在进行搜索时使用这种软件,它将向搜索词数据集中注入人工噪声。未来的研究应该在所有参与的浏览器中禁用自动完成功能的数据集中验证这里给出的结果。
我们使用了一个基本的词干和拼写检查器。这些实用程序确保单词的共轭词(例如“running”是“run”的共轭词)不会在术语频率字典中被计算两次,并且当拼写错误的单词实际上非常频繁但拼写错误时,它们不会被视为高度模糊的术语。然而,这两个实用程序都不能完美地执行。例如,当词干器正确地将“wolves”拼写为“wolf”时,它错误地将“dies”拼写为“dy”。一个更复杂的拼写检查器和词干器可能会加强未来的研究。
我们对术语模糊度的测量仅仅是该词在搜索数据集中出现频率的倒数。这是必要的,因为像“Gmail”这样的多个单词在互联网上很常见,但却没有常见的单词频率或罕见度衡量标准。然而,由于主题搜索既用于开发术语频率字典,又用于评估每个主题的平均单词晦涩度,因此搜索互联网的个人可能拥有较低的平均术语晦涩度,因为他们的搜索短语和术语更频繁地输入数据集。事实上,搜索次数与平均单词模糊度呈负相关(
WorkTime不仅可以监控人们在互联网上搜索的术语,还可以监控电脑使用的详细方面,如花在在线游戏或社交网站上的时间。因此,未来的研究可能会受益于评估认知功能与电脑使用的多个方面之间的关系,特别是最近的研究表明,花在电脑上的总时间和电脑会话次数与认知能力下降有关[
这项工作独特地评估了日常语言功能之间的关系,通过基于互联网的搜索和认知功能。一些研究表明,词汇量、语言流畅性和语义能力等语言能力与认知功能的整体变化之间存在密切关系。这些功能通常通过标准化的间歇性认知测试来评估。以前的研究无法在一定水平上分析这种认知结构,从而为认知衰退提供可扩展的早期检测方法。这可能部分是由于缺乏提供日常语言使用频繁样本的方法。本文提出的方法利用了计算机软件的优势,它可以在日常计算机使用过程中持续而不显眼地捕获语言和相关复杂认知活动的各个方面。此外,与之前的工作不同,要分析的数据本质上是生态有效的,因为正在评估的是个体的日常功能。在这里展示的关系的基础上,有可能开发出一种系统,通过持续监测人们在互联网上搜索的术语以及日常计算机使用的其他方面,来检测阿尔茨海默病的前驱阶段。
阿尔茨海默病
临床痴呆评分
累积疾病评定量表
轻度认知障碍
简易精神状态检查
通货膨胀系数
这项研究得到了俄勒冈州公民通过俄勒冈慈善支票计划的阿尔茨海默病研究基金的部分支持。该基金由俄勒冈州阿尔茨海默病研究伙伴关系管理。此外,美国国家老龄研究所拨款R01 AG042191、P30 AG008017和P30 AG024978也为支持本研究做出了重要贡献。
没有宣布。