发表在20卷11号(2018): 11月

评估谷歌趋势研究中的方法、工具和统计方法:系统回顾

评估谷歌趋势研究中的方法、工具和统计方法:系统回顾

评估谷歌趋势研究中的方法、工具和统计方法:系统回顾

审查

1斯特林大学计算科学与数学系,英国苏格兰斯特林

2希腊色雷斯德谟克利特大学环境工程系

通讯作者:

amarylis Mavragani,理学学士,理学硕士

计算科学与数学系

斯特林大学

斯特林,苏格兰,FK94LA;

联合王国

电话:44 7523782711

电子邮件:amaryllis.mavragani1@stir.ac.uk


背景:在信息过载的时代,大数据分析是获取和更好地管理可用知识的答案吗?在过去十年中,在公共卫生问题(即信息流行病学)中使用基于网络的数据已被证明有助于评估人类行为的各个方面。谷歌趋势是收集此类信息的最受欢迎的工具,到目前为止,它已被用于几个主题,其中健康和医学是最受关注的主题。对基于网络的行为进行监测和分析是为了检查实际的人类行为,从而预测、更好地评估甚至预防日常生活中不断出现的与健康相关的问题。

摘要目的:本系统综述旨在报告并进一步介绍和分析2006年至2016年与健康相关主题的谷歌趋势(信息流行病学)研究的方法、工具和统计方法,以概述所述工具的有用性,并为该主题的未来研究提供参考。

方法:根据系统评价和荟萃分析的首选报告项目选择研究指南,我们从2006年到2016年在Scopus和PubMed数据库中搜索了术语“Google Trends”,并应用了特定的出版物类型和主题标准。总共提取了109篇已发表的论文,不包括重复和不属于卫生和医学主题或所选文章类型的论文。然后,我们根据他们的方法,即可视化、季节性、相关性、预测和建模,进一步对已发表的论文进行分类。

结果:根据定义,所有被检查的论文都包括时间序列分析,除了两篇外,其余都包括数据可视化。共有23.1%(24/104)的研究使用Google Trends数据来检验季节性,39.4%(41/104)和32.7%(34/104)的研究分别使用相关性和建模。只有8.7%(9/104)的研究使用谷歌趋势数据进行健康相关主题的预测和预测;因此,使用谷歌趋势数据进行预测显然存在差距。

结论:在线查询的监控可以提供对人类行为的洞察,因为这个领域正在显著地持续增长,并且在未来将被证明对评估行为变化更有价值,并为使用其他方式无法访问的数据的研究提供基础。

医学互联网学报,2018;20(11):e270

doi: 10.2196 / jmir.9366

关键字



大数据的特点是8v [1]:体积(呈指数增长的体积)[2],品种(广泛的数据集),速度(高处理速度)[3.],真实性,价值[45]、可变性、易变性和有效性[1]。大数据在预测和更好的决策方面显示出巨大的潜力[1];虽然用传统方法处理这些数据是不够的[6,它们正在不断地被整合到研究中。7用新颖的方法和方法。

在线搜索查询的分析在学术研究中的大数据分析领域非常受欢迎[89]。随着互联网的普及程度不断提高,使用搜索流量数据、社交媒体数据以及其他基于网络的来源和工具的数据,可以帮助我们更好地理解和分析基于网络的行为和行为变化[10]。

使用基于web的数据分析行为的最流行的工具是谷歌趋势11]。在线搜索流量数据被认为是一个很好的互联网行为分析工具,而谷歌趋势是预测人类行为变化的可靠工具;经过精心挑选的搜索词,谷歌数据可以准确地衡量公众的兴趣[12]。谷歌趋势为大数据领域提供了新的机会,因为它已被证明是有效的[13]并已被证明是有价值的[1415],准确的[16]和有益的[17进行预测。因此,使用基于web的查询来检查如果不使用大数据就很难甚至不可能探索的主题和问题会产生巨大的潜力。对网络活动的监测是公众行为的有效指标,它已被有效地用于预测[1819],临近预报[20.]和预测[172122]。

Google趋势显示了任何国家或地区在选定时间段内的任何选定术语的时间序列的在线兴趣变化,例如,特定的一年,几年,3周,4个月,30天,7天,4小时,1小时或指定的时间框架。此外,不同地区的不同术语可以同时进行比较。数据以“。csv”格式从网上下载,并作如下调整:搜索结果与查询的时间和位置成比例:每个数据点除以它所代表的地理和时间范围的总搜索量,以比较相对流行度。否则,搜索量最大的地方总是排名最高。然后根据主题在所有主题的所有搜索中所占的比例,将结果数字按0到100的范围进行缩放。显示相同搜索次数的不同区域并不总是具有相同的总搜索量“(23]。

医疗保健是大数据应用较为广泛的领域之一[2425],该领域的出版物数量大幅增加[26]。研究人员已经把重点放在检查基于网络的健康和医学相关主题的搜索查询上[27]。Google Trends的数据已被证明在预测、检测疫情和监测兴趣方面很有价值,如下所述,而政府官员和政策制定者可以对这些应用程序进行分析和评估,以应对各种健康问题和疾病发生。

互联网数据的监测和分析属于信息流行病学的研究领域,即利用从网络来源收集的数据,旨在为公共卫生和政策提供信息[28]。这些数据具有实时的优点,因此解决了从收集数据到分析和预测的长时间延迟问题。在过去十年中,信息流行病学领域已被证明在评估健康主题、从例如Google检索基于网络的数据方面具有很高的价值[2930.],推特[31-34]、社交媒体[3536],或≥2个基于web的数据源的组合[3738]。

由于使用谷歌趋势来检查人类行为是相对新颖的,评估谷歌健康数据的新方法不断出现。到目前为止,已经研究了几个主题,例如癫痫[3940],癌症[41],血栓形成[42]、矽肺病[43],以及各种医疗程序,包括癌症筛检[4445],减肥手术[46]和激光眼科手术[47]。

另一个上升趋势是对有争议问题的兴趣变化的测量[4849]和与药物有关的主题,例如搜索处方[50]或非法药物[5152]。此外,谷歌趋势数据已被用于检查对医疗保健系统各个方面的兴趣[53-55]。

除上述外,Google Trends数据在衡量公众对各种疫情或事件的反应方面也很有用,例如对中东呼吸综合征流行的关注[56],埃博拉爆发[57],麻疹[58]和猪流感[59],以及媒体报道对网络兴趣的影响[60]。据报道,当与公众人物或名人相关时,谷歌对相关术语的查询会增加或达到峰值[61-65]。

谷歌趋势在研究各种疾病和健康问题的季节性趋势方面也很有价值,比如莱姆病[66]、尿路感染[67],哮喘[30.]、静脉曲张治疗[68打鼾和睡眠呼吸暂停[69]。此外,Deiner等[70表明谷歌趋势和临床诊断确实存在相同的季节性。另据报道,谷歌搜索烟草的季节性与谷歌搜索肺癌的季节性是相关的[71],而网上对过敏性鼻炎的查询与现实生活中的情况具有相同的季节性[72]。因此,我们观察到,除了衡量公众利益之外,Google Trends研究表明,在线搜索流量数据的季节性可以与所搜索疾病的实际病例的季节性相关。

如上所述,到目前为止,谷歌查询已经被用来检查人们对药物的普遍兴趣。更进一步,Schuster等人[73[]发现用于治疗血脂异常的立普妥他汀的全球收入百分比变化与谷歌搜索量之间存在相关性,而其他一些研究也报告了这一方向的发现,即网络搜索与处方开具之间的相关性[74-76]。流感的检测和监测在健康评估中也得到了显著的普及。来自谷歌流感趋势的数据已被证明与官方流感数据相关[7778],而谷歌的相关词条数据与流感样疾病病例相关[79]。

此外,有关自杀的网上搜索查询已显示与实际自杀率有关[8081],而其他表明基于网络的数据与人类行为之间关系的例子包括官方数据与兽医问题的互联网搜索之间的相关性[82,睡眠剥夺[83]、性传播疾病[84],埃博拉相关搜索[85]和过敏[8687]。

此外,Zhou等[88展示了如何利用谷歌趋势数据改进结核病暴发的早期发现;虽然自杀率和谷歌数据似乎有关联,但前者被认为是制定自杀预防政策的一个很好的指标[89]。此外,冰毒犯罪行为已被证明与搜查冰毒有关[90]。最后,最近关于使用Google Trends进行预测和预测的研究包括百日咳发生的预测模型的开发[91],而网上搜索查询已被用来预测痴呆症的发病率[92]及耳表面抗生素的处方量[93]。

到目前为止,谷歌趋势数据已经被用于研究兴趣的变化和评估人类行为的有用性,考虑到主题的多样性,很明显,在线搜索流量数据的分析在探索和预测行为变化方面确实是有价值的。

2014年,Nuti等[27发表了一篇对谷歌趋势研究的系统综述,其中包括截至2013年的年份。这篇综述作为该领域的第一篇非常重要,它报告了谷歌趋势研究到那时为止的情况。目前的综述在两个方面与Nuti等人的不同。首先,它包含了3个更完整的年份,即2014年、2015年和2016年,根据我们的选择标准,这3个年份占了本领域研究的绝大多数。其次,本文的第一部分是系统综述,报告标准信息,即作者、国家、地区、关键词和语言,第二部分对本文中使用的方法、途径和统计工具进行了详细的分析和分类。因此,它不仅可以作为谷歌趋势研究的主题或主题的参考点,还可以作为分析或方法的参考点。


本综述的目的是纳入自2006年至2016年使用谷歌趋势数据以来所有关于健康和医学主题的文章。我们在Scopus中搜索了“Google趋势”这个词[94]和PubMed [95]数据库,并遵循系统评价和荟萃分析指南的首选报告项目(图1),本综述纳入的出版物总数为109篇。

图1所示。系统评价和荟萃分析的首选报告项目纳入研究的选择程序流程图。
查看此图

首先,我们在Scopus中搜索“Abstract-Title-Keywords”字段中的“Articles”、“Articles in press”、“Reviews”和“Conference papers”中的关键词“Google Trends”,检索时间为2006年至2016年。在可用的类别中,我们选择了“医学”、“生物化学遗传学和分子生物学”、“神经科学”、“免疫学和微生物学”、“药理学、毒理学和药物”、“健康专业”、“护理”和“兽医”。搜索返回了102份出版物。其次,我们在2006年至2016年的PubMed中搜索关键词“Google Trends”,共提供141篇出版物。除去重复的84篇,有159篇出版物符合我们的标准。排除不符合文章类型标准的研究(10篇)和不属于卫生与医学范畴的研究(40篇),本综述共纳入109项研究。注意,有5项研究是用英语以外的语言撰写的,因此没有包括在定量部分或每项研究方法的详细分析中。图2描述2009年至2016年各年的出版物数量:2009年2篇,2010年3篇,2011年2篇,2012年1篇,2013年12篇,2014年21篇,2015年28篇,2016年40篇。

根据所选研究的方法进行进一步分析,并讨论该工具的差距,优势和局限性,以协助未来的研究。因此,我们根据研究论文所属的主要类别,即可视化和一般时间序列分析、季节性、相关性、预测或预测、建模和使用的统计方法或工具,对研究论文进行了更详细的分类。请注意,一项研究可以分为>1个类别。个别医学领域的分类是不适用的,因为大量的个别主题。表1由用于对每个研究进行分类的每个参数的描述组成。

图2。2009年至2016年,谷歌趋势每年在健康相关领域的出版物。
查看此图
表1。用于分类的参数说明。
参数 描述
作者 包括作者的姓氏、出版日期和参考书目的链接(例如:Smith等人,2016 [57])。
指检索Google趋势数据并将其用于研究的时间框架(例如:2004 - 2015)。
地区 指一个或多个国家或地区(如:美国;在世界范围内;大洋洲),谷歌趋势数据被提取出来。
语言 指进行谷歌趋势搜索时使用的语言(例如,搜索意大利语单词)如果)。
关键字 基本关键字包括在这一类中,主要是指所研究的健康主题和用来描述它的重要关键字。
可视化(V) 包括任何形式的可视化,即数字,地图和截图(例如,谷歌趋势网站的截图)。
季节性(S) 研究已经探讨了各自主题的季节性包括在内。
相关性(C) 检验相关性的研究属于这一类。相关性可能存在于Google Trends数据和官方数据之间、Google Trends时间序列之间,或者Google Trends和其他基于web的来源的时间序列之间。
预测(F) 这类研究包括使用谷歌趋势数据对谷歌趋势时间序列或疾病、疫情等进行预测的研究,与所使用的方法无关。
建模(米) 这类研究使用谷歌趋势数据进行了某种形式的建模。
统计工具(St) 这一类包括使用统计工具或测试的研究,例如:t测试。统计建模的工具和方法(例如:回归),不包括在此类别中,而只包括在建模类别中。

多媒体附录1包括所选研究的第一种分类[2739-5759-9396-144];总共有104个,正如Kohler等人的研究[145], Orellano等[146], Cjuno等[147], Tejada-Llacsa [148], Yang等[149]是用德语、西班牙语或中文写的,因此不包括在更详细的分类和分析中。

根据定义,所有的考卷都涉及时间序列分析,而且几乎所有的考卷都包含某种形式的可视化。只有8.7%(9/104)的研究使用谷歌趋势数据进行预测和预测,23.1%(24/104)的研究使用谷歌趋势数据来检查季节性,而39.4%(41/104)和32.7%(34/104)的研究分别进行了相关性和建模。由于预测和预测类别显示的研究数量最少,因此很明显,在使用谷歌趋势进行健康评估的预测文献中存在空白。

正如在多媒体附录1到目前为止,谷歌查询已经在许多国家和几种语言中使用。图3使用谷歌趋势数据,显示了截至2016年的全球地图,按被检查国家评估健康和医学相关问题。在全球范围内,探索与各自术语相关主题的研究共有23项。就单个国家而言,美国的数据被用于最多的研究(60),而其他被大量研究的国家包括英国(15)、澳大利亚(13)、加拿大(9)、德国(8)和意大利(7)。

被调查最多的四个国家都是说英语的国家。这样做的原因可能包括:谷歌趋势虽然不区分大小写,但它会考虑口音和拼写错误;因此,对于字母比较复杂的国家,对基于网络的数据的分析应该更加小心。此外,在选择使用在线搜索流量数据进行审查的国家时,可能发挥重要作用并予以考虑的其他因素包括官方数据的可用性、所述数据的开放性、在新闻自由或言论自由得分较低的国家中对互联网的任何限制或监控,以及互联网普及率。

分析的其余部分包括进一步细分初始分类,包括用于检查季节性、相关性、预测、执行统计测试和估计模型的各自方法,以及对每种方法的简要介绍以及如何使用它们来评估健康问题。

表2展示了用于探索季节性的方法;表34分别介绍用于检验相关性和执行预测和预测的方法。最后,表56列出使用Google Trends进行健康评估时使用的建模方法和其他统计工具。

探索季节性最流行的方法是使用视觉证据,检查和讨论峰值,如图所示表2。此外,一些研究使用余弦分析[869134138142],是一种利用最小二乘法对季节数据进行时间序列分析的方法。

除季节性外[122],方差分析(ANOVA)也被用于地区或国家之间的地理比较[49516893]和月度数据差异之间的关系[41]。这是一种检验方法,用于检查平均数之间是否存在显著差异。2表示,t检验相当于方差分析。

Kruskal-Wallis测试也是一种使用谷歌趋势检测季节性的流行方法[5768113]。它是一个非参数的、独立于分布的检验,适用于连续和有序水平的因变量,当单向方差分析假设不成立时,即用于检验≥3组之间的统计学显著差异。它使用具有独立观测值的随机样本,因变量至少是有序的。

图3。使用谷歌趋势按Scopus和PubMed出版物数量排序的国家。
查看此图

其他探索季节性的方法包括非参数检验(独立于分布)。18113]和曼-惠特尼测验[67],用于比较不同季节或时段的数据,当参数相等时t无法使用测试。后者也被一些研究用来比较每周的数据[105]和地区间的差异[113]。

要检验相关性(表3),绝大多数研究使用Pearson相关系数,该系数用于检验两个定量连续变量之间的关联强度,当关系是线性时使用。Spearman rho(秩序)相关是第二常用的方法,是Pearson相关的非参数版本,也被用于探索时间序列之间的季节性[70]。Spearman相关系数(表示为ρr年代)衡量两个排序变量(序数、间隔或比率)相互关联的程度。

交叉相关用于检验两个时间序列之间的关系,同时探索数据是否具有周期性。它通常用于将Google趋势数据与观测数据相关联[508290135]和不同的谷歌搜索词之间[80],但它也可用于检验季节性数据的线性和时间关联[71]。相互关系也被用于预测,Wang等人[92]表明,新发痴呆病例与Google Trends数据的相互关联有助于痴呆病例的预测,Solano等[80通过谷歌查询预测了未来两年的自杀率。自相关基本上是一个时间序列的交叉相关,也就是说,一个时间序列与自身交叉相关。

Kendall 's tau-b检验相关系数是Pearson和Spearman相关性的非参数替代,用于测量两个(至少有序)变量之间关系的强度和方向。它已被用于一项研究[138来检验谷歌趋势数据与纸质访谈调查结果之间的相关性。

Spearman-Brown预测(或预言)公式用于预测测试长度改变后的可靠性。它也只被一项研究使用过[65来探索铁路自杀和谷歌点击量之间的关系。

广义线性模型估计一个因变量和≥1个自变量之间的线性关系。Domnich等人使用了它[79]预测流感样疾病的发病率,探索性变量为“流感”、“发烧”和“他奇匹林搜索量”,残差采用Holt-Winters方法和自回归移动平均过程。Holt-Winters是一种用于探索时间序列季节性的方法,对于预测,自回归移动平均(也称为Box-Jenkins模型)是自回归综合移动平均的一种特殊情况,用于分析时间序列和预测。

自回归综合移动平均线是时间序列分析和预测的常用方法[55638692141],后者也通过线性回归和模型进行了评估[8891]。多变量回归用于估计≥2个自变量与一个因变量之间的关系。在谷歌趋势中,它们被用来将埃博拉搜索、报告病例和人类发展指数联系起来[85]并研究气候和环境变量与谷歌点击量之间的关系[125]。

层次线性模型是一种普通最小二乘回归,用于分析层次结构的数据,即分组在一起的单元,目前已有1项研究采用了层次线性模型[83]。

Mann-Kendall检验是独立样本的非参数替代检验,用于显示峰值的统计差异[43]和发现趋势[140]。最后,t检验用于比较同一总体的两个样本均值,并已被用于比较Google搜索与基线期[105]并检查峰值的统计差异[41]。

表2。利用谷歌趋势探索健康评估的季节性方法。
数量 作者 方法 描述
1 Bakker et al, 2016 [96 Morlet小波分析 为了测试谷歌趋势数据在被调查国家的季节性
2 Braun and Harreus, 2013 [104 视觉证据 N/A一个
3. Crowson等人,2016 [93 季节性高峰 N/A
4 Deiner等人,2016 [70 斯皮尔曼相关 将临床诊断的季节性与谷歌趋势数据相关联
5 El-Sheikha, 2015 [113 克鲁斯卡尔-沃利斯检验 显示不同月份的季节性
6 Garrison等,2015 [116 最小二乘正弦模型 结果的可变性(也来自与澳大利亚搜索的比较)
7 Harsha等人,2014 [68 克鲁斯卡尔-沃利斯检验 季节(月)比较
8 Harsha等,2015 [119 克鲁斯卡尔-沃利斯检验 季节(月)比较
9 Hassid等人,2016 [120 皮尔森相关 检查症状的季节性变化
10 英格拉姆和普兰特,2013 [122 Cosinor分析;方差分析 测试归一化Google趋势数据的季节变化;比较受调查国家间的季节性增长
11 Ingram et al ., 2015 [69 Cosinor分析 为了测试标准化的谷歌趋势数据的季节变化
12 Kang等,2015 [72 视觉观察 N/A
13 Leffler等,2010 [125 相关性 显示了39个被检查的术语在四个季节之间的相关性
14 刘等,2016 [127 季节模型和零模型 通过f检验,季节性因素能更好地解释搜索结果
15 Phelan et al ., 2016 [133 相关图(自相关图) 探索季节高峰的视觉诠释
16 Plante and Ingram, 2014 [134 Cosinor分析 为了测试标准化的谷歌趋势数据的季节变化
17

Rossignol et al, 2013 [67 曼-惠特尼检验;谐波积谱 夏季与冬季热门电影的比较;季节性评价
18 Seifter等,2010 [66 视觉证据 N/A
19 Sentana-Lledo等,2016 [138 Cosinor分析 来测试谷歌趋势数据的季节性变化
20. 高田,2012 [139 视觉证据 N/A
21 特尔弗和伍德伯恩,2015 [140 双向Wilcoxon符号秩检验 探索冬季和夏季的差异
22 Toosi和Kalia, 2015 [142 视觉证据;cosinor分析 确定不同国家之间的季节性差异
23 wilson等人,2015 [86 视觉证据 N/A
24 张等,2015 [71 周期图;理想通滤波器 研究周期图;提取季节成分

一个-不适用。

许多研究使用谷歌趋势来可视化在线兴趣的变化或讨论峰值和峰值[6062123124]。布里哥和Trinka [40]和Brigo等人[39]研究了相关术语的搜索量,Chaves等[109]和Luckett等人[128]研究了与研究主题相关的术语,而Davis等人[110调查了相关的互联网搜索。其他方法包括报告多项式趋势线[46],并对年增长率的统计显著差异进行调查[119]。此外,“Google关联”已被用于探索相关术语[91138]。

最后,有几项研究使用了其他大数据来源,即谷歌新闻[436380],推特[43546163108], Yandex [52]、百度[121],维基百科[4363]、Facebook和Google+ [54]和YouTube [435463]。谷歌是最受欢迎的搜索引擎。然而,在某些地区,其他基于web的资源被使用,甚至比谷歌更受欢迎;因此,许多研究使用来自这些来源的数据来检查对各自主题的普遍兴趣,将它们与Google Trends数据进行比较,或将它们一起用作变量。

表3。使用谷歌趋势在健康评估中探索相关性的方法。
数量 作者 方法 描述
1 Alicino等,2015 [85 皮尔森相关 与埃博拉相关的谷歌趋势数据与埃博拉病例
2 Arora et al ., 2016 [81 斯皮尔曼相关 自杀搜索活动与官方自杀率(以及每个年龄段)
3.

Bakker et al, 2016 [96 相关性 在谷歌趋势数据和报告案例之间
4 Bragazzi et al ., 2016 [99 皮尔森相关 在谷歌趋势数据和流行病学数据之间
5 布拉加齐,2013年[98 自相关;皮尔森相关 对于多发性硬化症(MS)的时间序列;MS项之间
6 Bragazzi et al ., 2016 [101 自相关;偏自相关 计算时间序列与自身值的相关性
7 Bragazzi et al ., 2016 [102 皮尔森相关 癫痫持续状态术语与病因和管理相关的术语
8 Bragazzi et al ., 2016 [43 皮尔森相关 谷歌搜索矽肺病与规范化的谷歌新闻,谷歌学者,PubMed出版物,推特流量,维基百科
9 Bragazzi et al ., 2016 [63 皮尔森相关 在谷歌趋势数据和其他数据生成源
10 Bragazzi, 2014 [103 皮尔森相关;自相关和部分自相关 非自杀性自残及相关术语;非自杀性自伤情节表现出规律的周期性模式
11 Cavazos-Regh et al, 2015 [107 皮尔森相关 在谷歌趋势的非卷烟烟草和流行数据中
12 Cho et al ., 2013 [78 皮尔森相关 谷歌流感相关查询和不同流感季节的监测数据
13 Crowson等人,2016 [93 皮尔森相关 所选关键字之间。在医疗处方数据和谷歌趋势数据之间
14 Deiner等人,2016 [70 斯皮尔曼相关 将临床诊断的季节性与谷歌趋势数据相关联
15 Domnich et al, 2015 [79 皮尔森相关 在检查的搜索词和流感样疾病中
16 Foroughi et al ., 2016 [115 秩相关性;越野相关性;皮尔森相关 查询搜索量;癌症的搜索量;对于国家之间的每周搜索量
17 Gahr等,2015 [75 皮尔森相关 在年度处方量和谷歌趋势数据中
18 Gamma等人,2016 [90 互关联 搜索量和犯罪统计之间的相互关系
19 Gollust等人,2016 [117 多项Logit模型 将健康保险费率联系起来
20. Guernier et al, 2016 [82 斯皮尔曼相关;互相关 将经审查的搜寻关键词与蜱虫麻痹个案纪录的通知相关联;滞后值从−7个月到+7个月
21 Hassid等人,2016 [120 皮尔森相关 在Google趋势数据和全国住院病人样本数据之间
22 Johnson et al ., 2014 [84 皮尔森相关 Pearson相关性来探索Google趋势数据与性传播感染报告率之间的关系
23 Kang等,2013 [77 皮尔森相关 探索搜索词与监控数据之间的关联
24 Kang等,2015 [72 斯皮尔曼相关 谷歌趋势数据变应性鼻炎和相关的谷歌趋势术语和现实世界的流行病学数据为美国
25 Koburger等人,2015 [65 Spearman-Brown相关性 探讨谷歌趋势数据与铁路自杀之间的关系
26 Ling and Lee, 2016 [126 皮尔森相关 在疾病流行和谷歌趋势数据之间
27 Mavragani等人,2016 [76 皮尔森相关 在谷歌趋势数据和发表的论文和谷歌趋势数据与处方之间
28 Phelan et al ., 2016 [133 线性回归 为了检验搜索量和时间之间是否存在显著的相关性
29 Poletto等人,2016 [56 皮尔森相关 在Google趋势数据和ProMED邮件发布的警报数量与世界卫生组织发布的疾病爆发新闻数量之间
30. Pollett等人,2015 [91 皮尔森相关 列出与百日咳相关的搜索词
31 Rohart et al ., 2016 [135 Spearman秩相关;斯皮尔曼相关;互关联 对于检查的疾病;疾病与所调查搜索指标之间的相关性;识别最佳滞后
32 Shin等,2016 [137 斯皮尔曼相关 谷歌趋势数据与中东呼吸综合征确诊病例数和中东呼吸综合征隔离病例数之间的关系
33 Schootman等人,2015 [45 皮尔森相关 呼吸道合胞病毒与行为危险因素监测系统在5种癌症筛查试验中的流行数据
34 Schuster等人,2010 [73 相关性 谷歌趋势数据和立普妥收入
35 Sentana-Lledo等,2016 [138 Kendall的Tau-b测试 探讨Google Trends数据与纸质访谈调查结果的相关性
36 Simmering等,2014 [50 互关联 在谷歌趋势的药物和药物使用数据之间,查看知识事件后搜索量的变化
37 Solano et al ., 2016 [80 相关性;互关联 谷歌趋势的自杀数据和国家自杀率之间的关系;在不同的搜索词之间
38 Wang等,2015 [92 皮尔森相关 谷歌趋势数据和新痴呆病例之间的关系
39 wilson等人,2015 [86 斯皮尔曼相关 在谷歌趋势数据和空气过敏原的观测数据之间
40 张等,2015 [71 互关联 检验季节数据的线性关系和时间关系
41 张等,2016 [51 皮尔森相关 研究谷歌趋势中不同词条搜索的两两比较
表4。在健康评估中使用谷歌趋势进行预测和预测。
数量 作者 方法 描述
1 Bakker et al, 2016 [96 统计模型 用于预测鸡痘感染力,即0-14岁儿童月人均感染率
2 Domnich et al, 2015 [79 广义最小二乘(极大似然估计);Holt-Winters 基于查询的流感样疾病发病率预测模型,探索性变量:流感、发热、他奇匹林;与基于真实数据(hold out set)的Holt-Winters的预测能力比较
3. Parker等人,2016 [132 统计模型 提前1年预测死亡人数(2015年)
4 Pollett等人,2015 [91 预测模型 用遗漏的数据集测试预测模型的预测精度
5 Rohart et al ., 2016 [135 线性模型 以1或2周的步骤进行预测
6 Solano et al ., 2016 [80 互关联 基于谷歌趋势数据的无数据2年(2013-14年)自杀预测
7 Wang等,2015 [92 互关联 研究0-12个月的滞后预测
8 张等,2016 [51 自回归移动平均 呼吸道合胞体病毒的“轻触”预测
9 周等,2011 [88 动态模型 在公布新的发病率数据后,通过校正预测提供实时估计
表5所示。在健康评估中使用谷歌趋势进行统计建模。
数量 作者 方法 描述
1 Alicino等,2015 [85 多元回归 有关埃博拉谷歌趋势数据、埃博拉病例数和人类发展指数
2 Bakker et al, 2016 [96 统计模型 用于预测鸡痘的感染率,即月人均感染率
3. 宾利和奥默罗德,2009年[59 最大似然估计 为基于web的流感术语搜索建立了一种新的社交模式

Barnes et al ., 2015 [83 分层线性建模 三个级别:3个星期一,6年,47个搜索词
4 布拉加齐,2013年[98 多元线性回归 确认多年长期趋势
5 Domnich et al, 2015 [79 广义线性模型,自回归移动平均过程 查询基于量的模型以预测流感样疾病的发病率
6 El-Sheikha, 2015 [113 线性回归 显示对搜索词的全球、地区和国家级别的兴趣
7 Fenichel et al ., 2013 [114 移动平均,广义线性模型 谷歌趋势数据作为预测航班损失的变量
8 Garrison等,2015 [116 季节性模型 直线和正弦波的最佳拟合组合
9 Gollust等人,2016 [117 多项逻辑模型 将健康保险费率联系起来
10 Haney et al ., 2014 [55 华宇电脑一个 放射学住院医师兴趣
11 Harsha等人,2014 [68 线性模型 每年搜索量增加的统计依据
12 Harsha等,2015 [119 线性模型 每年增加的搜索量和基于网络的与介入放射学应用相关的兴趣的统计理由
13 Leffler等,2010 [125 多变量线性回归 获奖理由:研究气候和环境变量对互联网搜索的影响
17 Linkov et al ., 2014 [46 多项式趋势线 每次拟合样条多项式趋势线,无需统计报告
18 刘等,2016 [127 季节性模型 直线和正弦波的最佳拟合组合
19 Majumder等,2016 [129 线性平滑 为了调整HealthMap以使用谷歌趋势,模型拟合
20. Noar等,2013 [64 线性回归 估计斜率系数的变化幅度的影响大小的谷歌趋势数据和媒体搜索的增加
21 Parker等人,2016[132 谷歌趋势的l1正则化 建立一个预测各州死亡人数的模型
22 Phelan et al ., 2014 [49 线性回归 估计新闻报道与搜索活动之间的关系
23 Phelan et al ., 2016 [133 线性回归 为了检验搜索和时间之间是否存在显著的相关性
24 Pollett等人,2015 [91 线性回归 基于Google趋势最相关术语数据的百日咳病例预测模型
25 Rohart et al ., 2016 [135 线性模型 以1或2周的步骤进行预测
26 scatcomet al ., 2016 [136 流行病模型 谷歌趋势数据与其他来源一样,是对认知度的衡量
27 Schuster等人,2010 [73 广义线性模型 被检查药物的谷歌趋势数据,谷歌趋势数据和年收入的变化,以及谷歌趋势数据与资源利用率
28 Stein等人,2013 [47 回归拟合线 检查查询中的差异
29 特尔弗和伍德伯恩,2015 [140 视觉分解;当地的回归 图4、图6、图8;基于回归的时间序列分解搜索项
30. Troelstra et al ., 2016 [141 华宇电脑 考虑“戒烟”搜索的时间序列中数据点之间的依赖关系
31 wilson等人,2015 [86 华宇电脑 量化观察到的(花粉)计数与搜索活动水平的影响
32 wilson等人,2015 [87 华宇电脑 量化观察到的(花粉)计数与搜索活动水平的影响
33 Yang等,2015 [144 预测模型(ARGOb 预测流感样疾病
34 周等,2011 [88 动态建模 利用谷歌趋势数据预测肺结核事件

一个ARIMA:自回归综合移动平均。

bARGO:自回归与谷歌搜索数据。

表6所示。在健康评估中使用谷歌趋势的统计测试和工具。
数量 作者 方法 描述
1 Bragazzi et al ., 2016 [43 Mann-Kendall测试 显示剩余时期峰值的统计差异
2 Bragazzi et al ., 2016 [63 华宇电脑一个 显示由于某一事件而增加的网络搜索量,并校正季节性
3. Campen et al ., 2014 [105 独立样本t测试;采用Bonferroni修正的Mann-Whitney U检验 将搜寻次数与基准期比较;用于多周数据比较
4 Crowson等人,2016 [93 方差分析b(事后Tukey检验) 比较美国联邦地区的地理分组(东北、中西部、南部、西部)
5 El-Sheikha, 2015 [113 Wilcoxon秩检验;Mann-Whitney 研究利息在不同时期的变化;来比较北半球和南半球对网络的兴趣
6 Gahr等,2015 [75 决定系数 确定年度处方量和谷歌搜索词之间的可变性量
7 Harsha等人,2014 [68 方差分析(Tukey-Kramer post hot test) 对于美国地区的比较
8 Murray等人,2016 [41 方差分析;t测试 探讨每年月份平均值的差异;为峰值与剩余命中数的统计差异
9 Noar等,2013 [64 增强迪基-富勒测试 检验时间序列的非平稳性
10 Phelan et al ., 2014 [49 方差分析 探索国家间的差异
11 Rohart et al ., 2016 [135 预测均方误差 评估预测准确性
12 特尔弗和伍德伯恩,2015 [140 曼-肯德尔趋势测试 为了检测明显大于搜索词数据方差的趋势
13 Troelstra et al ., 2016 [141 华宇电脑 利用ARIMA中断时间序列模型研究戒烟政策的效果(多媒体附录1
14 张等,2015 [71 增强迪基-富勒测试 检测所提取的季节成分的研究趋势是否平稳
15 张等,2016 [51 方差分析 为了检查在美国合法地位州之间的搜索兴趣

一个ARIMA:自回归综合移动平均。

b方差分析:方差分析。


主要研究结果

随着互联网的不断普及,用户基于web的搜索模式可以为检查和进一步预测人类行为提供一个很好的机会。在应对大数据分析的挑战方面,谷歌趋势在过去十年中一直是一种流行的研究工具,其主要优势在于它使用的是公开数据,而不是声明数据。到目前为止,健康和医学是谷歌趋势数据用于检查和预测人类行为的最受欢迎的领域。本综述提供了被检查研究的详细概述和分类(2006年至2016年共109项),然后根据用于数据分析的方法、方法和统计工具对其进行进一步分类和分析。

图4。使用谷歌趋势进行健康评估的四个步骤。
查看此图

到目前为止,绝大多数使用谷歌趋势进行健康评估的研究都包括数据可视化,即数字、地图或截图。正如分析中所讨论的,在这一领域使用Google Trends数据最流行的方法是将它们与有关疾病发生、传播和爆发的官方数据相关联。在过去的几年里,对自杀倾向和(处方或非法)毒品相关问题的评估已经明显越来越受欢迎。显而易见,现有文献中的差距是使用谷歌趋势对健康相关主题和问题进行预测和预测。尽管在大量研究中,各种健康问题报告病例的数据与谷歌趋势的相关数据相互关联,但只有少数研究利用在线搜索流量数据对事件和事件进行预测。

从2006年到2016年,在使用谷歌健康和医学趋势的研究中,最终目标是能够使用和分析基于网络的数据来预测和提供洞察力,以更好地评估健康问题和主题。根据迄今为止发表的关于使用Google Trends评估健康的论文的介绍,四个主要步骤如下(图4):

  1. 衡量基于网络的总体兴趣。
  2. 检测基于web的兴趣的任何变化或季节性,并继续检查实际事件或案例之间的任何关系。
  3. 将基于web的搜索查询与它们之间或与官方或实际数据和事件关联起来。
  4. 预测、临近预报和预测与健康相关的事件、爆发等。

限制

本综述遵循系统评价和荟萃分析的首选报告项目指南,从Scopus和PubMed数据库中选择被检查的论文。虽然这包括2006年至2016年期间发表的关于该主题的大多数论文,但未在这些数据库中检索或未根据本综述中使用的选择标准检索的研究未被纳入进一步的分析。此外,显而易见的是图2在美国,利用谷歌趋势数据进行的研究显示,自2013年以来,这一数字每年都在显著增长。该综述包括截至2016年在谷歌趋势研究中发表的研究。然而,2017年和2018年发表的几项研究没有被包括在内。这篇综述首先提供了每个研究的总体描述,这是标准的综述信息。第二部分是对每项研究的方法、工具和结果的分类和评估。虽然第一部分主要报告了每项研究的方法,但第二部分可能会有偏倚,因为这是作者根据对每项研究进行非常仔细和彻底的检查后获得的结果对所采用的方法进行的评估和分类。

结论

本综述基于选定的标准,包括2006年至2016年在Scopus和PubMed数据库中发表的谷歌趋势研究。本综述的目的是为今后使用Google Trends进行健康评估的研究提供参考,因为每项研究除了提供基本信息(如时期、地区、语言)外,还根据从Google Trends检索到的数据分析所采用的方法、方法和统计工具进行了分类。谷歌趋势数据在信息流行病学研究中得到了更多的整合,而基于网络的数据已被证明在许多主题中与官方健康数据具有经验相关性。因此,很明显,这一领域将在未来的健康评估中越来越受欢迎,因为收集实时数据对于监测和分析季节性疾病以及流行病和爆发至关重要。

利益冲突

没有宣布。

多媒体附录1

出版物详细信息和分类。

PDF档案(adobepdf档案),256KB

  1. Al Nuaimi E, Al Neyadi H, Mohamed N, Al jaroodi J.大数据在智慧城市中的应用。[J]互联网服务应用2015;6(1):1-15。[CrossRef
  2. 希尔伯特M, López P.世界存储、交流和计算信息的技术能力。Science 2011 Apr 01;332(6025):60-65 [免费全文] [CrossRef] [Medline
  3. Philip Chen C, Zhang C.数据密集型应用、挑战、技术与技术:大数据研究综述。信息科学,2014;27:314-347。[CrossRef
  4. 金霞,华宝伟,程霞,王勇。大数据研究的意义与挑战。大数据研究2015;2(2):59-64。[CrossRef
  5. foso Wamba S, Akter S, Edwards A, Chopin G, Gnanzou D.“大数据”如何产生重大影响:来自系统回顾和纵向案例研究的结果。国际生产经济学杂志2015年7月;165:234-246。[CrossRef
  6. 张瑞荣,考夫曼RJ,权宇。大数据时代计算社会科学的范式转变。决策支持系统[j]; 2014;63:67-80。[CrossRef
  7. 《超越炒作:大数据的概念、方法和分析》国际信息管理学报,2015;35(2):137-144。[CrossRef
  8. 何鸿燊,何鸿燊,何晓普。展望未来的量化优势。科学通报2012年4月2日[j]免费全文] [CrossRef] [Medline
  9. Preis T, Moat HS, Stanley HE。使用谷歌趋势量化金融市场的交易行为。科学通报2013;3:1684 [j]免费全文] [CrossRef] [Medline
  10. 李建军,李建军,李建军,等。通过计算Twitter分析来检测在线社区的紧张局势。科技预测与社会变革[j]; 2015;95:96-108。[CrossRef
  11. 谷歌趋势。URL:https://trends.google.com/trends/explore[访问日期:2017-11-08][WebCite缓存
  12. 王晓明,王晓明。基于搜索引擎查询的公共议程度量。国际舆论研究学报,2011;23(1):104-113。[CrossRef
  13. 麦卡勒姆ML,伯里GW。公众对环境的兴趣正在下降:对菲切托拉(2013)的回应。生物潜水保护2014 Feb 14;23(4):1057-1062。[CrossRef
  14. 李军。消费者信息搜索行为与购买决策:来自韩国的经验证据。科技预测与社会变革2016;07:97-111。[CrossRef
  15. 李建军,杨建军。利用搜索流量信息探索消费者产品态度和预测消费者偏好的可能性。技术预测与社会变革2014;07;86:237-253。[CrossRef
  16. 韩松,钟华,姜波。是时候为未来做准备了:预测社会趋势。通信与信息学报,2012:e2012-e2031。
  17. 个人消费预测:基于调查的指标与谷歌趋势。[j] .气象预报,2011,30(6):565-578。[CrossRef
  18. 崔海,瓦里安。用谷歌趋势预测当下。的经济记录。(SUPPL.1) 2012; 88:2-9。[CrossRef
  19. 马夫拉格尼A,察加拉基斯KP。是或否:用谷歌趋势预测2015年公投结果。科技预测与社会变革2016;08:1-5。[CrossRef
  20. 李彦宏,李彦宏。基于Google趋势的新兴市场即时预测。[j] .气象学报;2011;32(4):289-298。[CrossRef
  21. 利用互联网搜索数据预测失业:当工作岗位急剧减少时,它是否有助于改进预测?科技预测与社会变革2015;02:132-139。[CrossRef
  22. 李建军,杨军,孙军。基于搜索流量的新技术应用分析方法研究。技术预测与社会变革[j]; 2014(1):82-95。[CrossRef
  23. 谷歌。趋势数据如何调整https://support.google.com/trends/answer/4365533?hl=en[访问日期:2017-11-08][WebCite缓存
  24. 范静,韩峰,刘华。大数据分析面临的挑战。自然科学进展,2014;1(2):293-314 [j]免费全文] [CrossRef] [Medline
  25. 刘军,刘志强。基于机器学习的医学大数据分析方法。国际神经学报,2014;18(2):50-57 [J]免费全文] [CrossRef] [Medline
  26. 顾东,李军,李旭,梁晨。医疗信息领域知识结构可视化与大数据研究演进。中华医学杂志,2017,12(1):22-32。[CrossRef] [Medline
  27. Nuti SV, Wayda B, Ranasinghe I, Wang S, Dreyer RP,陈思,等。谷歌趋势在医疗保健研究中的应用:系统回顾。PLoS One 2014;9(10):e109583 [j]免费全文] [CrossRef] [Medline
  28. 信息流行病学和信息监控:一套新兴的公共卫生信息学方法框架,用于分析互联网上的搜索、交流和出版行为。医学信息学报,2009;11(1):11 [J]免费全文] [CrossRef] [Medline
  29. Phillips CA, Barz LA, Li Y, Schapira MM, Bailey LC, Merchant RM。美国州级谷歌在线搜索量与癌症发病率的关系:回顾性研究[J]医学互联网研究,2018,08;20(1):e6 [J]免费全文] [CrossRef] [Medline
  30. 马夫拉格尼A, Sampri A, Sypsa K, Tsagarakis KP。在美国医疗保健系统中整合智能健康:谷歌时代哮喘监测的信息流行病学研究。JMIR公共卫生监测2018年3月12日;4(1):24 [j]免费全文] [CrossRef] [Medline
  31. 推特上的疫苗图片:图片共享的分析。医学互联网研究,2018年04月03日;20(4):e130 [J]免费全文] [CrossRef] [Medline
  32. Farhadloo M, Winneg K, Chan MS, Hall JK, Albarracin D. Twitter上讨论话题与寨卡病毒相关态度、知识和行为的调查测量的关联:美国的概率研究。JMIR公共卫生监测2018年2月09日;4(1):e16 [j]免费全文] [CrossRef] [Medline
  33. 辛普森SS,亚当斯N,布鲁格曼CM,康纳斯TJ。使用自然语言处理检测新出现的药物术语:一项社会媒体语料库研究。JMIR公共卫生监测2018;08;4(1):e2 [j]免费全文] [CrossRef] [Medline
  34. van Lent LG, Sungur H, Kunneman FA, van de Velde B, Das e。用推特衡量公众对埃博拉的关注和恐惧。医学互联网研究,2017年6月13日;19(6):e193 [J]免费全文] [CrossRef] [Medline
  35. 王晓明,王晓明,王晓明,等。社交媒体时代心理健康障碍研究综述。医学互联网研究,2017年6月29日;19(6):e228 [J]免费全文] [CrossRef] [Medline
  36. 刘建军,张建军,张建军,等。Facebook上乳房x光检查和乳腺癌相关信息的共享频率研究。医学互联网研究2017 Jun 09;19(6):e201 [J]免费全文] [CrossRef] [Medline
  37. 卢福生,侯森,Baltrusaitis K, Shah M, Leskovec J, Sosic R,等。使用新型互联网数据流的准确流感监测和预测:波士顿大都会的案例研究。公共卫生监测2018年1月09日;4(1):e4 [j]免费全文] [CrossRef] [Medline
  38. Roccetti M, Marfia G, Salomoni P, Prandi C, Zagari RM, Gningaye KFL,等。克罗恩病患者的态度:Facebook和Twitter帖子的信息流行病学案例研究和情绪分析。公共卫生监测2017年8月09日;3(3):e51 [j]免费全文] [CrossRef] [Medline
  39. Brigo F, Igwe SC, Ausserer H, Nardone R, Tezzon F, Bongiovanni LG,等。为什么人们会谷歌癫痫?关于癫痫病相关搜索词的在线行为的信息流行病学研究。癫痫行为2014年2月;31:67-70。[CrossRef] [Medline
  40. 谷歌搜索癫痫持续状态的行为。癫痫行为,2015;49:46 -149。[CrossRef] [Medline
  41. 刘建军,刘建军,刘建军。检测爱尔兰口腔癌的互联网搜索活动。[J]口腔颌面外科杂志,2016;54(2):163-165。[CrossRef] [Medline
  42. 李建军,李建平,李建平,等。世界血栓日对静脉血栓形成数字信息搜索的影响:一项Google趋势研究。血栓病杂志,2016;14(12):2325-2328。[CrossRef] [Medline
  43. 张建军,张建军,张建军,等。基于大数据的职业疾病相关兴趣研究——以矽肺病为例。PLoS One 2016;11(11):e0166051 [j]免费全文] [CrossRef] [Medline
  44. 美国公众对基于影像的癌症筛查检查的兴趣:使用基于网络的搜索工具进行分析。刘建军,刘建军,刘建军,等。生物质化学工程学报,2016,32(1):391 - 391。[CrossRef] [Medline
  45. Schootman M, Toor A, Cavazos-Rehg P, Jeffe DB, McQueen A, Eberth J,等。利用谷歌趋势数据来调查人们对癌症筛查的兴趣。BMJ Open 2015 Jun 08;5(6):e006678 [j]免费全文] [CrossRef] [Medline
  46. Linkov F, Bovbjerg DH, Freese KE, Ramanathan R, Eid GM, Gourash W.全世界对减肥手术的兴趣:谷歌趋势能教给我们什么?中华外科杂志,2014;10(3):533-538。[CrossRef] [Medline
  47. Stein JD, Childers DM, Nan B, Mian SI。评估公众对激光辅助原位角膜磨镶手术的兴趣。中华眼角膜杂志2013;32(7):1015-1018 [j]免费全文] [CrossRef] [Medline
  48. 王志强,王志强。呼吁临床医生和科学家在互联网时代发声。多发性硬化症,2014,3(2):143-146。[CrossRef] [Medline
  49. Phelan N, Kelly JC, Moore DP, Kenny P.金属对金属嘻哈争议对网络搜索活动的影响。[J]中华骨科杂志,2014;24(7):1203-1210。[CrossRef] [Medline
  50. Simmering JE, Polgreen LA, Polgreen PM。网络搜索查询量作为药物利用和处方模式变化的度量。中国医学杂志,2014;10(6):896-903。[CrossRef] [Medline
  51. 张震,郑旭,曾德东,雷士杰。使用搜索查询监视跟踪:美国的案例研究。医学互联网研究2016年9月16日;18(9):e252 [J]免费全文] [CrossRef] [Medline
  52. Zheluk A, Quinn C, Meylakhs P.俄罗斯联邦的互联网搜索和krokodil:一项信息监控研究。医学互联网研究,2014年9月18日;16(9):e212 [J]免费全文] [CrossRef] [Medline
  53. Kadry B, Chu LF, Kadry B, Gammas D, Macario a .对4999个在线医生评分的分析表明,大多数患者给予医生好评。医学互联网研究,2011;13(4):e95 [J]免费全文] [CrossRef] [Medline
  54. Huesch MD, Currid-Halkett E, dr . JN。公立医院质量报告意识:来自全国和加州互联网搜索和社交媒体提及的证据,2012年。BMJ Open 2014 march 11;4(3):e004417 [j]免费全文] [CrossRef] [Medline
  55. Haney NM, Kinsella SD, Morey JM。美国医学院毕业生对放射学住院医师计划的兴趣,由在线搜索工具描述。中华放射医学杂志,2014;11(2):193-197。[CrossRef] [Medline
  56. Poletto C, Boëlle P, Colizza v。中东呼吸综合征输入和传播的风险:对向世卫组织报告病例的系统审查和分析。中国生物医学工程学报,2016;16(1):448 [j]免费全文] [CrossRef] [Medline
  57. Hossain L, Kam D, Kong F, Wigand RT, Bossomaier T.埃博拉疫情中的社交媒体。中华流行病学杂志,2016;44(10):2136-2143。[CrossRef] [Medline
  58. 马夫拉加尼A,奥乔亚G.互联网与反疫苗运动:追踪2017年欧盟麻疹疫情。BDCC 2018 1月16日;2(1):2。[CrossRef
  59. 社会对“禽流感”和“猪流感”的独立兴趣。PLoS Curr 2009 Sep 3;1: rn1036。[CrossRef
  60. Kostkova P, Fowler D, Wiseman S, Weinberg JR. 5年来的重大感染事件:媒体报道如何影响卫生保健专业人员和公众的在线信息需求?医学与互联网杂志,2013;15(7):e107 [J]免费全文] [CrossRef] [Medline
  61. Pandey A, Abdullah K, Drazner MH.副总统切尼对左室辅助装置和心脏移植公众利益的影响。中华医学杂志,2014;31(9):1529-1531。[CrossRef] [Medline
  62. 杨建军,陈建军,陈建军。网络搜索行为对多发性硬化症的影响。多发性硬化症及相关疾病2014;3(4):440-443。[CrossRef
  63. Bragazzi NL, Watad A, Brigo F, Adawi M, Amital H, Shoenfeld Y.名人死后自身免疫性疾病的公众健康意识。临床风湿病杂志2016年12月20日:1911-1917。[CrossRef] [Medline
  64. 李建军,李建军,李建军,等。基于数字监测的公众人物胰腺癌公告对媒体和搜索查询结果的影响。国家癌症研究所杂志-专论2013:188-194。
  65. 柯伯杰,刘建军,刘建军,等。名人在铁路网络上自杀:一个案例会引发国际影响吗?[J]情感障碍2015;Oct 01;185:38-46。[CrossRef] [Medline
  66. 李建军,李建军,李建军,等。“谷歌趋势”在流行病学研究中的应用:以莱姆病为例。geospit Health 2010 May;4(2):135-137。[CrossRef] [Medline
  67. Rossignol L, Pelat C, Lambert B, Flahault A, Chartier-Kastler E, Hanslik T.基于药物销售和谷歌趋势评估尿路感染季节性的方法。科学通报,2013;8(10):76020 [j]免费全文] [CrossRef] [Medline
  68. Harsha AK, Schmitt JE, Stavropoulos SW。了解您的市场:使用在线查询工具来量化静脉曲张治疗患者信息寻求行为的趋势。[J]中华放射医学杂志,2014,25(1):53-57。[CrossRef] [Medline
  69. 英格拉姆DG,马修斯CK,普兰特DT。睡眠呼吸紊乱的季节性趋势:来自互联网搜索引擎查询数据的证据。睡眠呼吸2015,3;19(1):79-84。[CrossRef] [Medline
  70. Deiner MS, Lietman TM, McLeod SD, Chodosh J, Porco TC。从搜索引擎和社交媒体数据中出现的用于确定眼病模式的监测工具。美国眼科杂志2016年9月1日;134(9):1024-1030 [j]免费全文] [CrossRef] [Medline
  71. 张震,郑旭,曾德东,雷士杰。关于烟草和肺癌的信息寻求:季节性的影响。PLoS One 2015;10(3):e0117938 [j]免费全文] [CrossRef] [Medline
  72. 姜敏,宋伟,崔山,金海,河海,金山,等。谷歌揭开了现实世界中过敏性鼻炎的面纱。中国过敏症杂志;2015;70(1):124-128。[CrossRef] [Medline
  73. 李建军,李建军,李建军。使用搜索引擎查询数据跟踪药物利用:他汀类药物的研究。美国管理式医疗杂志2010;16(8):215-219。
  74. 张晓明,张晓明,张晓明,等。良性前列腺增生药物的临床应用研究:时间序列分析。内科实习医学2015年4月;30(4):514-520 [J]免费全文] [CrossRef] [Medline
  75. 王晓明,王晓明,王晓明,王晓明,Schönfeldt-Lecuona .抗抑郁药年度处方量与相应网络搜索查询数据的关联:一种可能的代理医疗处方行为?临床精神药物杂志,2015;35(6):681-685。[CrossRef] [Medline
  76. Mavragani A, Sypsa K, Sampri A, Tsagarakis K.定量英国对欧盟水监测监测清单上物质的在线兴趣:双氯芬酸,雌二醇和大环内酯类抗生素。水2016年11月18日;8(11):542。[CrossRef
  77. 康敏,钟华,何军,Rutherford S,杨峰。基于Google Trends的华南流感监测。科学通报,2013;8(1):1 - 5 [j]免费全文] [CrossRef] [Medline
  78. 赵帅,孙超,赵兆文,申顺,李建辉,柳思明,等。韩国国家流感监测数据与谷歌趋势之间的相关性。PLoS One 2013;8(12):e81422 [j]免费全文] [CrossRef] [Medline
  79. 张建军,张建军,张建军。基于网络查询的流感样疾病预测准确性的研究进展。科学通报,2015;10(5):e0127754 [j]免费全文] [CrossRef] [Medline
  80. Solano P, usstulin M, Pizzorno E, Vichi M, Pompili M, Serafini G,等。一种基于谷歌的自杀风险监控方法。精神病学杂志2016年12月30日;246:581-586。[CrossRef] [Medline
  81. 阿罗拉VS,斯图克勒D,麦基M.跟踪自杀搜索引擎查询在英国,2004-2013。公共卫生2016年8月;137:147-153。[CrossRef] [Medline
  82. 刘建军,刘建军,刘建军,刘建军。大数据在兽医疾病监测中的应用:早期发现伴侣动物的蜱麻痹。寄生虫病媒介2016年12月23日;9(1):303 [j]免费全文] [CrossRef] [Medline
  83. 巴恩斯CM,古尼亚BC,瓦格纳DT。睡眠和道德意识。中华睡眠科学杂志;2015;24(2):181-188 [J]免费全文] [CrossRef] [Medline
  84. 约翰逊AK,梅塔SD。互联网搜索趋势和使用谷歌趋势的性传播感染率的比较。性变性杂志,2014,41(1):61-63。[CrossRef] [Medline
  85. Alicino C, Bragazzi NL, Faccio V, Amicizia D, Panatto D, Gasparini R,等。评估与埃博拉相关的网络搜索行为:来自基于Google趋势的查询量分析研究的见解和含义。感染与贫困2015年12月10日;4:54 [免费全文] [CrossRef] [Medline
  86. 张建军,张建军,张建军。空气过敏原对网络搜索行为的影响。耳鼻咽喉头颈外科2014;12(2):228-232。[CrossRef] [Medline
  87. 张建军,张建军,张建军,张建军,张建军,张建军,张建军,张建军,张建军。耳鼻喉头颈外科2015年11月02日;153(5):770-774。[CrossRef] [Medline
  88. 周霞,叶军,冯勇。基于谷歌趋势分析的结核病监测。中国生物医学工程学报,2011,31(8):1249 - 1249。[CrossRef] [Medline
  89. Fond G, Gaman A, Brunel L, Haffen E, Llorca P.谷歌趋势®:准备好实时自杀预防或只是泽塔-琼斯效应?探索性研究精神病学研究;2015;28(3):913-917。[CrossRef
  90. Gamma A, Schleifer R, Weinmann W, Buadze A, Liebrenz M.可以用谷歌趋势预测冰毒相关犯罪吗?瑞士、德国和奥地利的搜索量数据分析。PLoS ONE 2016;11(11):e0166566。[CrossRef
  91. 李建军,李建军,李建军,等。验证使用谷歌趋势加强百日咳监测在加利福尼亚。PLoS Curr 2015 Oct 19:1-10。[CrossRef
  92. 王慧,陈东,于宏,陈勇。用Google趋势预测痴呆及痴呆相关门诊就诊:来自台湾的证据。医学互联网研究,2015年11月19日;17(11):e264 [J]免费全文] [CrossRef] [Medline
  93. 克劳森MG,舒尔茨K,图奇DL。耳表面抗生素的全国使用及预测。耳神经科学,2016;37(8):1049-1054。[CrossRef
  94. 斯高帕斯。URL:https://www.scopus.com/home.uri[访问日期:2017-11-08][WebCite缓存
  95. PubMed。18/4/2018访问。URL:https://www.ncbi.nlm.nih.gov/pubmed/[访问日期:2018-09-07][WebCite缓存
  96. 刘建军,刘建军,刘建军。数字流行病学揭示了全球儿童疾病的季节性和免疫的影响。Pnas 2016;113(24):6689 [j]免费全文] [CrossRef] [Medline
  97. 刘建军,刘建军,刘建军,刘建军。洛哌丁胺误用与滥用的研究进展。中华检验医学杂志,2017;33(1):73-84。[CrossRef] [Medline
  98. Bragazzi问。意大利多发性硬化症的信息流行病学和信息监测。多路滤波器,2013;2013:924029 [j]免费全文] [CrossRef] [Medline
  99. Bragazzi NL, Dini G, Toletone A, Brigo F, Durando P. 2004-2010年美国矽肺流行病学数据与现实世界统计数据的相关性。数据简报2017年2月;10:457-464 [免费全文] [CrossRef] [Medline
  100. Bragazzi NL, Barberis I, Rosselli R, Gianfredi V, Nucci D, Moretti M,等。人们在谷歌上搜索疫苗接种的频率:利用谷歌趋势对基于网络的活动进行系统搜索,得出定性和定量的见解。疫苗与免疫,2017;13(2):464-469。[CrossRef] [Medline
  101. Bragazzi N, Bacigaluppi S, roba C, Siri A, Canepa G, Brigo F. 2004-2015年意大利西尼罗病毒病流行病学资料。数据摘要2016:839-845 [免费全文
  102. Bragazzi NL, Bacigaluppi S, roba C, Nardone R, Trinka E, Brigo F.基于Google趋势搜索查询的癫痫持续状态信息流行病学研究。癫痫病行为学报,2016;55:120-123。[CrossRef] [Medline
  103. Bragazzi问。基于Google趋势的自伤监测方法。心理与行为管理[j]; 2013;7:1-8。免费全文] [CrossRef] [Medline
  104. 使用Google趋势的医疗即时预报:在耳鼻喉科的应用。中华耳鼻咽喉杂志,2013;27(7):2157-2160。[CrossRef] [Medline
  105. 范campen JS, van Diessen E, Otte WM, Joels M, Jansen FE, Braun KPJ。圣尼古拉斯会引起癫痫发作吗?来自谷歌趋势的提示。癫痫行为2014年3月32日132-134。[CrossRef] [Medline
  106. HA Carneiro, Mylonakis E. Google趋势:疾病爆发实时监测的网络工具。临床感染与疾病杂志;2009;49(10):1557-1564 [j]免费全文] [CrossRef] [Medline
  107. Cavazos-Rehg PA, Krauss MJ, Spitznagel EL, Lowery A, Grucza RA, Chaloupka FJ,等。利用谷歌趋势监测非卷烟烟草的使用情况。疾病控制2015;24(3):249-255 [j]免费全文] [CrossRef] [Medline
  108. 查勇,张建华。基于网络的环境事件公众反应评估。环境污染学报,2015;19(3):97-99。[CrossRef] [Medline
  109. Chaves JN, Libardi AL, Agostinho-Pesse RS, moretin M, Alvarenga KDF。远程保健:对葡萄牙语新生儿听力筛查网站的评估。coda 2015 Dec;27(6):526-533 [j]免费全文] [CrossRef] [Medline
  110. Davis NF, Gnanappiragasam S, Thornhill JA。间质性膀胱炎/膀胱痛综合征:现代诊断标准对流行病学和公众网络搜索活动的影响中华医学杂志,2015;4(5):506-511 [j]免费全文] [CrossRef] [Medline
  111. Fazeli DS, Carlos RC, Hall KS, Dalton VK。妇女健康研究的新数据来源:通过谷歌趋势绘制乳房筛查在线信息搜索图。放射学报,2014;21(9):1172-1176 [j]免费全文] [CrossRef] [Medline
  112. DeVilbiss E, Lee B.简要报告:2004年至2014年美国国家自闭症意识的趋势:国家自闭症意识月的影响。孤独症与发育障碍杂志;2014;44(12):3271-3273。[CrossRef] [Medline
  113. 曲张静脉信息在互联网上的全球搜索需求。《血液学》2015年9月30日(8):533-540。[CrossRef] [Medline
  114. Fenichel EP, Kuminoff NV, Chowell G.跳过旅行:航空旅客对大流行性流感的行为反应。PLoS One 2013;8(3):e58249 [j]免费全文] [CrossRef] [Medline
  115. 李建军,李建军,李建军,李建军。“谷歌搜索”癌症:澳大利亚、加拿大、新西兰、英国和美国在线搜索兴趣的信息流行病学评估。中华医学会癌症杂志2016;2(1):5 [j]免费全文] [CrossRef] [Medline
  116. 加里森SR,多穆斯CR,莫罗RL,卡尼GA,可汗KM。季节性对夜间腿痉挛发生的影响:一项前瞻性队列研究。中国医学杂志2015年3月3日;187(4):248-253 [j]免费全文] [CrossRef] [Medline
  117. Gollust SE, Qin X, Wilcock AD, Baum LM, Barry CL, Niederdeppe J,等。搜索,你会发现:在《平价医疗法案》首次登记期间,与谷歌搜索相关的地理特征。医学杂志,2017,32(6):723-735。[CrossRef] [Medline
  118. 2004 - 2014年口腔常见问题网络搜索趋势评价。社区口腔卫生2014;31(3):188-192。[CrossRef
  119. Harsha AK, Schmitt JE, Stavropoulos SW。比赛日:在线搜索趋势反映了人们对IR培训日益增长的兴趣。血管介入放射学杂志,2015,26(1):95-100。[CrossRef] [Medline
  120. Hassid BG, Day LW, Awad MA, Sewell JL, Osterberg EC, Breyer BN。利用搜索引擎查询数据探讨常见胃肠道症状的流行病学。土壤科学学报,2017;32(3):588-592。[CrossRef] [Medline
  121. 黄军,郑睿,埃文森。中国室内公共场所禁烟影响评估:来自戒烟相关网络搜索的证据。科学通报,2013;8(6):555 - 557 [j]免费全文] [CrossRef] [Medline
  122. 英格拉姆DG,普兰特DT。不宁腿症状的季节性趋势:来自互联网搜索查询数据的证据。睡眠医学,2013;14(12):1364-1368。[CrossRef] [Medline
  123. 王志强,王志强,王志强,王志强。1996-2012年双膦酸盐口服处方与髋部骨折的生态学分析。骨矿学报,2015;30(12):2179-2187 [J]免费全文] [CrossRef] [Medline
  124. Lawson MAC, Lawson MA, Kalff R, Walter J.关于神经外科主题的谷歌搜索查询:它们是神经外科医生的合适指南吗?中华神经外科杂志(英文版);2016;39(5):389 - 389。[CrossRef] [Medline
  125. 李建平,陈建平。网络搜索与眼科相关的频率和季节变化。眼科杂志,2010;45(3):274-279。[CrossRef] [Medline
  126. 凌R,李j .疾病监测和卫生运动评估使用谷歌搜索活动对于艾滋病毒和艾滋病,中风,结直肠癌,在加拿大和大麻使用:回顾性观察研究。JMIR公共卫生监测2016 Oct 12;2(2):e156 [j]免费全文] [CrossRef] [Medline
  127. 刘f, Allan GM, Korownyk C, Kolber M, Flook N, Sternberg H,等。踝关节肿胀的季节性:使用谷歌趋势的人群症状报告。中华医学杂志2016;14(4):356-358 [j]免费全文] [CrossRef] [Medline
  128. 卢克特,李建平,李建平,等。在晚期疾病中支持慢性呼吸困难的自我管理的网站的内容和质量:一个系统的审查。[j]中华护理杂志2016年12月26日;26 - 25 [j]免费全文] [CrossRef] [Medline
  129. Majumder MS, Santillana M, Mekaru SR, McGinnis DP, Khan K, Brownstein JS。利用非传统数据源对2015-2016年哥伦比亚寨卡病毒疫情传播动态进行近实时估计中华医学会公共卫生监测杂志2016年6月01日;2(1):e30 [j]免费全文] [CrossRef] [Medline
  130. martin MJ, Solano-Gallego L, Dhollander S, Afonso A, Brodbelt DC。欧洲兽医诊断的犬利什曼病的频率和分布。兽医学报,2014;200(3):410-419。[CrossRef] [Medline
  131. 杨建军,杨建军,杨建军,等。网络上的心因性非癫痫发作(PNES):搜索词的频率和紊乱的在线表征。查封2016年8月1日;40:114-122 [免费全文
  132. Parker J, Cuthbertson C, Loveridge S, Skidmore M, Dyar W.使用谷歌趋势数据预测酒精,药物和自杀导致的州一级过早死亡。[J]情感障碍2017年12月15日;213:9-15。[CrossRef] [Medline
  133. 费伦N,戴维S,奥基夫GW,巴里DS。解剖教育中的谷歌搜索:谷歌趋势能否告知教育工作者解剖教学大纲的全国在线搜索模式?动物科学与教育,2017;10(2):152-159。[CrossRef] [Medline
  134. 普兰特DT,英格拉姆DG。耳鸣症状的季节性趋势:来自互联网搜索引擎查询数据的证据。中华耳鼻咽喉杂志,2015,32(10):897 - 897。[CrossRef] [Medline
  135. 曹嘉,童士生,胡伟。基于网络线性模型的疾病监测:一项澳大利亚未建模传染病的案例研究。科学通报2016年12月20日;6:38 . 522 [免费全文] [CrossRef] [Medline
  136. 王晓明,王晓明,王晓明,等。基于多路网络的传染病传播模型研究。科学通报2016年12月16日;6:37 . 105 [免费全文] [CrossRef] [Medline
  137. 申顺,徐东,安杰,郭华,金山,郭杰,等。中东呼吸综合征与韩国国内的谷歌搜索和推特趋势密切相关。科学通报2016年9月6日;6:32920 [j]免费全文] [CrossRef] [Medline
  138. Sentana-Lledo D, Barbu CM, Ngo MN, Wu Y, Sethuraman K, Levy MZ。季节、搜索和意图:互联网能告诉我们的关于臭虫(半翅目:臭虫科)流行的信息。中华医学杂志,2016,31(1):116-121。[CrossRef] [Medline
  139. 日本人对“Hotaru”(萤火虫)和“Kabuto-Mushi”(日本犀牛甲虫)的兴趣与可见丰度的季节性相对应。昆虫2012年4月10日;3(2):424-431 [j]免费全文] [CrossRef] [Medline
  140. 让我给你谷歌一下:对与足部和脚踝疼痛相关的互联网搜索趋势的季节性时间序列分析。[J]足踝康复,2015;8:27 [J]免费全文] [CrossRef] [Medline
  141. Troelstra SA, Bosdriesz JR, de Boer MR, Kunst AE。烟草控制政策对寻求戒烟信息在荷兰的影响:谷歌趋势研究。PLoS One 2016;11(2):e0148489 [j]免费全文] [CrossRef] [Medline
  142. 利用谷歌趋势实时数据分析鞣制的季节和地理模式。中华皮肤科杂志,2016;32(2):215-217。[CrossRef] [Medline
  143. 柯华伦,温利。巴尔的摩市的麻疹、社交媒体和监控。公共卫生杂志,2017,01;39(3):e73-e78。[CrossRef] [Medline
  144. 杨绍平,刘建军,刘建军,等。基于ARGO的谷歌搜索数据对流感流行的准确估计。Pnas 2015;112(47):14473 [j]免费全文] [CrossRef] [Medline
  145. Köhler MJ, Springer S, Kaatz M.[关于皮肤病的季节性:基于季节的搜索引擎查询数据的回顾性分析]。中国生物医学工程学报,2014;65(9):814-822。[CrossRef] [Medline
  146. Orellano PW, Reynoso JI, Antman J, Argibay O. Uso de la herramian, Google Trends对阿根廷甲型h1n1流感发病率的估计。Cad。Saúde Pública 2015年4月;31(4):691-700。[CrossRef
  147. Cjuno J, tayp - rondan A. Estacionalidad de la celefalalede el一个半ferio北部:una aproximación利用谷歌趋势。启地中海。智利学报;2016;44(7):947-947。[CrossRef
  148. Tejada-Llacsa P. Gaceta Sanitaria。2016。在互联网上,你能看到什么?Una evaluación con Google Trends en Perú网址:https://linkinghub.elsevier.com/retrieve/pii/S0213911116300486[访问日期:2018-09-07][WebCite缓存
  149. 杨燕,曾强,赵宏,易军,李强,夏燕。基于Google趋势的乙肝预测模型。上海交通大学学报(医学版);2013;33(2):204-208。[CrossRef


方差分析:方差分析
华宇电脑:自回归积分移动平均。
女士:多发性硬化症


G·艾森巴赫编辑;提交08.11.17;A Benis, J Bian, C Fincham的同行评审;对作者的评论15.03.18;收到07.05.18修订版本;接受21.06.18;发表06.11.18

版权

©Amaryllis Mavragani, Gabriela Ochoa, Konstantinos P Tsagarakis。原载于《医学互联网研究》(//www.mybigtv.com), 2018年11月6日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map