发表在2卷, No . 2(2016): Jul-Dec

在加拿大使用谷歌搜索活动对HIV和艾滋病、中风、结直肠癌和大麻使用进行疾病监测和健康运动评估:一项回顾性观察研究

在加拿大使用谷歌搜索活动对HIV和艾滋病、中风、结直肠癌和大麻使用进行疾病监测和健康运动评估:一项回顾性观察研究

在加拿大使用谷歌搜索活动对HIV和艾滋病、中风、结直肠癌和大麻使用进行疾病监测和健康运动评估:一项回顾性观察研究

本文作者:

丽贝卡凌1 作者:Orcid 在俊李1 作者:Orcid

原始论文

加拿大安大略省滑铁卢市滑铁卢大学应用健康科学学院公共卫生与卫生系统学院

通讯作者:

Joon Lee博士

公共卫生与卫生系统学院

应用健康科学学院

滑铁卢大学

大学大道西200号

滑铁卢,ON, n2l3g1

加拿大

电话:1519 888 4567转31567

传真:1519 746 6776

电子邮件:joon.lee@uwaterloo.ca


背景:信息流行病学可以通过研究网络上可获得的信息提供实际可行的健康研究应用。谷歌Trends提供有关人群中搜索行为的可公开访问的信息,可用于研究和健康活动评估和疾病监测。仍有必要进一步研究谷歌趋势在这些方面的使用和有效性。

摘要目的:本研究的目的是探讨信息流行病学在健康运动评估和慢性疾病监测中的应用。据推测,在发起一项活动之后,在网络上寻找信息的行为会增加。第二,人群中疾病模式的增加和减少与搜索活动模式有关。这项研究调查了4种不同的疾病:人类免疫缺陷病毒(HIV)感染、中风、结直肠癌和大麻使用。

方法:使用谷歌Trends,收集了2004年2月至2015年1月期间的相对搜索量数据。运动信息和疾病统计数据来自政府出版物。用疾病趋势和活动间隔绘制搜索活动趋势图并对其进行评估。使用Pearson产品相关统计和连接点方法分析来确定显著性。

结果:所有4种疾病的疾病模式和在线活动显著相关:r= 36,P<.001),中风(r= .40,P<.001),结直肠癌(r=−.41点,P<.001),药物使用(r= .64点,P<措施)。目视检查和联合点分析显示,在刺激搜索活动中,结肠直肠癌和大麻使用的运动之间存在显著相关性。在搜索活动方面,没有观察到中风和艾滋病毒运动之间的显著相关性。

结论:信息监测的使用有望成为疾病监测和卫生运动评价的另一种廉价解决办法。需要进一步的研究来了解谷歌Trends是一种有效和可靠的卫生研究工具。

中华医学会公共卫生监测杂志,2016;2(2):e156

doi: 10.2196 / publichealth.6504

关键字



随着越来越多的人使用万维网,他们的活动产生了"大数据",并在信息流行病学方面提供了有意义的研究,信息流行病学是研究万维网上或人口中的信息的模式和决定因素,目的是为公共卫生和公共政策提供信息[1]。信息流行病学有两种类型,以供应为基础和以需求为基础,它们的对比是分别侧重于提供或获取信息。基于供应的信息流行病学研究网络上可获得的信息的数量和质量,例如与疫苗接种有关的网站、媒体报道和博客的数量,以及质量水平(例如,对疫苗的正面或负面描述)[2]。与此相反,以需求为本的资讯流行病学研究的是人们在网上搜寻资讯的行为模式,例如随着相关新闻报道而增加的搜寻活动[2]。此外,基于需求的信息流行病学的一个特定分支,即信息监控,是对网络上信息寻找行为的观察。值得注意的是,基于网络的数据的使用严重依赖于公众的众包和他们在网上的参与。同样,数字疾病检测和监测等其他应用也在类似的基础上工作,以有效利用这个不断增长的数字时代不断产生的基于web的数据[3.4]。然而,在本研究中,具体评价了信息监测在卫生研究中的应用。

资讯监测已被证明在预测传染病爆发方面是成功的,从而产生了谷歌流感趋势[23.]。b谷歌流感趋势利用了这样一个原则,即信息和通信模式的变化描绘了人群中出现的疾病的早期“症状”[1]。从数字流行病学研究中,有强有力的证据表明搜索活动和传染病爆发的预测效用。Milinovich等[4]确定17种传染病与谷歌的搜索活动趋势呈正相关,其中大多数是疫苗可预防的、病媒传播的和性传播的疾病。最近,哥伦比亚寨卡病毒爆发与b谷歌上的搜索活动呈正相关[5]。目前对信息监测的研究主要集中在传染病上,但对其在慢性病方面的应用知之甚少。6]。在对谷歌趋势在卫生研究中的应用进行的系统审查中,在纳入的70项研究中,大多数研究侧重于一般人群监测(33%),其次是传染病(27%)、精神健康和成瘾(24%)和非传染性疾病(16%)[6]。

随着数字时代的发展,许多人现在转向网络来了解疾病的症状、诊断和治疗,例如各种癌症[7]。一项研究调查了来自12个国家的12,000多人,报告称超过45%的受访者在网上寻找健康信息以自我诊断自己的病情。8]。此外,由于对疾病的认知,在社会上被高度污名化的疾病中,这些基于网络的信息寻求行为可能更常见,以阻止寻求专业帮助[9]。因此,这种基于网络的搜索活动可以为慢性病的流行和分布提供有价值的见解。对乳腺癌的疾病搜索趋势进行了研究[1011]、肺癌[12],癫痫持续状态[7]、短暂性脑缺血发作[1314]和肾结石[15]。关于污名化疾病,有关于痴呆症的研究[16],心理健康[9]和自杀死亡[1718]。总的来说,这些研究报告了中度到强烈程度的关联,表明将信息监测应用于慢性疾病具有潜在价值。Foroughi等[19研究发现,在澳大利亚、新西兰、英国、加拿大和美国,癌症相关词汇与癌症负担(如癌症发病率和死亡率)的网络搜索活动有关。此外,美国的一项研究显示,2009年全美50个州的自杀率与bbb搜索“如何自杀”、“自杀”和“自杀预防”趋势之间存在关联。18]。通过应用与疾病结果相关的关键搜索词,搜索活动趋势可用于描绘有关人口健康和行为的进一步见解。然而,与对传染病进行的大量研究相比,需要进一步的研究来验证慢性病信息监测的使用。

其次,信息监控也被用于监控和跟踪市场营销活动的成功,其衡量标准是在互联网上观察到的人群产生的兴趣和活动[2]。传统的流行病学工具,如全国调查、队列研究或登记,往往是劳动和资源密集型的。由于这些因素,观察在竞选期间之前、期间和之后发生的人口趋势可能非常困难和不切实际。因此,信息监视在战役评估中比传统方法具有优势和实用性。目前,很少有研究调查公共卫生运动及其对网络搜索的影响。最常被研究的活动是在美国发起的乳腺癌宣传月活动。这些研究报告称,乳腺癌宣传月活动有效地激发了搜索活动[101120.]。斯文森和林德布洛姆[21]分析了谷歌关于“乳腺癌”、“结肠癌”和“子宫颈癌”的趋势,并报告说,癌症宣传月活动,特别是乳腺癌和结肠癌,通过增加的网络搜索活动提高了公众对癌症的认识。在爱尔兰共和国,Davis等人[22发现媒体宣传勃起功能障碍与相关搜索活动模式之间存在直接联系。尽管关于健康运动对搜索活动影响的研究有限,但其他研究表明,媒体事件,包括有关公众人物的新闻报道和公告,也会促进寻求健康的行为[22-24]。这些发现表明了评估搜索活动趋势的潜在价值;然而,需要在这一领域进行进一步研究,以评估信息监测对监测卫生运动的有效性。

因此,本观察性研究的目的是探讨信息监测在人类免疫缺陷病毒(HIV)和获得性免疫缺陷综合征(AIDS)、中风、结直肠癌和大麻使用的信息寻求行为中的应用。使用谷歌Trends,根据人口普查数据和公共卫生运动评估了这些搜索活动,以检查它们之间的关系。据我们所知,没有对这些疾病进行研究,特别是在加拿大的情况下。我们首先假设搜索趋势与人群的疾病模式有关。其次,我们假设健康活动的推出刺激了谷歌的搜索活动,这显示在谷歌趋势上。本研究结果为公共卫生专业人员提供了新的见解,并有助于进一步了解卫生研究中的信息流行病学。


研究设计

在这项回顾性研究中,研究了2004年至2015年加拿大人在b谷歌上搜索结直肠癌、HIV和艾滋病、中风和大麻使用的活动。谷歌Trends为特定搜索查询提供了相对搜索量(rsv)。首先,为了研究信息监测在慢性病监测中的有效性,将2004 - 2015年的年度搜索活动与疾病患病率进行了比较。其次,为了调查信息监测在卫生活动评估中的应用,分析了活动前、期间和之后的搜索活动水平。

健康运动的选择

通过同行评议的来源和灰色文献寻求健康运动。搜索范围缩小到加拿大的活动和2004年之后实施的活动,因为谷歌Trends只提供这个时间点之后的数据。在评估中考虑了通过任何媒介开展的卫生运动,如电视广告、节目播出或小册子分发。然而,本研究所需的最小数据元素是活动持续时间、频率和位置。然后根据其疾病重点对符合这些标准的卫生运动进行筛选。优先考虑在当前文献中尚未审查的疾病以及慢性病,以便检查信息流行病学在慢性病监测中的应用。因此,保健运动是根据其透明度和公共信息的可获得性来选择的,这随后决定了本文所研究的4种疾病。

因此,这包括安大略省政府领导的"检查癌症"运动、不列颠哥伦比亚省积极生活协会(以前称为不列颠哥伦比亚省艾滋病患者协会)领导的"消除艾滋病毒耻辱"运动、加拿大政府领导的"反大麻"运动以及心脏病和中风基金会领导的"使健康持久"运动。由于这些活动在目的、持续时间和传递渠道上有所不同,这可能有助于确定成功活动的组成部分,从而增加信息寻求行为。表1提供活动特征的总结和比较。

数据收集

谷歌趋势给出的搜索活动

2012年b谷歌搜索在全球所有搜索引擎中占有78%的市场份额[30.]。恰如其分地,它的巨大受欢迎程度将提供加拿大人口在线搜索活动的最佳写照。谷歌Trends是一个公开可用的免费分析工具,自2004年以来提供聚合搜索结果。疾病名称被用作每个搜索词的基础(例如,“结直肠癌”、“艾滋病毒/艾滋病”、“大麻使用”和“中风”)。此外,为了准确地描述人口的搜索活动行为,谷歌趋势建议的相关关键词(见多媒体附录1)被纳入检索。这些建议的术语有助于捕获最流行的搜索查询以及同义词。然而,模棱两可、具有多重含义和/或与疾病统计相关的术语被排除在数据收集之外。例如,推荐的谷歌搜索,如“非洲艾滋病毒/艾滋病”、“2中风”、“心脏和中风彩票”和“艾滋病毒预防”,确实包含查询中的目标词,但在上下文上与研究无关,因此在此过程中未被收集。使用布尔运算符,搜索查询包含与疾病相关的关键字,以便谷歌Trends生成聚合搜索模式。本研究中使用的最终搜索查询提供在表2.谷歌Trends以RSV格式返回结果,这便于在术语之间进行比较。RSV定义为特定时间的搜索次数与特定地理位置的一段时间内的搜索总数之商。本质上,RSV表示搜索词在特定时间点的流行程度。在谷歌Trends工具中缩小筛选范围后,导出了2004年2月至2015年12月期间加拿大和与活动相关的加拿大特定省份的每周RSV数据。

表1。卫生运动摘要。
运动特性 疾病的利益

结肠癌 艾滋病毒一个和艾滋病b 吸食大麻 中风
组织 安大略省政府 不列颠哥伦比亚省积极生活协会 加拿大政府 心脏及中风基金会
活动名称 “ColonCancerCheck” “消除艾滋病污名” “Anti-Marijuana” “让健康永存”
目的 增加大肠癌筛查工作[25 减少对艾滋病毒的污名化[26 向青少年宣传大麻对健康的负面影响[27 提高对中风的认识[28
进行风险评估教育[28
促进健康[28
鼓励捐款[28
交付渠道 卫生保健提供者推荐以及安大略省各地的电视广告、广播公告、报纸广告和小册子[25 在不列颠哥伦比亚省40个参与的电台和电视台播放30秒的公益广告[26 电视、网络广告和社交媒体[27 加拿大广播公司(CBC)平台包括CBC电视、CBC网络、CBC播放器、地区电台和数字横幅[29
活动期间 二零零八年四月至二零零八年九月[25 2006年7月至2007年7月[26 2014年10月至2014年12月[27 2013年2月至2013年5月[29
持续时间 6个月 12个月 3个月 4个月

一个艾滋病毒:人类免疫缺陷病毒。

b艾滋病:获得性免疫缺陷综合症。

表2。搜索词列表。
搜索查询过滤器 结肠直肠癌 艾滋病毒一个/艾滋病b 吸食大麻 中风
搜索条件 结直肠癌+结直肠癌诊断+结直肠癌筛查+结直肠癌筛查+结肠癌+结肠癌症状 Hiv + aids +人类免疫缺陷病毒+获得性免疫缺陷病毒+ Hiv症状+ Hiv诊断+ aids症状+ aids诊断+ Hiv感染 大麻使用+药物滥用+大麻副作用+大麻效应+大麻效应+药物使用+药物成瘾 中风+中风症状+中风发作
研究地理位置 加拿大和安大略 加拿大和不列颠哥伦比亚省 加拿大和安大略 加拿大和安大略
数据收集周期 2004年2月至2015年12月 2004年2月至2015年12月 2004年2月至2015年12月 2004年2月至2015年12月

一个艾滋病毒:人类免疫缺陷病毒。

b艾滋病:获得性免疫缺陷综合症。

疾病统计

在开放的同行评审期刊和灰色文献来源中检索了有关疾病的统计数据。报告的疾病流行率数据优先于疾病发病率数据;但是,如果没有流行数据,则仍然使用疾病发病率数据。2004年至2014年期间的疾病发病率和流行率数据来自加拿大统计局和其他政府出版物。

数据分析

搜索活动与疾病模式之间的关系

将每种疾病的数据趋势绘制在一起,以比较疾病搜索活动和疾病患病率或发病率。疾病监测首先通过目视检查进行评估,以确定数据中的模式。随后在IBM SPSS Statistics 23(IBM Corporation)中进行Pearson相关分析以检测统计显著性。将年平均搜索活动与年疾病发病率进行对比,以确定是否存在相关性。所有4种疾病均重复上述步骤。

健康运动对搜索活动的影响

为了评估公共卫生运动对搜索活动的影响,采用了联合点方法[1131]。Schootman等人[11]调查公众人物的癌症诊断和死亡对b谷歌搜索行为的影响。类似地,在谷歌搜索活动的时间序列中,连接点方法测试了活动前后RSV的每周变化是否具有统计学意义。这是通过拟合线性回归线到每周RSV的自然对数来完成的。确定拐点以检查线性回归线的斜率之间的任何显着差异。对活动前20周、活动期间和活动后20周的在线活动进行了分析。第二次分析是在活动之前、期间和之后的5周、10周和15周进行的。评估不同时期的目的是确定健康运动对增加人们在网络上搜索行为的潜在影响。例如,检查活动开始前的5周和活动结束后的5周,发现由活动实施引起的任何直接变化。然而,由于RSV数据是在每周测量中收集的,因此联合点程序测试的观测数较少,影响了统计效力。因此,在10周、15周和20周的时间段内研究长期趋势。 A maximum of 3 joinpoints were fitted to each RSV time series. This maximum was chosen because of the predicted pattern we expected to see. The first joinpoint would be observed at the start of the campaign period because we hypothesized an increase in search activity. Following that surge, the search activities would peak during the campaign period and slightly decline over time, generating the second joinpoint. The third joinpoint would be observed at the end of the campaign period, in which search activity would return to baseline.


互联网搜索活动与疾病流行

Pearson相关性检验了本文所研究的4种疾病的RSV与该疾病在给定时间段内的患病率或发病率之间的关系。总的来说,这两个变量之间的关系对于4种疾病中的每一种都是显著的。2004年至2010年,结直肠癌发病率与搜索活动呈负相关(r=−.41点,P<措施)。2004年至2014年期间,艾滋病病毒搜索活动与发病率数据之间呈中度正相关(r= 36,P<措施)。2004年和2008年至2012年大麻使用的流行程度与搜索活动呈正相关(r= .64点,P<措施)。最后,2004 - 2009年,脑卒中搜索活动与发病率呈中度正相关(r= .40,P<措施)。图1-4描述基于web的每周RSV值的搜索活动趋势,以及与结直肠癌、HIV感染、大麻使用和中风发病率相比计算出的全年RSV值平均值。

图1所示。结直肠癌的网络搜索活动和发病率趋势。RSV:相对搜索量。
查看此图
图2。人类免疫缺陷病毒的网络搜索活动和流行趋势。RSV:相对搜索量。
查看此图
图3。大麻使用的网络搜索活动和发生率趋势。RSV:相对搜索量。
查看此图
图4。基于网络的搜索活动和中风发病率趋势。RSV:相对搜索量。
查看此图

卫生运动概述

竞选活动对互联网搜索活动影响的视觉评估

将活动前20周、活动期间和活动后20周的RSVs绘制成图表,以直观地检查由活动执行引起的搜索活动的增加和减少(示例见图5-8).在此初步评估的基础上,“反大麻”运动(图7)显示,在活动期间的搜索活动增长幅度最大,超过其他3个活动。这可以从活动开始时的活动增加和活动接近结束时的活动减少中看出。对于针对中风的“让健康持久”运动和“消除艾滋病毒耻辱”运动对信息寻求行为的影响,无法作出明确的推断。

图5。在竞选期间之前、期间和之后,结直肠癌的每周网络搜索活动。高亮部分描述活动持续时间。
查看此图
图6。在运动期间之前、期间和之后,每周针对人类免疫缺陷病毒的网络搜索活动。高亮部分描述活动持续时间。
查看此图
图7。在竞选之前、期间和之后,每周针对大麻使用情况的网络搜索活动。高亮部分描述活动持续时间。
查看此图
图8。在竞选期间之前、期间和之后,每周针对中风的网络搜索活动。高亮部分描述活动持续时间。
查看此图
竞选活动对互联网搜索活动影响的统计结果

图9显示连接点分析的结果。“ColonCancerCheck”的结果表明,广告活动的实施对谷歌搜索活动的影响很大。在第21周检测到一个显著的拐点,即统计学上显著的斜率变化。这一点非常接近我们分析中竞选活动开始的20周。值得注意的是,图9在第1周至第17周期间,搜索活动呈下降趋势,然后在活动执行的同一时间点经历搜索活动的急剧增加。“反大麻”运动是唯一一个在竞选期间显示搜索活动增加的运动。结合点分析在第16周计算了一个显著的拐点,在这个拐点中,搜索活动从下降趋势转变为上升趋势。该活动的实施可能有助于观察到谷歌对大麻信息的搜索活动的增加。这些运动与“让健康持久”和“消除艾滋病毒耻辱”运动的在线搜索活动之间没有显著关联。拐点与运动的执行没有密切联系。表3提供统计结果的摘要。20周的部分作为主要结果,因为它包含的分析数据点最多;然而,多媒体附录2-5提供5周、10周和15周评估的统计结果。

表3。活动前20周、期间和活动后20周的联合点分析。
统计输出 结肠直肠癌 艾滋病毒一个 吸食大麻 中风
第一部分(周) 1卷 1 - 99 1 - 16 1 - 14

斜率,RSVb/周(95% CI) −1.21(−2.7 ~ 0.3) −0.46(−0.6 ~−0.3) −2.72(−4.1 ~−1.3) 0.10(−1.0 ~ 1.2)

P价值c <措施 <措施 .85
第二部分(周) 17-21 - - - - - - 16-28 14日至17日

斜率,RSV/周(95% CI) 17.46(−2.8 ~ 41.9) - - - - - - 4.93(2.7至7.3) 23.55(−1.0 ~ 54.3)

P价值c .09点 - - - - - - <措施 06
第三部分(周) 还是 - - - - - - 进一步 17日

斜率,RSV/周(95% CI) −4.01(−6.2 ~−1.8) - - - - - - −6.52(−14.4 ~ 2.1) −11.89(−29.4 ~ 10.0)

P价值c <措施 - - - - - - 13。
第四部分(周) 34 - 68 - - - - - - 33-55 20-54

斜率,RSV/周(95% CI) −0.19(−0.7 ~ 0.3) - - - - - - 1.19 (0.4 ~ 2.0) −1.03(−1.3 ~ 0.8)

P价值c 无误 - - - - - - .006 <措施

一个艾滋病毒:人类免疫缺陷病毒。

bRSV:相对搜索量。

c统计学显著性定义为P< . 05。

图9。所研究的4种疾病的联合点分析。突出显示的区域显示了该活动生效的时期。艾滋病毒:人类免疫缺陷病毒。
查看此图

主要研究结果

目视检查和联合点分析均显示,健康运动与人们对“癌症检查”和“反大麻”运动的搜索行为呈正相关。虽然这些关联是适度的,但结果支持了之前的研究,表明信息监控可以衡量一项运动在推动人群信息寻求行为方面的成功[1032]。“ColonCancerCheck”活动在产生在线活动方面是有效的,因为医生是与目标受众接触的联络点。因此,这种集中的方法仍然与高危人群最相关,从而产生了更高的兴趣和信息寻求行为。“反大麻”运动对谷歌搜索活动的影响可能是由于目标受众更年轻。该活动旨在教育青少年大麻使用对健康的负面影响。合适的是,这些目标受众也是网络的主要用户,这可能导致在竞选期间对大麻使用信息的搜索活动增加。但是,没有发现"使健康持久"和"消除艾滋病毒耻辱"运动之间的联系。无效结果可能是由于活动类型、频率和持续时间的差异。同样,这些相同的因素可能低估了“结肠癌检查”和“反大麻”运动中观察到的适度关联。Glynn等[10在美国,年度乳腺癌宣传活动与相关搜索活动之间存在正相关。在他们的研究中,作者观察到10月份与乳腺癌相关的谷歌搜索活动水平持续增加,这与每年的乳腺癌宣传月相吻合。10]。通过b谷歌上的搜索活动来衡量,乳腺癌宣传运动在引起人们兴趣方面的成功可能更容易观察到,因为该运动的反复模式。另一方面,在我们的研究中检查的运动,只举行了一次,在一个特定的时期。因此,与年度乳房意识活动相比,这些活动的非重复性可能导致谷歌搜索活动很少或没有影响。

另一个可能对调查结果产生影响的差异是竞选期间的长短。其他研究考察了更多的冲动干预及其对在线活动的直接影响。Noar等[23研究了公众人物宣布胰腺癌的消息及其对媒体和搜索结果的影响。从他们的研究中,他们发现胰腺癌的公告(如诊断或死亡)与美国人群寻求癌症信息的行为之间存在正相关。相比之下,我们研究中活动的持续时间从3个月到1年不等。因此,活动的长时间可能削弱了活动对产生兴趣和信息寻求行为的观察效果。

尽管过去成功地将网络搜索活动与传染病爆发联系起来,但人们对网络搜索活动与慢性疾病之间的关系知之甚少。在本研究中,结直肠癌、HIV感染、大麻使用和中风的发病率与谷歌搜索活动有显著相关性。虽然文献中尚未对疾病趋势进行研究,但这些发现与其他相关研究是一致的。一项研究表明,脑卒中患病率的州特异性差异与特定州的搜索查询数据有关[14]。在美国,谷歌搜索活动也与自杀率呈正相关[18]。中风、艾滋病毒和药物使用在疾病发病率和搜索量之间显示出正相关。这意味着患有这种疾病的个体越多,在谷歌上观察到的搜索活动就会相应增加。个人在咨询医疗保健提供者之前,可能会出于诸如获取有关疾病症状、诊断或治疗的信息等原因在网上寻找信息[33]。由于互联网可访问性的增加,越来越多的人可能比过去更有可能参与定期的信息搜索行为。有趣的是,结直肠癌与网络活跃度呈负相关,这表明结直肠癌患者越少,谷歌Trends上的搜索活跃度越高。这种发病率与网络活动之间的反比关系尚未在文献中报道。虽然这种反向关系背后的原因尚不清楚,但一种可能的解释可能是加拿大人对结直肠癌的认识和兴趣下降。此外,癌症发病率在各省和地区之间存在差异,综合评估可能会掩盖结直肠癌患病率与互联网搜索活动之间的真实关系。此外,由于学术期刊和灰色文献信息的可获得性有限,仅获得了2004年至2010年的结直肠癌发病率。用更新的数据评估发病率和搜索活动,以确定负相关性是否随时间持续存在,将是有益的。尽管如此,监测结直肠癌病例与网络搜索活动之间的关系应该进一步研究,以证实这些发现。

限制

该研究的局限性包括有关运动和疾病统计的信息有限。关于艾滋病、中风、大麻使用和结直肠癌患病率的公开数据有限。理想情况下,整个2004年至2015年期间的患病率数据将提供最佳的Pearson相关性估计。在这项研究中,只有艾滋病毒的流行率数据可用。分析流行率数据将涵盖新诊断出疾病的个体和目前仍患有该疾病的个体。这两个群体都应该被考虑在内,因为他们都是互联网的潜在用户,可能会寻求更多关于他们疾病的信息。与发病率数据相比,这一统计数据只观察了一段时间内疾病的新病例。因此,它忽略了另一类人,他们可能仍然会转向网络寻求有关疾病的健康信息。因此,纳入发病率数据的个人不能完全代表那些可能使用互联网了解其疾病的人。

本研究的第二个限制是谷歌Trends的主要用途是收集和评估搜索活动。虽然谷歌是目前唯一一个向公众提供数据分析工具的搜索引擎,但在使用谷歌趋势时存在偏见。因为bb0占据了78%的全球市场份额[30.],研究结果的概括性仍可维持;然而,这项研究仍然没有考虑使用其他搜索引擎(如Bing和Yahoo!)的剩余人群。[23]。此外,来自在线社区的数据众包提供了许多优势,例如随时可用,易于访问和丰富的数据可供研究。主动的众包,如向基于网络的跟踪系统报告流感症状,或被动的众包,如浏览网页,两者都带有固有的偏见,这一点必须承认[34]。这与志愿者偏见有关,即使用b谷歌作为主要搜索引擎的个人通常更年轻,收入更高,并且来自较大的家庭[35]。这些特征可能是本研究的混杂因素,因为这一特定人群不太可能患上这些疾病,这反过来又减少了他们对疾病的信息寻求行为。

最后,研究网络搜索行为的一般限制是不可控因素也会影响搜索活动。可能的混杂变量包括新闻事件,如公众人物与疾病有关的死亡,公众人物的社交媒体影响,以及同一时期举行的其他健康活动。然而,这是进行观察性研究的一个典型限制,在观察性研究中,不可能辨别出因果关系。

未来的研究

有必要进一步研究健康活动与搜索活动之间的关系,以及疾病发病率与网络搜索活动之间的关系。首先,虽然本研究没有确定健康运动对互联网搜索活动的影响,但对未来研究的建议是检查经常性健康运动的影响。因为美国的Glynn等人报道了乳腺癌意识活动的积极结果[10],未来的研究可以评估类似的活动,比如针对前列腺癌的“胡子月”活动,以及它们对网络搜索活动的影响。其次,可以使用其他分析和统计方法来确定健康运动实施和互联网搜索活动结果的影响。组织使用Buzzmonitor等数字营销技术来跟踪其品牌在网络社区中的知名度和“热度”[3637]。最后,来自许多不同来源的大数据也可以用于研究,以评估卫生运动的有效性。随着Facebook、Twitter和Instagram等社交媒体平台在公共卫生组织中越来越受欢迎,这些数据可能会提供潜在的答案,以更好地理解基于网络的社区卫生运动的影响。在Xu等人的研究中[38],他们使用应用程序编程接口来评估健康意识活动,以收集Twitter信息。他们的调查显示,在乳腺癌、前列腺癌和肺癌的癌症意识提高的几个月里,即9月、10月和11月,Twitter上癌症术语的频率有所波动。38]。同样,这些应用也可用于寻求相关成果的卫生运动,如宣传运动和卫生教育。因此,探索新技术和大数据的其他研究可能有助于支持在健康运动评估中使用信息监测[3637]。

此外,更注重提高认识的运动可能更适合研究,因为寻求信息的行为是这类运动的目标结果。例如,使用广告来传递信息的活动与分发筛选工具包的活动相比,在互联网上吸引人们更相关。因此,在研究谷歌趋势上的搜索行为时,选择正确的广告活动将是一个重要的考虑因素。

在这项研究中,应用谷歌趋势来提供发病率指示是有希望的。然而,为了加强这种相关性,未来的研究仍然是必要的。首先,应该检查疾病流行率,而不是疾病发病率,因为流行数字将涵盖最有可能在互联网上寻找有关疾病信息的所有个人。特别是,最好对在一段时间内流行率呈上升和下降趋势的疾病进行研究。在正向和负向波动的情况下,测试搜索活动是否也会跟随正向和负向波动。如果疾病发病率和互联网搜索活动在同一时间范围内一致,这种相关性将加强信息流行病学在监测人群疾病方面的应用。

结论

在这项研究中,对互联网搜索数据的分析显示,在加拿大,健康运动和信息寻求行为之间存在显著关系,涉及结直肠癌和药物使用,但不涉及艾滋病毒、艾滋病和中风。“结肠癌检查”和“反大麻”运动的结果与之前的研究一致。“让健康持久”和“消除艾滋病毒污名”运动结果不同的可能原因包括运动类型、频率和持续时间的差异。然而,在数字疾病监测中使用基于网络的搜索数据仍然很有前景。研究发现,搜索活动与疾病患病率或发病率之间存在显著关联。需要进一步的研究来验证在健康研究中使用谷歌趋势的可靠性。

致谢

作者感谢滑铁卢大学公共卫生与卫生系统学院的本科论文项目,为他们提供了使这项工作成为可能的机会。

利益冲突

没有宣布。

多媒体附录1

为在研究中包含审查的搜索术语的列表。

PDF档案(adobepdf档案),13KB

多媒体附录2

结直肠癌的关节点分析结果。

PDF档案(adobepdf档案),16KB

多媒体附录3

脑卒中关节点分析结果。

PDF档案(adobepdf档案),20KB

多媒体附录4

药物滥用的联合点分析结果。

PDF档案(adobepdf档案),20KB

多媒体附录5

人类免疫缺陷病毒与艾滋病联合点分析结果。

PDF档案(adobepdf档案),18KB

  1. 信息流行病学和信息监控:一套新兴的公共卫生信息学方法框架,用于分析互联网上的搜索、交流和出版行为。医学信息学报,2009;11(1):11 [J]免费全文] [CrossRef] [Medline
  2. 杨建军。信息流行病学与信息监测:在线健康信息与网络行为。中华预防医学杂志,2011;40(5增刊2):S154-S158。[CrossRef] [Medline
  3. Fernández-Luque L, Bau T.健康和社交媒体:信息的完美风暴。卫生通报,2015年4月;21(2):67-73 [j]免费全文] [CrossRef] [Medline
  4. Milinovich GJ, Avril SM, Clements AC, Brownstein JS, Tong S, Hu W.基于网络搜索查询的传染病监测:疾病适宜性筛查。中华医学杂志,2014;14:69 [j]免费全文] [CrossRef] [Medline
  5. Majumder MS, Santillana M, Mekaru SR, McGinnis DP, Khan K, Brownstein JS。利用非传统数据源对2015-2016年哥伦比亚寨卡病毒疫情传播动态进行近实时估计中华医学会杂志,2016;2(1):30 [j]免费全文] [CrossRef] [Medline
  6. Nuti SV, Wayda B, Ranasinghe I, Wang S, Dreyer RP,陈思,等。谷歌趋势在卫生保健研究中的应用:系统回顾。科学通报,2014;9(10):e109583 [j]免费全文] [CrossRef] [Medline
  7. Brigo F, Trinka E.谷歌癫痫持续状态的搜索行为。癫痫行为,2015;49:46 -149。[CrossRef] [Medline
  8. 李建军,李建军。基于网络的医学自我诊断研究。教师研究,出版物和报告论文29。佛罗里达州Coral Gables:迈阿密大学学术资料库;2012.URL:http://scholarlyrepository.miami.edu/health_informatics_research/29/[访问日期:2016-10-01]WebCite缓存
  9. 叶氏JW, Althouse BM, Allem J, Rosenquist JN, Ford DE. b谷歌心理健康信息的季节性特征。中华预防医学杂志,2013;44(5):520-525。[CrossRef] [Medline
  10. 格林RW,凯利JC,科菲N, Sweeney KJ, Kerin MJ。乳腺癌宣传月对互联网搜索活动的影响——与肺癌和前列腺癌宣传活动的比较。中华医学杂志2011;11:442 [j]免费全文] [CrossRef] [Medline
  11. Schootman M, Toor A, Cavazos-Rehg P, Jeffe DB, McQueen A, Eberth J,等。谷歌趋势数据在检验人们对癌症筛查兴趣方面的效用。中华医学杂志2015;5(6):e006678 [j]免费全文] [CrossRef] [Medline
  12. 张震,郑旭,曾德东,雷士杰。关于烟草和肺癌的信息寻求:季节性的影响。PLoS One 2015;10(3):e0117938 [j]免费全文] [CrossRef] [Medline
  13. Abedi V, Mbaye M, Tsivgoulis G, Male S, Goyal N, Alexandrov AV,等。基于互联网的短暂性脑缺血发作信息搜寻行为。中华脑卒中杂志;2015;10(8):1212-1216。[CrossRef] [Medline
  14. 张建军,张建军,李建军,等。基于网络搜索引擎分析的脑卒中患病率的地理差异分析。神经外科杂志;2011;30(6):E19。[CrossRef] [Medline
  15. Willard SD, Nguyen MM.互联网搜索趋势分析工具可以提供美国肾结石疾病的实时数据。泌尿外科杂志,2013;81(1):37-42。[CrossRef] [Medline
  16. 王慧,陈东,于慧,陈勇。基于谷歌趋势预测痴呆发病率及痴呆相关门诊就诊:来自台湾的证据。医学互联网研究,2015;17(11):e264 [J]免费全文] [CrossRef] [Medline
  17. 杨青,蔡生,黄妮,彭晨。台北市网路搜寻趋势与自杀死亡的关系,台湾,2004-2009。[J]心理疾病杂志;2011;32(1):179-184。[CrossRef] [Medline
  18. 利用谷歌在互联网上的搜索来监控自杀行为。[J]心理疾病学报;2013;31(2):411-412。[CrossRef] [Medline
  19. 傅福杰,林亚平,林敏,韩德华。“谷歌搜索”癌症:澳大利亚、加拿大、新西兰、英国和美国在线搜索兴趣的信息流行病学评估。JMIR癌症2016年5月04日;2(1):e5。[CrossRef
  20. Jacobsen GD, Jacobsen KH。健康意识运动和诊断率:来自全国乳腺癌意识月的证据。卫生经济杂志;2011;30(1):55-61。[CrossRef] [Medline
  21. 李建平,李建平,李建平,等。癌症宣传月活动对网络搜索量和癌症诊断率的影响。[J]中华临床杂志,2013;13(15增刊):e17512。网址:http://meeting.ascopubs.org/cgi/content/abstract/31/15_suppl/e17512
  22. Davis NF, smith LG, Flood HD。在爱尔兰共和国使用搜索引擎查询数据检测勃起功能障碍的互联网活动。生物工程学报,2012;11 (11):939- 942 [j]免费全文] [CrossRef] [Medline
  23. Noar SM, Ribisl KM, Althouse BM, Willoughby JF, Ayers JW。使用数字监控来检查公众人物胰腺癌公告对媒体和搜索查询结果的影响。中华肿瘤杂志,2013;12(4):391 - 391。[CrossRef] [Medline
  24. Cooper CP, Mallon KP, Leadbetter S, Pollack LA, Peipins LA。2001-2003年美国主要搜索引擎上的癌症互联网搜索活动。[J]中国医学杂志,2005;7(3):e36 [J]免费全文] [CrossRef] [Medline
  25. 拉贝克L, Tinmouth JM, Paszat LF, Baxter NN, Marrett LD, Ruco A,等。安大略省的ColonCancerCheck:加拿大首个全省范围的结直肠癌筛查项目的结果。癌症流行病学与生物标志物,2014年3月;23(3):508-515 [j]免费全文] [CrossRef] [Medline
  26. 戴维斯M. 25年的艾滋病在不列颠哥伦比亚省标志着强有力的省级广告活动。不列颠哥伦比亚省温哥华:不列颠哥伦比亚省艾滋病患者协会;2006年6月29日。URL:https://positivelivingbc.org/wp-content/uploads/2015/03/bcpwa-release-end-stigma.pdfWebCite缓存
  27. 古德曼。2014.政府禁毒运动没有医疗组织的帮助http://www.cbc.ca/news/politics/government-anti-drug-campaign-created-without-help-from-medical-groups-1.2806570[访问日期:2016-09-10][WebCite缓存
  28. 让健康持久。心脏和中风基金会。Heartandstroke》2016。URL:http://www.heartandstroke.mb.ca/site/c.lgLSIVOyGpF/b.8601065/k.6447/Make_Health_Last__PSAs.htm[访问日期:2016-10-01]WebCite缓存
  29. Richards E. CBC和心脏病与中风基金会再次合作。Marketingmag》2013。URL:http://www.marketingmag.ca/brands/cbc-and-heart-stroke-foundation-partners-again-73018[访问日期:2016-09-13][WebCite缓存
  30. 评价谷歌作为认知工具。哲学学报;2012;43(4):426-445。[CrossRef
  31. Surveillance.cancer。Joinpoint趋势分析软件https://surveillance.cancer.gov/joinpoint/[访问日期:2016-09-10][WebCite缓存
  32. Bernardo TM, Rajic A, Young I, Robiadek K, Pham MT, Funk JA。对疾病监测的搜索查询和社交媒体的范围审查:创新年表。中国医学杂志,2013;15(7):e147 [J]免费全文] [CrossRef] [Medline
  33. Bader JL, Theofanos MF。在互联网上搜索癌症信息:分析自然语言搜索查询。[J] .中国医学信息学报,2003,12 (4):531 [J]免费全文] [CrossRef] [Medline
  34. 众包健康研究:公共健康研究生态系统中临床试验的重要补充。中国医学杂志,2012;14(2):e46 [J]免费全文] [CrossRef] [Medline
  35. Freibott P.谁使用b谷歌,雅虎!和必应?2010年8月17日。URL:http://www.pmxagency.com/blog/2010/08/who-uses-google-yahoo-and-bing/[访问日期:2016-10-01]WebCite缓存
  36. Getbuzzmonitor。GetBuzzmonitor:一个更智能的社交媒体监控工具。2016。URL:http://www.getbuzzmonitor.com/[访问日期:2016-09-13][WebCite缓存
  37. 王晓明,王晓明,王晓明,Rebêlo。Buzzmonitor:测量在线社区口碑水平的工具http://www.cin.ufpe.br/~hemr/papers/IADIS05_lima_vitorino_rebelo.pdf[访问日期:2016-09-13][WebCite缓存
  38. 徐松,Markson C, Costello KL,邢永青,Demissie K, Llanos AA。利用社会媒体促进公共卫生知识:通过Twitter提高癌症意识的例子。中华医学会杂志,2016;2(1):17 [j]免费全文] [CrossRef] [Medline


艾滋病:获得性免疫缺陷综合症
艾滋病毒:人类免疫缺陷病毒
RSV:相对搜索量


G·艾森巴赫编辑;提交16.08.16;O Leal Neto, D Jadhav的同行评审;对作者的评论31.08.16;修订版本收到13.09.16;接受18.09.16;发表12.10.16

版权

©Rebecca Ling, Joon Lee。最初发表于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com), 2016年10月12日。

这是一篇根据知识共享署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在JMIR公共卫生与监测上,并适当引用。必须包括完整的书目信息,到http://publichealth.www.mybigtv.com上原始出版物的链接,以及版权和许可信息。


Baidu
map