原始论文
摘要
背景:2013年10月,国际癌症研究机构(International Agency for Research on Cancer)将室外空气污染中的颗粒物列为1类致癌物,并宣布颗粒物可导致肺癌。精细的特殊事项(下午2.5污染正成为中国城市地区一个严重的公共健康问题。必须强调公众对肺癌可改变危险因素的认识和知识对预防的重要性。
摘要目的:本研究的目的是探讨公众对PM的认知2.5与肺癌风险之间的关系2.5在互联网大数据平台百度上集中搜索“肺癌”一词。
方法:我们收集每日PM2.52014年1月1日至2016年12月31日中国31个省会城市的浓度数据和每日百度指数数据。我们使用Spearman相关分析来探索肺癌搜索的每日百度指数与每日平均PM之间的相关性2.5浓度。采用格兰杰因果检验分析两个时间序列变量之间的因果关系。
结果:在31个城市中的23个,肺癌搜索的每日百度指数与每日平均PM之间的两两相关系数(Spearman rho)2.5浓度为阳性且有统计学意义(P< . 05)。然而,肺癌搜索的每日百度指数与每日平均PM之间的相关性2.5注意力不集中(所有r2年代<。1)。格兰杰因果检验结果表明,每日PM不存在单向因果关系2.5肺癌搜索的每日百度指数的浓度,在每个城市的5%水平上具有统计学意义。
结论:每日平均PM2.5浓度对百度搜索引擎肺癌的日搜索兴趣有微弱的正影响。需要精心设计的宣传活动来提高公众对PM关联的认识2.5,以引导公众寻求更多关于PM的信息2.5及其危害,并适当地应对其环境及其风险。
doi: 10.2196 / publichealth.8078
关键字
简介
空气污染已成为中国最严重、最令人担忧的环境问题和对公众健康的重大威胁[
- ].环境中直径<5 μm的细颗粒物(PM2.5)及其负面影响是中国主要的公共卫生问题[ - ].根据全球疾病负担研究,PM2.5浓度已成为第五大死亡风险因素,估计有420万人死于PM2.52015年全球范围内,和PM2.5导致中国2015年110万人死亡[ ].在194个中国城市中,估计过早死亡和肺癌死亡的总数归因于PM2.52014年和2015年污染分别为722,370次和67,452次[ ].预计到2050年,中国特大城市因空气污染造成的人均死亡率将更高[ ].肺癌是中国最常见的偶发癌症,也是癌症死亡的主要原因。估计每年新发癌症个案及癌症死亡个案分别为73.3万宗及59.1万宗[
].国际癌症研究机构已将室外空气污染中的颗粒物列为可导致肺癌的第一类致癌物[ ].许多研究发现暴露在PM中2.5是肺癌的重要危险因素[ - ].提高公众对肺癌的认识对于肺癌的早发现、早诊断、早干预具有重要意义。随着网络的发展,互联网已成为市民获取健康信息的重要渠道。大约63%的癌症患者使用互联网来搜索有关癌症的专门信息,并且使用互联网作为肿瘤信息的来源正在迅速增加[
, , ].先前的研究表明,Twitter或谷歌等网络工具可以通过跟踪求医行为来检查公众对疾病流行的兴趣,并进行疾病监测[ - ].百度是中国最重要的互联网大数据平台之一。根据中国网民搜索行为研究,百度搜索引擎在中国网民中最受欢迎,优先选择发生率为93.1% [
].百度指数来源于百度搜索引擎上的搜索频率,以网民在百度搜索引擎上的搜索量为基础,对特定关键词进行计算并显示。百度指数可以作为确定互联网用户对特定主题的认知程度的数据源。利用百度指数,我们调查了中国公众对肺癌的搜索兴趣。本研究的目的是探讨公众对PM的认识2.5与肺癌风险之间的关系2.5在中国,“肺癌”一词的浓度和每日百度指数的搜索量。
方法
空气污染数据
我们从中国空气质量在线监测分析平台收集空气污染数据[
自2013年起,北京开始对中国所有主要城市进行空气质量监测。我们提取日平均PM2.52014年1月1日- 2016年12月31日中国31个省会城市的浓度数据。搜索数据
百度索引是处理和分析搜索查询数据的有用工具。其数据库包含2011年1月以来提交的在线和手机搜索查询量的日志。百度日指数是基于某关键词在百度搜索引擎上的日搜索量,将该关键词的搜索频率加权和。百度指数已被证明是公众对健康相关主题的兴趣和认识的有用指标。在本研究中,我们假设百度指数可以为一般人群对肺癌的认识提供潜在的见解。本研究中概念化的肺癌意识可以认为是基于一般人群对该疾病的知识和信息的寻求能力或关注该疾病的能力。我们使用百度指数来确定搜索词“肺癌”作为公众对肺癌认识的指标的相关性。我们从百度指数网站收集每日百度指数数据[
在2014年1月1日至2016年12月31日期间,中国31个省会城市的中文搜索词“肺癌”(肺癌)。百度媒体数据
百度媒体指数是百度新闻数据库收集的标题中包含特定关键词的新闻数量,数据来源于中国主要网站,包括全国性和地方性新闻网站和网络。我们从百度指数网站收集了关键词“肺癌”的每日百度媒体指数数据[
2014年1月1日至2016年12月31日。统计分析
我们对这两个变量进行了描述性统计。这些变量包括均值、标准差、中位数和四分位范围,以及两个变量的最小值和最大值。
我们用了Kruskal-WallisH测试,分别按月、季节、年份和城市检查所有城市肺癌搜索的每日百度指数的差异。我们检查了每日PM的差异2.5浓度用同样的方法。
我们使用Spearman和Pearson相关性分析来探索肺癌搜索的每日百度指数、肺癌的每日百度媒体指数和每日平均PM之间的相关性2.5浓度,统计学显著性水平设置为0.01。我们计算Pearson偏相关系数来评估百度指数、百度媒体指数和每日PM之间的相互相关性2.5浓度。多元线性回归分析探讨每日百度介质指数与每日平均PM对肺癌的潜在影响2.5肺癌搜索的每日百度指数的浓度
格兰杰因果关系是一种因果关系的概念,源于这样一种观点:原因不可能发生在结果之后,如果一个变量是另一个变量的原因,那么在较早的时间点了解原因的状态可以增强对较晚时间点结果的预测[
].我们使用格兰杰因果检验来分析两个时间序列变量之间是否存在因果关系。我们进行了恩格尔-格兰杰检验,以检验两个时间序列之间是否存在协整或长期关联[ ].在第一步中,我们使用单位根检验来检验肺癌搜索的百度指数的时间序列和每日PM的时间序列2.5浓度是固定的。如果两个时间序列在同一水平上都是平稳的,那么我们使用普通最小二乘估计协整回归模型。我们使用肺癌搜索的每日百度指数作为因变量和每日平均PM2.5浓度作为自变量。我们估计回归系数来评估日平均PM的影响2.5肺癌搜索的每日百度指数的浓度在第二步中,我们用单位根检验协整回归模型的残差序列是否平稳,这表明两个时间序列变量是协整的,满足格兰杰因果检验的前提。然后,我们进行格兰杰因果检验。使用IBM SPSS 19.0版本(IBM Corporation)进行描述性统计、Kruskal-Wallis H检验和Spearman相关分析,使用EViews 9学生版(IHS Global Inc)进行格兰杰因果关系检验。
结果
描述性分析
显示肺癌搜索的每日百度指数和每日平均PM的平均值和中位数2.52014年1月1日至2016年12月1日期间,31个中国城市的浓度。每日平均PM2.5所有城市的浓度为57.37 μg/m (SD 47.54)3..在空气污染方面,河北省石家庄市在31个城市中排名第一,其平均日平均PM2.5浓度为104.01 (SD 88.55) μg/m3.海南省海口市以平均日平均PM排名最后2.5浓度为21.64 (SD 15.2) μg/m3..在我们的数据中,最高的日平均PM2.5浓度为897.5 μg/m3.沈阳市2015年11月8日的最低浓度为2.5 μg/m3.2016年9月16日在南京举行。所有城市肺癌搜索的平均每日百度指数为180 (SD为83.21);也就是说,从2014年1月1日到2016年12月31日,“肺癌”一词平均每天有180次搜索。北京市肺癌日百度指数均值为408 (SD 69.53),在31个城市中排名第一。2016年5月16日,北京的每日百度肺癌搜索指数达到了1185的峰值,这是百度指数所有数据点中最高的。百度指数的数据尺度从0到1185,在研究期间的中位数为73。在所有城市中,肺癌搜索的每日百度指数和每日平均PM存在显著差异2.5浓度按月份、季节、年份和城市,分别(所有P< . 05)。
城市 | 每日百度肺癌搜索索引 | 每日平均PM2.5浓度(μg / m3.) | ||
意思是(SD) | 中位数(第25、75百分位) | 意思是(SD) | 中位数(第25、75百分位) | |
北京 | 408 (69.53) | 91 (366, 441) | 79.23 (68.25) | 60.85 (29.9, 106.43) |
长春 | 146 (28.52) | 74 (139, 162) | 58.68 (50.44) | 43.25 (28.43, 72.38) |
长沙 | 195 (31.42) | 75.5 (178, 216) | 62.8 (39.91) | 52.15 (36, 79.2) |
成都 | 277 (58.8) | 80 (236308) | 65.9 (44.22) | 53.35 (35.53, 82.98) |
重庆 | 208 (24.63) | 71 (194,222) | 57.24 (34.19) | 47.3 (33.9, 68.98) |
福州 | 165 (28.19) | 52 (151, 180) | 29.17 (16.14) | 26 (18.5, 36.1) |
广州 | 285 (40.96) | 55.5 (258.25, 306.75) | 40.78 (21.95) | 35.8 (24.4, 51.78) |
贵阳 | 122 (29.93) | 56.5 (87,143) | 40.13 (21.75) | 35.9 (24.73, 49.28) |
哈尔滨 | 168 (24.36) | 67 (159, 182) | 64.39 (65.96) | 40.95 (24.13, 83.48) |
海口 | 111 (30.37) | 35 (76,135) | 21.64 (15.2) | 16.3 (12.3, 26.5) |
杭州 | 250 (42.41) | 72 (219.25, 278.75) | 55.23 (30.74) | 48.9 (33,70.28) |
合肥 | 188 (31.58) | 85 (171,209) | 67.45 (41.39) | 58.2 (41.03, 83.35) |
呼和浩特 | 124 (30.98) | 74 (91, 146) | 42.24 (33.96) | 32.05 (19.2, 55.3) |
济南 | 196 (29.76) | 111 (177,214) | 85.06 (51.35) | 73.3 (51.83, 103.28) |
昆明 | 157 (27.95) | 51 (148, 173) | 29.79 (13.25) | 27.25 (19.9, 37.15) |
兰州 | 117 (32.65) | 83 (83,146) | 54.06 (28.25) | 46.2 (35.73, 65) |
拉萨 | 26日(31.4) | 57 (0,57) | 25.17 (12.11) | 22 (16.5, 30.3) |
南昌 | 149 (32.31) | 63 (137, 167) | 45.21 (30.93) | 37.1 (23.5, 57.68) |
南京 | 189 (25.97) | 78 (173,205) | 58.49 (38.18) | 49.65 (31.03, 76.25) |
南宁 | 143 (29.23) | 57 (133, 161) | 41.91 (28.42) | 34.15 (22,53.5) |
上海 | 335 (52.13) | 64 (303,358) | 50.17 (32.09) | 42.15 (27.2, 65) |
沈阳 | 171 (25.25) | 82 (156, 188) | 65.68 (54.92) | 49.6 (33.6, 82.43) |
石家庄 | 176 (32.92) | 115 (158, 200) | 104.01 (88.55) | 80.25 (43.53, 131.1) |
太原 | 150 (32.5) | 88 (137, 171) | 64.81 (45.83) | 53.15 (32.8, 83.33) |
天津 | 204 (24.9) | 90(186、220) | 74.63 (53.61) | 60.6 (37.33, 95.08) |
乌鲁木齐 | 116 (29.92) | 87 (82,139) | 66.97 (61.11) | 41.65 (27.6, 82.28) |
武汉 | 227 (26.54) | 87 (212.25, 240) | 69.48 (46.95) | 58.9 (38.13, 86.28) |
西安 | 207 (29.64) | 87 (192,223) | 68.3 (54.44) | 51.35 (35.2, 79.1) |
西宁 | 73 (29.5) | 80 (59,74) | 52.63 (24.34) | 47.35 (35.73, 65.05) |
银川 | 82 (30.54) | 76 (61,118) | 50.04 (31.12) | 40.9 (30.13, 58.38) |
郑州 | 223 (29.74) | 107 (203,242) | 87.02 (61.2) | 71.4 (46.8, 108.78) |
所有的城市 | 180 (83.21) | 73 (136,218) | 57.37 (47.54) | 44 (27.6, 71.3) |
与2014年相比,2015年和2016年所有城市肺癌搜索的百度指数分别下降了2%和5%。年平均日平均PM2.52014年至2016年,浓度略有下降。2016年肺癌的百度媒体指数范围为0 ~ 6523,中位数为9(第25、75百分位4,14)。肺癌百度媒体指数在2015年9月17日达到峰值。
为平均日平均PM的分布2.5在研究期间,31个中国首都城市肺癌搜索的浓度和平均每日百度指数。相关分析
除成都和呼和浩特外,肺癌日百度指数与日平均PM之间的两两相关系数(Spearman rho)2.5浓度是阳性的。大部分Spearman等级相关系数具有统计学意义(P< . 05)。然而,肺癌搜索的每日百度指数与每日平均PM之间的相关性2.5注意力不集中(所有r2年代< 1。)(
).杭州、郑州和合肥的相关系数分别为0.240、0.238和0.231P<措施)。对于所有城市,肺癌搜索的每日百度指数与每日PM之间存在正相关2.5浓度(ρ= .247,P<措施)。 为Pearson相关分析和的结果 显示了多元线性回归分析的结果。每日PM之间的相关性2.5浓度和每日百度指数之间的肺癌搜索大于每日PM之间2.5每日百度媒体指数。当肺癌的每日百度媒体指数为控制变量时,每个城市肺癌搜索的每日百度指数与每日平均PM之间的偏相关系数2.5浓度,几乎等于皮尔逊相关系数。肺癌的每日百度媒体指数对肺癌搜索的每日百度指数与每日平均PM之间的关系影响不大2.5浓度根据偏相关系数。总体而言,每日百度肺癌搜索指数、每日百度媒体指数和每日PM之间的相关性和互相关性2.5注意力不集中。格兰杰因果关系
我们使用增强的Dickey-Fuller单位根检验来检验2个时间序列的平稳性。使用Schwarz信息准则自动确定滞后长度。除成都外,其他城市的序列均稳定在0.01的统计显著性水平上,成都的序列也稳定在第一个差值处(
).由于每个城市的序列被发现在同一水平上是平稳的,因此,两个变量满足协整的前提条件,并检查了长期的协整关系。城市 | 相关 | |||||
百度指数和PM2.5 | 百度指数&百度媒体指数 | 百度媒体指数& PM2.5 | ||||
r年代 | P价值 | r年代 | P价值 | r年代 | P价值 | |
北京 | .093一个 | .002 | .359一个 | <措施 | -.013 | .68点 |
长春 | .060b | .048 | .167一个 | <措施 | .122一个 | <措施 |
长沙 | .184一个 | <措施 | .196一个 | <措施 | .047 | 点 |
成都 | -.041 | 。 | .006 | 点 | .026 | .40 |
重庆 | .139一个 | <措施 | .189一个 | <措施 | -.015 | .62 |
福州 | .125一个 | <措施 | .191一个 | <措施 | .099一个 | 措施 |
广州 | .167一个 | <措施 | .303一个 | <措施 | .003 | 公布 |
贵阳 | .062b | .04点 | .096一个 | 措施 | .029 | 点 |
哈尔滨 | .219一个 | <措施 | .269一个 | <措施 | .145一个 | <措施 |
海口 | .091一个 | .002 | .164一个 | <措施 | -.018 | 55 |
杭州 | 本场比赛一个 | <措施 | 建仔一个 | <措施 | .133一个 | <措施 |
合肥 | .231一个 | <措施 | .225一个 | <措施 | .098一个 | 措施 |
呼和浩特 | .036 | 23) | .188一个 | <措施 | .028 | 36 |
济南 | .149一个 | <措施 | .164一个 | <措施 | .052 | .09点 |
昆明 | .024 | 点 | .081一个 | .007 | .031 | .30 |
兰州 | .057 | 06 | .149一个 | <措施 | .046 | 13。 |
拉萨 | 措施 | .98点 | .039 | .19 | .123一个 | <措施 |
南昌 | .118一个 | <措施 | .228一个 | <措施 | .047 | 点 |
南京 | .220一个 | <措施 | .232一个 | <措施 | .125一个 | <措施 |
南宁 | .039 | .19 | .165一个 | <措施 | -.005 | .87点 |
上海 | .050 | .10 | .269一个 | <措施 | .115一个 | <措施 |
沈阳 | .100一个 | 措施 | .276一个 | <措施 | .103一个 | 措施 |
石家庄 | .204一个 | <措施 | .179一个 | <措施 | .030 | .33 |
太原 | .088一个 | .003 | .218一个 | <措施 | .027 | 38 |
天津 | .085一个 | .005 | .290一个 | <措施 | .037 | 口径。 |
乌鲁木齐 | .153一个 | <措施 | .115一个 | <措施 | .058 | 06 |
武汉 | .154一个 | <措施 | .201一个 | <措施 | .055 | 07 |
西安 | .111一个 | <措施 | 建仔一个 | <措施 | .035 | 二十五分 |
西宁 | .081一个 | .007 | .105一个 | 措施 | .109一个 | <措施 |
银川 | -.012 | .68点 | .102一个 | 措施 | .012 | i = |
郑州 | .238一个 | <措施 | .277一个 | <措施 | .085一个 | .005 |
一个相关性在0.01水平上显著(2尾)。
b相关性在0.05水平上显著(2尾)。
城市 | 每日百度指数时间序列的单位根检验 肺癌搜索 |
日PM时间序列的单位根检验2.5 浓度 |
结果一个 | ||||
ADFb | 1%的水平 | P价值 | ADF | 1%的水平 | P价值 | ||
北京 | -5.23 | -3.44 | <措施 | -18.44 | -3.44 | <措施 | 平稳性 |
长春 | -7.83 | -3.44 | <措施 | -7.32 | -3.44 | <措施 | 平稳性 |
成都 | -23.41 | -3.44 | <措施 | -17.18 | -3.44 | <措施 | 平稳性 |
重庆 | -5.70 | -3.44 | <措施 | -10.18 | -3.44 | <措施 | 平稳性 |
长沙 | -5.25 | -3.44 | <措施 | -9.76 | -3.44 | <措施 | 平稳性 |
福州 | -5.00 | -3.44 | <措施 | -8.88 | -3.44 | <措施 | 平稳性 |
贵阳 | -29.62 | -3.44 | <措施 | -8.78 | -3.44 | <措施 | 平稳性 |
贵州 | -6.01 | -3.44 | <措施 | -13.39 | -3.44 | <措施 | 平稳性 |
哈尔滨 | -7.21 | -3.44 | <措施 | -6.49 | -3.44 | <措施 | 平稳性 |
合肥 | -4.50 | -3.44 | <措施 | -7.13 | -3.44 | <措施 | 平稳性 |
呼和浩特 | -27.24 | -3.44 | <措施 | -4.58 | -3.44 | <措施 | 平稳性 |
海口 | -30.13 | -3.44 | <措施 | -10.92 | -3.44 | <措施 | 平稳性 |
杭州 | -3.79 | -3.44 | <措施 | -4.53 | -3.44 | <措施 | 平稳性 |
济南 | -5.10 | -3.44 | <措施 | -15.65 | -3.44 | <措施 | 平稳性 |
昆明 | -7.64 | -3.44 | <措施 | -9.28 | -3.44 | <措施 | 平稳性 |
拉萨 | -4.33 | -2.57 | <措施 | -4.24 | -3.44 | <措施 | 平稳性 |
兰州 | -28.38 | -3.44 | <措施 | -5.47 | -3.44 | <措施 | 平稳性 |
南昌 | -7.17 | -3.44 | <措施 | -10.42 | -3.44 | <措施 | 平稳性 |
南京 | -5.60 | -3.44 | <措施 | -6.29 | -3.44 | <措施 | 平稳性 |
南宁 | -7.48 | -3.44 | <措施 | -7.62 | -3.44 | <措施 | 平稳性 |
上海 | -5.68 | -3.44 | <措施 | -18.64 | -3.44 | <措施 | 平稳性 |
石家庄 | -4.58 | -3.44 | <措施 | -4.71 | -3.44 | <措施 | 平稳性 |
沈阳 | -5.23 | -3.44 | <措施 | -12.08 | -3.44 | <措施 | 平稳性 |
天津 | -5.84 | -3.44 | <措施 | -6.99 | -3.44 | <措施 | 平稳性 |
太原 | -5.80 | -3.44 | <措施 | -4.69 | -3.44 | <措施 | 平稳性 |
武汉 | -5.47 | -3.44 | <措施 | -4.38 | -3.44 | <措施 | 平稳性 |
西安 | -5.20 | -3.44 | <措施 | -4.31 | -3.44 | <措施 | 平稳性 |
西宁 | -30.74 | -3.44 | <措施 | -5.49 | -3.44 | <措施 | 平稳性 |
银川 | -19.20 | -3.44 | <措施 | -10.21 | -3.44 | <措施 | 平稳性 |
郑州 | -5.16 | -3.44 | <措施 | -5.44 | -3.44 | <措施 | 平稳性 |
一个日平均PM的时间序列2.5肺癌的日百度指数和浓度均稳定在同一水平。
bADF:增广Dickey-Fuller单位根检验。
在31个省会城市中,有17个城市的回归分析显示,日平均pm2.5有正向影响2.5对肺癌搜索的每日百度指数的浓度有统计学意义(
).我们观察到广州的相关性最强,回归系数为0.26 (95% CI为0.16-0.38)。日平均PM的影响2.5成都和银川市的回归系数为-0.08 (95% CI为-0.16 ~ 0),银川市的回归系数为-0.03 (95% CI为-0.09 ~ 0.03),差异无统计学意义。所有城市的回归系数为0.30(95%置信区间0.28-0.32)。总的来说,日平均PM之间的关系2.5浓度和肺癌搜索的每日百度指数适中。面板协整(Engle-Granger)检验的结果表明,各城市变量之间存在1%显著性水平的协整(
).协整检验揭示了变量之间存在长期关系,但没有表明因果关系的方向。格兰杰因果检验的结果表明,PM不存在单向因果关系2.5为百度指数,所有城市在5%的水平上均具有统计学意义( ).城市 | 残差级数的单位根检验 | 结果一个 | ||||
ADFb | 1%的水平 | 5%的水平 | 10%的水平 | P价值 | ||
北京 | -5.26 | -2.57 | -1.94 | -1.62 | <措施 | 协整 |
长春 | -7.84 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
成都 | -23.32 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
重庆 | -5.89 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
长沙 | -5.52 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
福州 | -5.08 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
贵阳 | -29.63 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
贵州 | -6.18 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
哈尔滨 | -7.53 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
合肥 | -4.74 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
呼和浩特 | -27.24 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
海口 | -30.22 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
杭州 | -4.06 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
济南 | -5.24 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
昆明 | -7.65 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
拉萨 | -20.05 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
兰州 | -28.46 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
南昌 | -7.22 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
南京 | -5.78 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
南宁 | -7.48 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
上海 | -5.71 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
石家庄 | -4.85 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
沈阳 | -5.35 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
天津 | -5.95 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
太原 | -5.83 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
武汉 | -5.51 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
西安 | -5.21 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
西宁 | -30.80 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
银川 | -19.20 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
郑州 | -5.44 | -3.44 | -2.86 | -2.57 | <措施 | 协整 |
一个日平均PM的时间序列2.5与肺癌的日百度指数呈协整关系。
bADF:增广Dickey-Fuller单位根检验。
城市 | 零假设一个 | |||||
每日平均PM2.5浓度不会格兰杰 导致肺癌搜索的每日百度指数 |
每日百度肺癌搜索指数没有 格兰杰导致每日平均PM2.5浓度 |
|||||
F统计 | df | P价值 | F统计 | df | P价值 | |
北京 | 1.25 | 15日,1066年 | 23) | 0.66 | 15日,1066年 | 结果 |
长春 | 1.62 | 1086 | 酒精含量 | 0.30 | 1086 | 点 |
成都 | 0.17 | 1086 | .97点 | 1.39 | 1086 | 口径。 |
重庆 | 1.32 | 1084 | 。 | 1.41 | 1084 | .20 |
长沙 | 1.30 | 1084 | 二十五分 | 1.14 | 1084 | .33 |
福州 | 0.93 | 1079 | 票价 | 1.21 | 1079 | 29 |
贵阳 | 0.19 | 1090 | 点 | 0.36 | 1090 | 54 |
贵州 | 1.54 | 1086 | 。 | 1.84 | 1086 | .10 |
哈尔滨 | 1.14 | 1084 | .33 | 2.78 | 1084 | . 01 |
合肥 | 1.94 | 1084 | 07 | 2.62 | 1084 | . 01 |
呼和浩特 | 1.72 | 1090 | .19 | 0.15 | 1090 | i = |
海口 | 1.69 | 1090 | .19 | 1.44 | 1090 | 口径。 |
杭州 | 0.86 | 1084 | 点 | 1.86 | 1084 | 。08 |
济南 | 1.57 | 1084 | 酒精含量 | 1.42 | 1084 | .20 |
昆明 | 1.13 | 1084 | 点 | 0.88 | 1084 | 50 |
拉萨 | 0.81 | 1090 | .37点 | 0.14 | 1090 | 2 |
兰州 | 1.97 | 1090 | 16 | 2.91 | 1090 | 。08 |
南昌 | 1.28 | 1084 | 点 | 1.45 | 1084 | .19 |
南京 | 1.49 | 1084 | 只要 | 2.05 | 1084 | 0。 |
南宁 | 0.62 | 1086 | .68点 | 1.82 | 1086 | .10 |
上海 | 0.59 | 1080 | .79 | 0.65 | 1080 | 收 |
石家庄 | 0.52 | 1084 | .79 | 1.62 | 1084 | 13。 |
沈阳 | 0.39 | 1078 | 多多 | 0.88 | 1078 | 50 |
天津 | 0.89 | 1086 | 的相关性 | 0.90 | 1086 | 票价 |
太原 | 2.42 | 1082 | 02 | 0.66 | 1082 | .7 |
武汉 | 0.95 | 1084 | 。45 | 1.09 | 1084 | 36 |
西安 | 1.35 | 1082 | 口径。 | 0.72 | 1082 | .64点 |
西宁 | 3.40 | 1090 | 06 | 0.17 | 1090 | 正 |
银川 | 0.24 | 1090 | 收 | 0.00 | 1090 | 获得 |
郑州 | 1.71 | 1084 | 厚 | 1.28 | 1084 | 点 |
一个零假设被拒绝时P< . 01。
讨论
主要结果
我们的分析显示,日平均PM之间有轻微的正相关2.5在31个城市中,大多数城市的“肺癌”搜索词的每日百度指数。回归分析结果还表明,日平均PM2.5浓度对肺癌搜索的每日百度指数有微弱影响。格兰杰因果检验表明,日平均PM之间不存在因果关系2.5浓度和肺癌搜索的每日百度指数。
一些研究评估了PM之间的关系2.5以及随后肺癌发病率和死亡率的风险,这表明PM2.5可能是肺癌的危险因素。因此,中国的大众媒体经常提醒人们在高浓度PM时采取必要的防护措施2.5.公众对肺癌的研究兴趣反映了他们对这种疾病的关注。在中国,普通民众可以很容易地获得关于总理的日常信息2.5通过政府官方网站、新闻媒体以及众多天气预报手机app进行关注。然而,很少有人知道关于PM的日常信息是否被报道2.5浓度显著刺激了中国公众对肺癌的兴趣。谷歌趋势和百度指数已被证明是反映公众对与健康有关主题的兴趣和关注的有用指标[
- ].在我们的研究中,我们假设百度指数可以作为日常PM的反映,为普通人群对肺癌的兴趣提供潜在的洞察2.5浓度。王等[
调查了中国社交媒体在监测空气质量趋势以及相关公众认知和反应方面的价值;他们发现媒体数据包含丰富的细节,包括感知、行为和自我报告的健康影响,这为我们的研究提供了理论基础。在我们的研究中,我们从百度搜索引擎中提取了真实的搜索数据,并检查了每日报告的PM之间的关系2.5浓度数据和特定搜索词“肺癌”的搜索数据来检验我们的假设。2013年,欧洲空气污染影响队列研究报告称,每5 μg/m3.PM增加2.5与肺癌的危险比为1.18 (95% CI 0.96-1.46)有统计学意义相关[
].许多研究表明PM2.5可能会导致肺癌,目前仍有许多关于PM2.5还有肺癌。然而,目前还不清楚PM之间是否存在关联2.5而肺癌的危险性已被广大公众所认识。除了调查和访谈等传统方法外,我们还可以使用基于互联网的数据来调查现有的认知,并增强与健康相关的数据。因此,我们使用百度指数数据来衡量公众对PM关联的认识2.5会增加患肺癌的风险。我们的结果表明,每天平均PM2.5浓度对肺癌搜索的每日百度指数有适度的影响,但关于相关性仍存在很大的不确定性。首先,日平均PM的影响2.5关注公众对其健康危害的认识可能是微不足道的。直到PM对健康造成严重危害,人们才会对肺癌风险产生很大的关注2.5出现。然而,当PM的重要性降低时,肺癌的在线搜索量可能会下降2.5已得到广泛认可。同样,某些事件引起的肺癌最初的恐慌可能会在最初几天增加“肺癌”一词的搜索量,在最初的恐慌之后可能会下降;这样的可能性可能会使我们的结果产生偏差。其次,肺癌是一种慢性疾病,起病缓慢,暴露在PM环境中2.5从长远来看对肺癌风险更不利。每日平均PM2.5浓度对肺癌搜索率的影响相对较长,表明这种关系可能存在较长时间的滞后。第三,缺乏PM意识2.5可能会增加患肺癌的风险对PM2.5以及用于肺癌搜索的百度指数。
中国是一个幅员辽阔的多元国家,拥有13亿多人口。PM的影响2.5肺癌搜索的百度指数也可能取决于人口和社会经济条件,以及不同城市居民健康素养的差异。为石家庄市,日均下午2.5但肺癌搜索的百度指数明显低于一些发达城市,如北京、福州和广州。华东地区人口密集、经济发达城市的人群健康意识较人口稀少、经济发展中城市的人群更高,互联网使用率更高,对健康信息的搜索频率更高。每日平均PM2.5拉萨的肺癌浓度与海口相似,但这两个城市肺癌搜索的百度指数有显著差异。在我们的数据中,平均每日PM2.5所有城市的浓度为53.47 μg/m (SD 47.54)3.这超过了世界卫生组织(World Health Organization)规定的每立方米25微克的标准3.[
].虽然近年来空气质量有所改善,但PM2.5冬季的污染正在恶化,尤其是在中国北方。点2.5污染是一个威胁公众健康的新问题,尤其是在中国的超大城市群[ ].在我们研究的31个中国城市中,大多数城市的人都有严重的健康问题,这与PM有关2.5.因此,PM对健康的影响2.5在地方层面上,每个城市都需要认真对待。地方当局应作出更大努力,改善其城市的空气质量和电子健康素养。网上健康信息应该让公众更容易获得,特别是在经济不发达地区。11月是国际上的肺癌宣传月,11月18日是肺癌日,旨在提高公众对肺癌的认识。在本研究中,我们通过Kruskal-Wallis发现不同月份间肺癌百度介质指数有显著性差异H测试。百度传媒指数11月平均排名最高(
);然而,在11月份,31个城市中没有一个城市的房价是最高的。“肺癌宣传月”活动对中国公众对肺癌搜索兴趣的影响低于我们的预期。根据每日百度指数、每日百度媒体指数和每日PM之间的相关性分析2.5浓度,这些变量之间的相关性和互相关性较差,日百度媒介指数对日百度指数与日PM之间的相关性影响不大2.5浓度。这表明每天报告的PM2.5对提高中国公众或媒体对肺癌的关注可能没有什么影响。与我们的预期相反,每天平均PM2.5浓度并没有显著提高公众对肺癌的认识。肺癌是最普遍和最致命的癌症之一。增加10 μg/m3.的点2.5可能导致肺癌发病率上升22% [
, ].重要的是要强调公众对肺癌可改变危险因素的认识和知识对预防的重要性。缺乏对PM引起肺癌风险的认识2.5考虑到生活方式的改变和风险因素的避免,可能会对公众产生有害的后果,并可能限制公众参与肺癌预防或避免PM2.5.提高这种意识可能会提高对肺癌危险因素的自我保护回避。Ngo等人指出,认识空气污染与其负面健康影响之间的联系,有助于公众提高对空气污染的认识并制定应对措施。这种意识也可引导公众寻求更多有关空气污染及其危害的资料,并因应环境及其风险[ ].根据第39次中国互联网发展状况统计报告,2016年有1.95亿人使用互联网进行医疗保健,年增长率为28%,健康信息查询量增长10.8% [ ].互联网可以被视为感知、行为和自我报告的健康影响的传感器[ ].应充分利用互联网和社交媒体的这一优势,提高公众对项目管理关联的认识2.5肺癌的风险。同时,监测公众对PM健康危害的反应2.5是为了避免引起社会恐慌。对癌症的认识有限会阻碍初级预防和癌症的早期发现,对PM的关联缺乏认识也会阻碍2.5肺癌的风险。癌症宣传活动可有效激发公众的反应和网上活动,并可提高对癌症的认识和认识[ , ].需要开展宣传活动,以提高公众对PM肺癌风险的认识2.5并应旨在提高对肺癌的认识,并促进积极采取有效措施减少接触PM2.5在雾蒙蒙的日子里。优势与局限
这项研究的优势在于,据我们所知,这是第一次探索每日平均PM之间的关系2.5中国31个城市的“肺癌”搜索词的每日百度指数。
这项研究有一些局限性。我们从一个搜索引擎百度收集了互联网搜索数据。百度是中国最常用的搜索引擎。百度指数提供了各个城市的绝对搜索数据,可用于城市之间的直接比较分析。我们只使用了“肺癌”这个词,这可能会限制搜索数据。也不可能确定互联网用户的类型或哪些利益相关者负责搜索活动。搜索引擎的搜索词趋势可能会受到公众恐慌等因素的影响[
].有些人可能会出于其他目的搜索“肺癌”一词。搜索数据受这些随机因素的影响是使用搜索引擎数据进行研究不可避免的局限性。我们和许多其他学者都致力于解决这个问题,并正在寻找方法来识别和减少嵌入在搜索引擎数据中的偏见。本研究也受到研究区域的限制。我们只关注了31个城市,所以结果不能外推到其他城市和农村地区。探索项目管理与项目管理之间的关系超出了我们的工作范围2.5以及在线搜索其他疾病的信息,或在线搜索肺癌与其他风险因素之间的关系。结论
每日平均PM2.5浓度对“肺癌”一词的网络搜索有微弱的正向影响。需要精心设计的宣传活动来提高公众对PM关联的认识2.5,以引导公众寻求更多关于PM的信息2.5及其危害,并适当地应对其环境及其风险。
致谢
国家自然科学基金(71473175;71673199)、天津市科委重点科学项目(15ZCZDSY00500)、天津市哲学社会科学项目(TJSR13-006)。
利益冲突
没有宣布。
参考文献
- 欧阳阳。中国意识到空气污染的危机。柳叶刀呼吸医学2013年3月1日(1):12。[CrossRef] [Medline]
- 陈勇,埃本斯坦A,格林斯通M,李慧。持续暴露于空气污染对中国淮河政策预期寿命影响的证据。Proc Natl Acad Sci U S A 2013 Aug 06;110(32):12936-12941 [免费全文] [CrossRef] [Medline]
- 关伟,郑旭,钟克芳,钟宁。空气污染对中国慢性呼吸道疾病负担的影响:迫在眉睫的行动。柳叶刀2016年10月15日;388(10054):1939-1951。[CrossRef] [Medline]
- 阴P,他G,风扇,赵肯塔基州,风扇,刘C, et al。中国38个大城市的颗粒物空气污染与死亡率:时间序列分析BMJ 2017 Mar 14;356:j667 [免费全文] [Medline]
- Maji KJ, Arora M, Dikshit AK。中国190个城市PM2.5和PM10暴露造成的疾病负担环境科学学报,2017年4月24日(12):11559-11572。[CrossRef] [Medline]
- 谢锐,Sabel CE,陆旭,朱伟,阚华,Nielsen CP,等。中国PM2.5诱发过早死亡的长期趋势及空间格局environment Int 2016年12月;97:180-186。[CrossRef] [Medline]
- 方东,王强,李红,余勇,陆勇,钱霞。中国74个主要城市PM2.5污染的死亡率影响评价。科学总环境2016年11月1日;569-570:1545-1552。[CrossRef] [Medline]
- Cohen AJ, Brauer M, Burnett R, Anderson HR, Frostad J, Estep K,等。环境空气污染造成的全球疾病负担的估计和25年趋势:对2015年全球疾病负担研究数据的分析柳叶刀2017年5月13日;389(10082):1907-1918 [免费全文] [CrossRef] [Medline]
- 李文杰,李文杰,李文杰,李文杰,李文杰。全球范围内室外空气污染源对过早死亡的影响。自然杂志2015年9月17日;525(7569):367-371。[CrossRef] [Medline]
- 陈伟,郑锐,巴德PD,张松,曾华,Bray F,等。2015年中国癌症统计。中华癌症杂志2016;26 (2):115-132 [免费全文] [CrossRef] [Medline]
- Loomis D, Grosse Y, Lauby-Secretan B, El Ghissassi F, Bouvard V, Benbrahim-Tallaa L,国际癌症研究机构专著工作组IARC。室外空气污染致癌性。柳叶刀Oncol 2013 12月;14(13):1262-1263。[Medline]
- 李文杰,李文杰,李文杰,等。17个欧洲队列的空气污染和肺癌发病率:来自欧洲空气污染影响队列研究(ESCAPE)的前瞻性分析。《柳叶刀》2013年8月14日(9):813-822。[CrossRef] [Medline]
- 崔鹏,黄燕,韩娟,宋峰,陈凯。环境颗粒物与肺癌发病率和死亡率:前瞻性研究的meta分析。欧洲公共卫生杂志2015年4月25日(2):324-329。[CrossRef] [Medline]
- 杨伟,赵辉,王旭,邓强,范伟,王磊。长期暴露于室外空气污染与肺癌风险的循证评估。欧洲癌症预防杂志2016年5月;25(3):163-172。[CrossRef] [Medline]
- 张志刚,张志刚,张志刚,张志刚,等。室外颗粒物暴露与肺癌:系统回顾和荟萃分析。环境健康展望2014年9月;122(9):906-911 [免费全文] [CrossRef] [Medline]
- 王敏,王志强,王志强,王志强,等。颗粒物空气污染成分与肺癌风险。环境Int 2016年2月;87:66-73。[CrossRef] [Medline]
- 黄峰,潘斌,吴娟,陈娥,陈琳。PM2.5暴露与肺癌发病率和死亡率的关系:一项meta分析。Oncotarget 2017年4月21日[免费全文] [CrossRef] [Medline]
- Foroughi F, Lam AK, Lim MSC, Saremi N, Ahmadvand A.“谷歌搜索”癌症:澳大利亚、加拿大、新西兰、英国和美国在线搜索兴趣的信息流行病学评估。JMIR Cancer 2016年5月04日;2(1):e5 [免费全文] [CrossRef] [Medline]
- 王志强,王志强,王志强,等。癌症患者使用互联网的调查。2011年8月19日(8):1183-1190。[CrossRef] [Medline]
- Ginsberg J, Mohebbi MH, Patel RS, Brammer L, Smolinski MS, Brilliant L.利用搜索引擎查询数据检测流感流行。自然杂志2009年2月19日;457(7232):1012-1014。[CrossRef] [Medline]
- 布朗斯坦JS,弗雷菲尔德CC,麦道夫LC。数字化疾病检测——利用网络进行公共卫生监测。N Engl J Med 2009 5月21日;360(21):2153- 5,2157 [免费全文] [CrossRef] [Medline]
- Pelat C, Turbelin C, Bar-Hen A, Flahault A, valeron AJ。使用谷歌Trends跟踪更多疾病。Emerg infection Dis 2009 Aug;15(8):1327-1328 [免费全文] [CrossRef] [Medline]
- 周旭,杨峰,冯勇,李强,唐峰,胡松,等。一种利用互联网收集的异构数据检测全球流感流行的时空方法。IEEE/ACM Trans compput Biol Bioinform 2017 04月04日。[CrossRef] [Medline]
- Shah MP, Lopman BA, Tate JE, Harris J, Esparza-Aguilar M, Sanchez-Uribe E,等。利用互联网搜索数据监测轮状病毒疫苗在美国、英国和墨西哥的影响。儿科感染杂志2017年3月21日。[CrossRef] [Medline]
- 中国互联网络信息中心。中国网民搜索行为研究。中国北京:CINNC;2015.URL:http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/ssbg/201607/P020160726510595928401.pdf[访问时间:2017-05-21][WebCite缓存]
- PM2.5科学实验小组。空气质量历史数据。URL:https://www.aqistudy.cn/[访问时间:2017-05-21][WebCite缓存]
- 百度指数。中国北京:百度,Inchttps://index.baidu.com/[访问时间:2017-05-21][WebCite缓存]
- 格兰杰CWJ。通过计量经济模型和交叉光谱方法调查因果关系。计量经济学1969年8月;37(3):424-438。[CrossRef]
- 格兰杰CWJ,林俊林。长期的因果关系。计量经济理论1995;11(3):530-536。
- 王s, Paul MJ, Dredze M.社交媒体作为中国空气质量和公众反应的传感器。J Med Internet Res 2015年3月26日;17(3):e22 [免费全文] [CrossRef] [Medline]
- Glynn RW, Kelly JC, Coffey N, Sweeney KJ, Kerin MJ。乳腺癌宣传月对互联网搜索活动的影响——与肺癌和前列腺癌宣传活动的比较。BMC Cancer 2011;11:442 [免费全文] [CrossRef] [Medline]
- Scheres LJJ, Lijfering WM, Middeldorp S, Cannegieter SC.世界血栓形成日数字信息搜索对静脉血栓形成的影响:谷歌趋势研究。《血栓血液学杂志》2016年12月;14(12):2325-2328。[CrossRef] [Medline]
- 世界卫生组织。世卫组织关于颗粒物、臭氧、二氧化氮和二氧化硫的空气质量指南:2005年全球更新。风险评估总结。瑞士日内瓦:世卫组织;2006.URL:http://apps.who.int/iris/bitstream/10665/69477/1/WHO_SDE_PHE_OEH_06.02_eng.pdf[访问时间:2017-09-15][WebCite缓存]
- 宋超,吴林,谢勇,何俊,陈鑫,王涛,等。中国空气污染现状与时空变化。环境污染2017年5月05日;27:34 -347。[CrossRef] [Medline]
- Cesaroni G, Badaloni C, Gariazzo C, Stafoggia M, Sozzi R, Davoli M,等。罗马100多万成年人长期暴露于城市空气污染和死亡率之间的关系。环境卫生展望2013年3月;121(3):324-331 [免费全文] [CrossRef] [Medline]
- Ngo NS, Kokoyo S, Klopp J.为什么参与对空气质量研究很重要:风险认知,对空气污染的理解和肯尼亚内罗毕贫困社区的动员。公共卫生2017年1月;142:177-185。[CrossRef] [Medline]
- 中国互联网络信息中心。中国互联网发展统计报告。中国北京:CINNC网址:http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201701/t20170122_66437.htm[访问时间:2017-05-21][WebCite缓存]
- 周欣,沈宏。基于搜索引擎数据的法定传染病监测。浙江大学学报(自然科学版)2010 4月17日;11(4):241-248。[CrossRef]
缩写
点2.5:环境中直径<5 μm的细颗粒物 |
G·艾森巴赫(G Eysenbach)编辑;提交23.05.17;同行评议:SFA Shah, X Zhou;作者评论29.06.17;订正版本收到22.07.17;接受09.08.17;发表03.10.17
版权©杨红喜,李舒,孙莉,张新宇,侯杰,王耀刚。最初发表于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com), 2017年10月3日。
这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,http://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。