卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JPH

JMIR公共卫生监测

JMIR公共卫生和监视

2369 - 2960

卡塔尔世界杯8强波胆分析

加拿大多伦多

v4i4e10827

30467106

10.2196/10827

原始论文

突发公共卫生事件中卫生机构响应和公众参与的动态:2016年寨卡疫情期间CDC推特模式的案例研究

桑切斯

特拉维斯

夏普

j·丹尼尔

科迪兹

杰森

陈

史

博士学位 1

公共卫生科学系北卡罗来纳大学夏洛特分校

大学城大道9021号

北卡罗来纳州夏洛特，邮编:28223

美国 1 8148800738 schen56@uncc.edu

http://orcid.org/0000-0002-2316-111X

徐

钱

博士学位 2

http://orcid.org/0000-0002-2354-0208

Buchenberger

约翰

女士 1

http://orcid.org/0000-0002-8247-0342

Bagavathi

Arunkumar

女士 3.

http://orcid.org/0000-0002-7135-4602

公平

盖伯瑞尔

废话 3.

http://orcid.org/0000-0002-0560-9558

谢赫

萨米拉

博士学位 3.

http://orcid.org/0000-0002-2488-9436

克里希南

哈斯。

博士学位 3.

http://orcid.org/0000-0002-9570-0186

1 公共卫生科学系北卡罗来纳大学夏洛特分校

夏洛特,数控

美国 2 传媒学院伦大学

伦、数控

美国 3. 计算机科学系北卡罗来纳大学夏洛特分校

夏洛特,数控

美国

通讯作者:石晨 schen56@uncc.edu

Oct-Dec 2018

22 11 2018

4 4

e10827

10 5 2018 28 6 2018 12 7 2018 14 9 2018

©Shi Chen, Qian Xu, John Buchenberger, Arunkumar Bagavathi, Gabriel Fair, Samira Shaikh, Siddharth Krishnan。原载于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com)， 2018年11月22日。

2018

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息，http://publichealth.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。

背景

卫生机构越来越多地采用社交媒体传播信息，与公众互动，了解公众舆论。其中，美国疾病控制与预防中心(CDC)是第一批在突发卫生事件和危机期间采用社交媒体的美国政府卫生机构之一。2016年寨卡疫情期间，该公司一直活跃在推特上，该疫情导致美国国内5168例非先天性病例。

客观的

这项研究的目的是量化CDC在整个寨卡疫情期间的推特活动、被定义为转发和回复的公众参与以及寨卡病例数的时间变量。然后比较这3个数据集的模式，以确定国内寨卡病例数、疾病控制与预防中心在推特上的回应和公众参与这一主题之间可能存在的差异。

方法

2016年cdc发起发布的所有推文以及相应的转发和回复都来自67个cdc相关的推特账户。2016年每个季度对国内寨卡病例数、CDC推文活动以及CDC发起推文的公众参与进行了单变量和多变量时间序列分析。

结果

2016年第一季度，当美国50个州和地区的寨卡病例数较低时，CDC发布了84.0%(5130/6104)的寨卡推文(分别只有560/5168,10.8%病例和662/ 38885,1.70%病例)。虽然寨卡病毒病例数在第二和第三季度急剧增加，但疾控中心在Twitter上的努力大幅减少。基于自回归综合移动平均模型的结果，CDC发起的推文中公众参与的时间序列在不同季度和原始CDC推文中普遍存在差异。在第二季度，疾病控制与预防中心的原始推文和公众参与与寨卡病毒病例数的相互信息最高。此外，公众对CDC原始推文的参与与实际的寨卡病例数有很大的相关性，并先于实际病例数。

结论

疾病预防控制中心关于寨卡病毒的原始推文、这些推文中的公众参与和实际寨卡病毒流行之间存在相当大的差异。2016年不同季度的差异模式也有所不同。疾控中心在寨卡病毒的早期预警方面要积极得多，尤其是在2016年第一季度。与CDC在今年晚些时候发布的原始推文数量相比，公众参与CDC原始推文的数量更能预测寨卡病毒的实际流行。

疾病控制和预防中心公众参与推特时间序列分析 Zika病毒流行社交媒体推特 infodemiology infoveillance

简介

世界卫生组织(卫生组织)指出，健康是最基本的人权之一[ 1］．社交媒体日益成为公众寻求、分享和讨论健康和疾病信息的重要场所。由于社交媒体成本低、易于获取和覆盖面广，卫生专业人员和机构也越来越多地采用社交媒体来加强公共卫生传播[ 2］．例如，社会媒体已被用来监测食品安全和食源性病原体的爆发，如大肠杆菌O157 [ 3.， 4]，在不同国家和地区(美国、加拿大和香港)，利用不同的社交媒体平台(Facebook、Twitter和WhatsApp [ 5]);倡导运动、健身和健康生活方式(微信中国健康运动[ 6];洛杉矶新奥尔良的健身运动[ 7]);提高市民对空气质素及污染的认识及参与[ 8];了解和监测公众对抗菌药物耐药性等有争议话题的讨论[ 9］．

许多政府机构和卫生官员(如世界卫生组织和美国疾病控制与预防中心，以及其他地方卫生部门)也采用和利用社交媒体传播信息，与公众沟通，了解公众的意见和关切，特别是在突发卫生事件和危机期间。欧洲已为流感制定了基于网络的媒体和危机沟通框架[ 10］．世界卫生组织和疾病预防控制中心在寨卡病毒爆发期间使用推特和Instagram [ 11］．纽约市监测社交媒体上关于寨卡病毒、甲型肝炎和埃博拉病毒的讨论，并与公众进行风险沟通[ 12］．

显然，对于许多传染病流行而言，已证明社交媒体上的网络讨论可以成为疾病实际严重程度的必要指标，并帮助卫生官员在实际病例数仍在收集和核实时更准确地评估时效性强的疫情[ 13- 15］．时间序列分析是一种多功能和强大的建模框架，可以连接基于web的讨论并揭示疾病动态，现有的各种流行病研究证明了这一点[ 16- 18］．

2016年寨卡疫情为调查和评估CDC在社交媒体上的作用和反应提供了一个很好的机会。寨卡病毒是一种相对较新的传染病，通过多种传播途径感染男女、胎儿和婴儿。然而，普通大众通常对此知之甚少。2016年，寨卡病毒在美国50个州和华盛顿特区造成了5168例确诊的非先天性病例，在美国领土上的病例数量要高得多[ 19］．Twitter是美国疾病控制与预防中心的主要社交媒体，共有67个与疾病控制与预防中心相关的官方Twitter账户，涵盖了各种各样的健康和疾病相关主题。前疾控中心主任汤姆·弗里登博士在推特上很活跃，并在推特上与公众进行了实时聊天。 20.，其中包括2016年2月关于寨卡病毒的1小时实时聊天。

尽管疾病预防控制中心在网络上有突出的存在和努力，但关于寨卡病毒的不准确信息在社交媒体上激增，并大大超过了疾病预防控制中心(以及其他合法来源，如世界卫生组织)[ 21］．研究表明，公众关注的话题与疾病控制与预防中心在推特上对寨卡病毒的反应存在很大差异[ 22- 25］．另一个较少被提及的方面是社交媒体上的低公众参与度(以转发和回复数量衡量)，社交媒体应该是一个基于网络的公众参与和互动平台。 26]，而不只是单向的新闻渠道[ 8， 27， 28］．此外，由于CDC直到2018年3月才最终确定并公布2016年全美寨卡病例的完整计数，目前还没有关于CDC在2016年全年应对寨卡病毒不同流行阶段的时间变异性、其对公众参与的潜在影响以及信息传播的量化的研究[ 19］．

因此，在量化和理解寨卡疫情、疾控中心在社交媒体(Twitter)上的动态响应、公众对疾控中心努力的参与之间的相互作用方面，以及在寨卡疫情不同阶段这些层次之间的潜在差异方面，存在着巨大的知识鸿沟。更具体地说，cdc最初发起的关于寨卡病毒的推文代表了政府机构对寨卡病毒流行的回应。对疾控中心原始推文的转发和回复量化了推特上关于寨卡病毒的讨论中的公众参与度。在2之间，转发通过向其他用户回复信息来增强与寨卡病毒相关的新闻和信息话语，而回复则意味着对该主题进行更深入的认知加工，并有助于与CDC的直接互动[ 29］．

为了解决这些问题，本研究旨在量化美国疾病控制与预防中心在推特上的反应，以及2016年寨卡疫情不同阶段的相应公众参与。然后，我们使用时间序列分析和信息论测量来识别它们之间的潜在差异。从这项研究中获得的结果和见解将揭示疾病预防控制中心在社交媒体上传播信息的有效性，并有助于制定更有效的基于网络的传播策略，以告知公众并打击与健康相关的虚假信息。

方法数据收集和准备

我们收集了2016年1月1日至2016年12月31日期间发布的所有以“Zika”为关键词的英文推文，使用Gnip推特应用程序界面。还收集了这些推文所收到的相应转发和回复。此外，2016年CDC下属67个账户的所有推文都被收集了起来。2016年美国50个州和地区的寨卡病例计数已从CDC寨卡病例报告官方网站[ 29]以及CDC关于2016年美国寨卡疫情的最终报告[ 19］．

从原始推文(包括与寨卡病毒相关的推文和由CDC发起的所有推文)、转发和回复(仅针对与寨卡病毒相关的CDC发起的推文)中提取了四个时间序列。此外，还获得了另外两个美国寨卡病毒病例数的时间序列(包括50个州和50个州加地区)[ 19］．鉴于推文、转发、回复和病例数的日期并不完全一致(例如，疾病预防控制中心可能不会每天都发布关于寨卡病毒的推文，也可能不会定期发布病例数)，这些时间序列首先被标准化为每周。数据以周为周期进行汇总，以确保每个时间序列都有相同的52个数据点，以便进一步分析和比较。月分辨率不足以进行连续的时间序列分析(因为每个季度只有3个数据点)，而日分辨率需要额外的数据插值步骤(因为每天不一定有寨卡推文和病例报告)，周分辨率很好地平衡，应该在本研究中提供最高的信噪比。为了建立一个基线场景，我们计算了所有疾病控制与预防中心账户关于任何主题的每周推文数量，并确定了疾病控制与预防中心在2016年发布的热门话题。使用这些数据，我们可以计算出每周以寨卡为关键词的推文与CDC所有推文之间的比例，这证明了寨卡在CDC社交媒体议程上的相对重要性。这一估计也有助于揭示和评估疾病预防控制中心在疫情不同阶段对寨卡病毒的反应。

单变量时间序列分析

CDC发布的寨卡病毒原始推文、相应的转发和回复以及寨卡病毒病例时间序列被绘制、可视化并检查了平稳性。在最初的筛选之后，我们发现原始推文、转发和回复的数量以及寨卡病毒病例的数量存在显著的时间变化。这些时间序列都不是平稳的。为了描述这种巨大的时间异质性，我们将2016年全年分为4个季度，并在每个季度内进行进一步分析。此外，我们计算了寨卡推文与CDC所有推文之间的比例，作为从CDC角度量化寨卡在各种健康相关主题中的相对重要性的衡量标准。

这些季度时间序列首先被建模为自回归综合移动平均(ARIMA)模型，以揭示任何潜在的时间特征，如线性趋势、季节性或时间自相关性[ 16］．公式如下:

给出了带变量的ARIMA模型的形式 X_t，差项 l，及参数( P d q(公式1). 3个参数 p， d, 问分别对应ARIMA模型的自回归分量、差分/积分分量(L)和移动平均分量。然后，在所有可能的竞争模型中，通过最小化赤池信息准则(AIC)值来选择最优模型。寨卡病例计数被排除在本分析之外，因为2016年国内大多数寨卡病例与旅行有关，无法用ARIMA模型很好地描述，并且寨卡的时间动态建模不是本研究的目的。

多元时间序列分析

我们在2016年4个季度为代表的不同阶段，使用交叉相关函数(CCF)计算了两个时间序列之间的滞后相关性，以确定和量化寨卡病例数、CDC原始推文和这些推文中的公众参与度(即转发和回复CDC推文)之间的潜在时间差异。具体来说，我们将寨卡病例数的时间序列与CDC原始推文的时间序列进行了比较，以了解CDC对疾病爆发的反应。此外，寨卡病例数的时间序列以及转发和回复的时间序列与发现的不同程度的公众参与对寨卡疫情的反应进行了比较。他们各自的ccf是针对2016年四个季度中的每个季度计算的。鉴于CDC的原始推文总是与转发和回复高度相关，我们还通过计算CDC的原始寨卡推文数量与不同阶段的转发或回复数量之间的比率来评估公众参与的动态变化。此外，我们利用Shannon熵的dirichlet -多项式伪计数贝叶斯估计来计算两个时间序列之间的互信息，这是一个比CCF更有信息量的度量，可以揭示两个时间序列之间潜在的互信息，量化CDC关于寨卡病毒的原始推文数量及其转发和回复数量是否与实际寨卡病例数具有足够的互信息。

我们分别为2016年每个季度的CDC原始推文、转发和回复构建了带有外部变量的ARIMA (ARIMAX)模型。ARIMAX模型是ARIMA模型的多元扩展，并加入了一个有效的外部变量(即 Y_t，代表本研究中寨卡病例数的时间序列):

然后对单变量ARIMA模型和多变量ARIMAX模型进行比较，看看是否引入外部变量实际上通过降低AIC值来提高模型性能。在单变量时间序列分析部分建立相应的最优ARIMA模型的基础上，构建了ARIMAX模型。换句话说，ARIMAX和ARIMA模型应该完全相同 p d而且问参数值正确评估外部变量的影响。这揭示了美国疾病控制与预防中心原始推文中的公众参与是否与国内寨卡疫情显著对应。然后，我们测试了原始CDC推文、转发或回复的数量是否可以作为实际寨卡病毒病例(或寨卡病毒)的必要指标反之亦然)，采用格兰杰因果关系检验。格兰杰检验中需要首先差分的项由相应的ARIMA或ARIMAX模型确定(即参数 d非零)。

结果描述性和单变量时间序列分析结果

在2016年CDC发布的所有推文中，寨卡病毒是第三大健康话题，共有6000条推文(包括4000条原创推文和2000条由CDC相关推特账户转发的推文)，在2016年全年中仅次于艾滋病和性传播疾病( 图1)．由于主题之间可能有重叠(例如，寨卡病毒/性传播疾病，寨卡病毒/疫苗，艾滋病毒/艾滋病/暴露前预防，HPV/疫苗等)，一条特定的推文可能属于多个主题。因此，根据美国疾病控制与预防中心的数据，寨卡病毒是2016年排名靠前的重要健康话题。在所有67个与cdc相关的推特账户中，有21个在2016年发布了关于寨卡病毒的推文。超过60%(3663/ 6104)的寨卡相关推文是由@CDCgov、@CDCTravel、@CDCGlobal和@CDCEmergency发布的;这四个也是2016年四个季度持续传播寨卡病毒相关信息的最活跃的推特账户。尽管寨卡病毒是疾病预防控制中心在推特上发布的热门话题之一，但疾病预防控制中心关于寨卡病毒的推特模式存在很大的时间异质性。2016年第一季度发布了超过84.0%(5130/6104)的寨卡病毒推文，随后几个季度分别为5.6%(342/6104)、7.5%(458/6104)和2.4% (146/6104)( 图2)．左上角图2显示了2016年期间所有与疾病控制与预防中心相关的Twitter账户发送的所有推文数量(黑色实线)和与寨卡病毒相关的推文数量(蓝色虚线);右上方显示了与寨卡病毒相关的推文数量(黑色实线)以及50个州和华盛顿特区的寨卡病毒病例数(红色实线);左下角显示了CDC关于寨卡病毒的推文转发量;右下角是对CDC关于寨卡病毒的推文的回复。作为时间动态的比较，50个州和DC的国内寨卡病例百分比分别为10.8%(560/5168)、26.0%(1343/5168)、52.8%(2728/5168)和10.4%(535/5168)，50个州、DC和海外地区的病例百分比分别为1.70%(662/ 38885)、5.91%(2298/ 38885)、58.46%(22732 / 38885)和33.92% (13189 / 38885)( 图3)．资料取自CDC发病率及死亡率周报[ 19］．因此，寨卡病毒的流行动态与CDC在2016年的推特动态有很大不同，因为寨卡病毒病例数实际上是2016年第一季度最低的。

图1

2016年美国疾病控制和预防中心发布的15个最热门健康话题。性传播疾病:结核病;CVD:心血管疾病;暴露前预防:暴露前预防;人乳头瘤病毒。

图2

2016年美国疾病控制和预防中心(CDC)发布的寨卡病毒推文、相应的转发、回复和所有原创推文的时间序列。

图5

2016年50个州/特区以及50个州/特区和地区的非先天性寨卡病毒病例。疾病控制和预防中心。

寨卡病毒毫无疑问是美国疾病控制与预防中心第一季度发布的最多的健康话题，在该季度所有推文中几乎有50.0%(3052/6104)被提及，使与艾滋病毒/艾滋病和性传播疾病相关的推文相形见绌;每个季度不同的ARIMA模型也证明了这种显著的时间异质性(见表1，原始推文的第一列)。第一季度的最优ARIMA模型是带参数的 P d q= 2,0,3，表示原始推文AIC值最小的最优时间序列模型不需要差分( d=0，差分的阶数为0，即已经平稳，不需要进一步差分)，且具有自回归项和移动平均项 p=2(表示自回归时滞为2)，问=3(表示移动平均阶数为3)。未来3个季度与最佳ARIMA模型相关的参数为 P d q= 2,1,3(第二季度)，1,1,1(第三季度)，2,0,3(第四季度)。

CDC对寨卡病毒原始推文的转发和回复通常遵循类似的时间特征，其中第一季度的转发和回复数量都最大( 图2，分别为左下和右下)。2016年4个季度的最佳ARIMA模型再次不同，对于转发( 表1，第二列)及回复( 表1，第三列)。唯一相似的是第一季度和第二季度的转发量，两者的参数化相同( P d q= 2,1,3)。在ARIMA模型中对原始推文、转发和回复的比较中，在第二季度只有2对模型参数化相同——原始和转发(都与 P d q= 2,1,3)以及第三季度的转发和回复(均带有参数值) P d q= 2,1,2)。这些结果显示，2016年不同季度、原始推文、转发和回复之间存在显著的时间变异性。

多元时间序列分析结果

如图4美国疾病控制与预防中心发布的寨卡病毒原始推文与转发之间，以及疾病控制与预防中心发布的寨卡病毒原始推文与2016年所有季度的回复之间，都发现了很强的时间相关性。大多数转发和回复都集中在零，这表明普通公众与CDC原始推文的互动通常是同步的。图5- 7提供寨卡病例与以下每个变量之间的CCF图:分别是2016年每个季度CDC的寨卡原始推文、转发和回复。

表1

2016年不同季度的互香农信息熵，自回归综合移动平均或带外部变量模型参数的自回归综合移动平均，赤池信息准则值。

季度		原件+箱子	不加评论的转发+案例	回复+案例
第一季度
	共同的信息	0.04	0.01	0.09
	华宇电脑(X)^一个票面价值	2,0,3	2 1 3	2,0,2
	dAIC^b	-2.25^c (976.61, 974.36)	-1.88^c (1341.51, 1339.63)	-1.21^c (950.05, 948.84)
第二季
	共同的信息	0.13	0.17	0.29
	华宇电脑(X)标准	2 1 3	2 1 3	0,1,1
	dAIC	0.96(722.54, 723.50)	-0.88^c (1207.14, 1206.26)	1.88(709.18, 711.06)
第三季
	共同的信息	0.02	0.08	0.02
	华宇电脑(X)标准	1,1,1	2 1 2	2 1 2
	dAIC	1.95(719.51, 721.46)	1.82(1172.01, 1173, 83)	-0.62^c (738.76, 738.14)
第四季度
	共同的信息	0.01	0.07	0.01
	华宇电脑(X)标准	2,0,3	0 1 2	0,0,1
	dAIC	-0.59^c (453.28, 452.69)	1.62(917.84, 919.46)	1.97(353.23, 355.20)

^一个ARIMA(X):自回归综合移动平均(带外部变量)。

^bdAIC:赤池信息标准的差异。

^c负dayc值表明ARIMAX模型的性能优于相应的ARIMA模型;因此，包括寨卡病例计数可以提高模型的性能。

图4

2016年4个季度，美国疾病控制和预防中心(CDC)原始寨卡推文、转发和回复之间的相互关联函数(CCF)。ACF:自相关函数。

对于最初的寨卡推文和寨卡病例数，在第一、第二和第四季度观察到强烈的时间相关性。在第一季度，疾病控制与预防中心关于寨卡病毒的推文比实际病例数早了大约7-10天，这表明了7、8、9和10的实质性滞后( 图5，左上)。在第二季度，疾控中心的推文比病例提前了大约两周( 图5(右上)。在第四季度，美国疾病控制与预防中心的推文在寨卡病毒疫情发生后大约1-3天( 图5，右下)。在第三季度，两个时间序列之间没有实质性的相关性。这些结果表明，在寨卡病毒流行的早期阶段(特别是2016年2月)，当实际病例数很低时，CDC在社交媒体上非常活跃( 图2(右上)。

在转发量和寨卡病毒病例之间也观察到类似的模式( 图6)．第一季度显示两者之间有很强的时间相关性，而第四季度则没有实质性的相关性。换句话说，2016年上半年，普通公众更多地参与转发推特，以帮助传播信息。

回复与寨卡病毒病例之间的相关性也被探索和证明( 图7)．在第一季度大约一周的时间里，回复先于病例数，表明公众对讨论寨卡病毒以及在Twitter上与疾病控制与预防中心互动有强烈兴趣;这种积极的参与随着时间的推移而减少。到2016年第四季度，回复时间比实际情况晚了10天左右。

此外，我们从信息的角度计算了相互信息，以探索寨卡病毒病例与CDC在twitter上的原始寨卡推文、转发和回复之间的相互依赖关系( 表1)．在第一季度，回复与寨卡病例的互信息最高(0.09)，甚至高于CDC的原始寨卡推文(0.04)和转发(0.01)。然而，所有这些相互信息(即Shannon信息熵)都很低，这表明Twitter上关于寨卡病毒的讨论与实际疫情之间存在潜在的差异。在第二季度，CDC的回复、转发和原创寨卡推文与寨卡病例的互信息量分别为0.29、0.17和0.13，是2016年四个季度中互信息量最高的。在第三季度，转发与寨卡病毒病例的互信息最高(0.08)，其次是原始推文和回复，均为0.02。在第四季度，转发的互信息再次达到最高(0.07)，其次是原始推文和互信息非常低的回复(0.01)。总体而言，与CDC的原始寨卡病毒推文相比，转发和回复的寨卡病毒病例的相互信息更多。因此，疾病预防控制中心的推文模式比公众参与推文的模式更不能反映寨卡疫情，这可以从转发和回复的模式中看出。

互信息不考虑潜在的时间特征，如滞后或趋势。因此，我们进一步量化了是否包括寨卡病例数的外部变量可以提高ARIMA模型的性能( 表1)．分析结果显示，在第一季度，所有ARIMAX模型的表现都大大优于ARIMA模型(原始寨卡推文、转发和回复的AIC [dayc]分别为-2.25、-1.88和-1.21;dAIC为ARIMAX模型与ARIMA模型AIC值的差值，负的dAIC值表明ARIMAX模型的性能更好，即加入外部变量增加了模型的可预测性)。尽管寨卡病毒病例数在第一季度是最低的，但它们仍然与基于网络的寨卡病毒讨论的时间动态高度相关。包括寨卡病例计数仅改善了ARIMAX模型，其中包括第二季度的转发量(dayc = -0.88)，第三季度的回复量(dayc = -0.62)，以及第四季度CDC发布的原始寨卡推文(dayc = -0.59)。这些发现提供了进一步的证据，证实了疾病预防控制中心对寨卡病毒的反应和公众在推特上的反应存在巨大的时间变异性和差异。

此外，我们评估了寨卡病毒病例是否可能是原始CDC推文、转发和回复的格兰杰原因反之亦然．格兰杰因果检验显示，病例数不是疾病预防控制中心在任何季度发布寨卡病毒原始推文的格兰杰原因反之亦然．因此，CDC发布的寨卡病毒推文与实际寨卡病毒病例之间的相关性并不强。然而，转发量可能是寨卡病毒病例从1到5的Granger原因( P=。分别为05、0.04、0.02、0.01、0.04);这与之前的研究结果相吻合，即转发量与第一季度寨卡病毒病例有非常高的相关性( 图6)．类似地，回复也作为第一季度订单3,4和5的格兰杰原因( P=。03，.01, and <.001, respectively). Furthermore, replies served as Granger cause again in the fourth quarter for order 1 ( P= .04点)。相比之下，第三季度的寨卡病例数可能是order 2和order 3回复的Granger原因( P<。两个订单都是001)，但不是反之亦然．这是寨卡病毒病例成为Twitter讨论的Granger原因时唯一的例外。值得注意的是，格兰杰因果关系仅为潜在因果关系提供了统计证据，并不能保证实际因果关系。例如，在第一季度，回复作为格兰杰原因并不意味着CDC的推文回复“导致”了美国的寨卡病毒病例。因此，我们应该解释说，回复先于寨卡病毒病例，并且在选定的顺序上与寨卡病毒病例数有很强的关联。此外，格兰杰检验结果的时间异质性在2016年不同季度表现出变异性。

图5

2016年4个季度美国疾病控制与预防中心(CDC)原始寨卡推文与国内寨卡病例之间的交叉相关函数(CCF)。ACF:自相关函数。

图6

2016年4个季度美国疾病控制与预防中心(CDC)寨卡推文转发量与国内寨卡病例之间的交叉相关函数(CCF)。ACF:自相关函数。

图7

2016年4个季度美国疾病控制与预防中心(CDC)寨卡推文回复与国内寨卡病例之间的交叉相关函数(CCF)。ACF:自相关函数。

讨论

这项研究是第一次专门调查疾病预防控制中心关于寨卡病毒的推特活动的时间变异性。更重要的是，它将美国寨卡病毒病例的时间可变性与疾病控制与预防中心在社交媒体上的反应和公众参与这些社交媒体信息联系起来。总的来说，我们发现疾病控制与预防中心在2016年寨卡疫情不同阶段关于寨卡病毒、公众参与和实际疫情的推文之间存在很大差异。正如我们的研究结果所示，疾病控制与预防中心在推特上对寨卡病毒的回应与寨卡病毒的流行之间存在巨大差异。2016年第一季度，当美国寨卡病毒病例数量较低时，CDC非常积极地传播有关寨卡病毒的信息，发送了84.0%(5130/6104)的2016年所有寨卡病毒推文。美国疾病控制与预防中心及其前主任弗里登博士甚至在2016年2月16日主持了1小时的推特聊天。所有这些活动都与积极的公众参与相关，因为转发和回复也是所有领域中最高的。因此，CDC有效地对即将到来的寨卡疫情进行了早期预警，并在2016年第一季度成功获得了公众的关注。然而，当寨卡病毒病例数在2016年第二和第三季度开始急剧增加时，疾病预防控制中心的寨卡病毒相关推文大幅减少，并没有赶上寨卡病毒病例数。尽管如此，公众在社交媒体上参与寨卡病毒讨论可能受到一些其他因素的影响，如新闻来源、个人对疾病的熟悉程度，以及可能与健康无关的潜在意见领袖。 All these could be future directions to expand this study.

虽然公众参与CDC的寨卡推文(即转发和回复)在2016年第二和第三季度也大幅下降，但这与寨卡病例显著相关，这由相应的ARIMAX模型的表现所揭示(与原始ARIMA模型相比)。自7月下旬以来，佛罗里达州和2016年8月5日至21日巴西夏季奥运会期间报告了更多的病例数(包括传播病例和旅行相关病例)，CDC关于寨卡病毒的推文的转发和回复再次大幅增加，表明公众对这一新兴健康问题的意识不断增强和反复出现。美国疾病控制与预防中心关于寨卡病毒的推文的动态公众参与在各个方面通常是不同的，并且在很大程度上受到并通常在寨卡病毒流行之前的影响。因此，公众参与CDC的寨卡推文通常比CDC在今年晚些时候的推文更能预测实际的寨卡疫情。

与以往使用社交媒体讨论趋势来预测和调整实际疾病动态的研究不同[ 13， 16， 18， 30.- 33]，本研究使用寨卡病例数和流行程度来推断推特讨论动态，并揭示了全年的动态变化;我们做出这一决定是因为美国国内大多数寨卡病毒病例都与旅行有关，且高度随机[ 19］．因此，ARIMA或ARIMAX等统计模型无法准确地捕捉到它们。因此，使用社交媒体讨论来预测实际的疾病动态对流感等本地传播疾病更有用，而不是与旅行有关的疾病。

这项研究有几个局限性。首先，我们没有调查转发和回复的实际内容和用户身份。未来的一个方向是利用主题建模来研究这些信息的内容[ 24]和自然语言处理[ 34］．研究回复的模式，以了解公众对原始推文的反应，尤其有价值。例如，研究公众的反应是中性的、协同的还是对立的，这将是很有趣的。另一种可能的途径是调查转发或回复网络，确定潜在的意见领袖，并评估他们在传播合法来源(如CDC和WHO)的健康相关信息方面的作用。

在这项研究中，我们关注的是CDC推文的公众参与度(即转发和回复)。然而，与所有与寨卡病毒相关的推文相比，这只代表了公众参与寨卡病毒一般性话题的相对较小的一部分。这项研究的延伸可以调查所有与寨卡病毒相关的转发和回复的时间动态，并将其与CDC寨卡病毒推文的公众参与度进行比较。同样，美国疾病控制与预防中心发布的寨卡病毒原始推文数量相对较低，尤其是在2016年第一季度之后，这可能会影响时间序列分析结果(这也是我们在本研究中选择每周而不是每天分辨率的原因)。一个潜在的补救措施是将所有与寨卡病毒相关的推文的时间动态作为未来研究的参考，并将其与疾病控制与预防中心的推文模式进行对比。

缩写

另类投资会议

赤池信息标准

华宇电脑

自回归综合移动平均

ARIMAX

带外部变量的自回归综合移动平均

CCF

互相关函数

疾病预防控制中心

疾病控制和预防中心

dAIC

赤池信息标准的差异

谁

世界卫生组织

我们感谢北卡罗来纳大学夏洛特分校的前研究生Angat Puri和Abhijit Nair，他们帮助收集了Twitter数据并进行了初始数据清理。我们也感谢北卡罗来纳大学夏洛特分校的数据科学计划通过Gnip应用程序接口存档并提供原始Twitter数据。

没有宣布。

谁

健康是一项基本人权 2018-05-08 2017 http://www.who.int/mediacentre/news/statements/fundamental-human-right/en/

艾弗里

公共信息官员在寨卡病毒危机期间的社交媒体监控，这是一场全球健康威胁，周围充斥着公众的不确定性

公共关系检讨 2017 09 43 3. 468 476

10.1016 / j.pubrev.2017.02.018

查普曼

雷蒙德

鲍威尔

社交媒体作为对抗食源性疾病工具的潜力

公共卫生 2014 07 134 4 225 30.

10.1177 / 1757913914538015

24990140

134/4/225

哈特利

利用社交媒体和互联网数据进行公共卫生监测:谈话的重要性

米尔班克季刊 2014 92 34 39

10.1111 / 1468 - 0009.12039

Naslund

晶澳

金

Aschbrenner

卡

麦卡洛克

浅黑肤色的女人

曼氏金融

Dallery

巴特斯

Marsch

拉

系统回顾社交媒体对戒烟的干预

瘾君子Behav 2017 10 73 81 93

10.1016 / j.addbeh.2017.05.002

28499259

s0306 - 4603 (17) 30172 - 7

PMC5556947

他

吴

年代

赵

李

张

勒

王

王ydF4y2Ba

年代

李

太阳

社交媒体在职业人群中促进减肥:使用微信手机应用程序的队列研究

J医疗互联网服务 2017 10 23 19 10 e357

10.2196 / jmir.7861

29061555

v19i10e357

PMC5673881

Rabarison

公里

Croston

妈

Englar

第一

弗林

约翰逊

衡量公众健康推特聊天的观众参与度:来自# livefitnora的见解

JMIR公共卫生监测 2017 06 08 3. 2 e34

10.2196 / publichealth.7181

28596149

v3i2e34

PMC5481664

胡

普拉特

中国公共卫生项目战略沟通中的公民参与基础:空气质量运动案例研究

公共关系检讨 2017 43 3. 461 467

10.1016 / j.pubrev.2017.03.002

坎德拉

Karki

年代

Eickholt

莱托

铁路工人

在推特上讨论抗生素的特点:什么是更大的图景?医学互联网研究杂志2017;17(6)

医学互联网研究杂志 2017 17 6 e154

10.2196 / jmir.4220

罗斯曼

迈耶

舒尔茨

危机的媒介放大:在欧洲新闻发布和新闻报道中传播a /H1N1大流行

风险肛门 2018 02 38 2 357 375

10.1111 / risa.12841

28561885

古伯伯

摩根大通

金

奥尔

Messner

米

Meganck

年代

Instagram和Twitter上的埃博拉:卫生组织如何在社交媒体参与中应对卫生危机

公共关系检讨 2017 09 43 3. 477 486

10.1016 / j.pubrev.2017.04.009

哈迪

麦格雷戈

曼恩

社交媒体监测:2016年纽约市应对寨卡病毒

健康安全内核 2017 08 15 4 440 444

10.1089 / hs.2017.0031

28806098

保罗

乔丹

Dredze

米

Broniatowski

推特提高流感预测

公共科学图书馆咕咕叫 2014

10.1371 / currents.outbreaks

Santillana

米

阮

在

Dredze

米

保罗

乔丹

Nsoesie

布朗斯坦

结合搜索、社交媒体和传统数据源来改善流感监测

PLoS计算生物学 2015 10 11 10 e1004513

10.1371 / journal.pcbi.1004513

26513245

pcompbiol - d - 15 - 00856

PMC4626021

哈里斯

霍金斯

简森-巴顿

阮

Nsoesie

Tuli

曼苏尔

布朗斯坦

使用Twitter识别和应对食物中毒:食品安全STL项目

J公共卫生管理实践 2017 23 6 577 580

10.1097 / PHH.0000000000000516

28166175

PMC5540821

Adebayo

南尤马可

Gesser-Edelsburg

一个

阿布

亚历山大-伍尔兹

莱文

寨卡疫情在线趋势、发病率和健康风险沟通:一项时间趋势研究

BMJ Glob Health 2017 08 2 3. e000296

10.1136 / bmjgh - 2017 - 000296

29082006

bmjgh - 2017 - 000296

PMC5656128

Broniatowski

达

保罗

乔丹

Dredze

米

通过推特进行国家和地方流感监测:2012-2013年流感流行分析

《公共科学图书馆•综合》 2013 12 8 12 e83672

10.1371 / journal.pone.0083672

24349542

玉米饼- d - 13 - 35058

PMC3857320

麦格夫

科幻小说

布朗斯坦

霍金斯

简森-巴顿

Santillana

米

结合传统疾病监测与搜索、社交媒体和新闻报道数据，预测2016年拉丁美洲爆发的寨卡病毒发病率

PLoS nel Trop Dis 2017 01 11 1 e0005295

10.1371 / journal.pntd.0005295

28085877

pntd - d - 16 - 01733

PMC5268704

大厅

沃克

林赛

雷曼兄弟

Kolsin

兰德里

更新:2016年美国50个州和哥伦比亚特区的非先天性寨卡病毒病病例

发病率和死亡率周报 2018 67 265 269

10.15585 / mmrw.mm6709a1

20.

Kass-Hout

助教

Alhinnawi

公共卫生领域的社交媒体

Br医学牛 2013 10 108 5 24

10.1093 / bmb / ldt028

24103335

ldt028

沙玛

米

亚达夫

斐迪南

寨卡病毒大流行——Facebook作为社交媒体健康信息平台的分析

感染控制 2017 03 01 45 3. 301 302

10.1016 / j.ajic.2016.08.022

27776823

s0196 - 6553 (16) 30918 - x

Glowacki

新兴市场

Lazard

威尔科克斯

Mackert

米

伯恩哈特

确定公众的担忧和疾病控制和预防中心在健康危机期间的反应:对寨卡病毒直播推特聊天的分析

感染控制 2016 12 01 44 12 1709 1711

10.1016 / j.ajic.2016.05.025

27544795

s0196 - 6553 (16) 30619 - 8

Joob

Wiwanitkit

寨卡病毒推特直播聊天

感染控制 2016 12 01 44 12 1756 1757

10.1016 / j.ajic.2016.08.019

27751615

s0196 - 6553 (16) 30865 - 3

米勒

米

巴纳吉

Muppalla

Romine

Sheth

一个

关于寨卡病毒，人们在推特上发了什么?其症状、治疗、传播及预防的探索性研究

JMIR公共卫生监测 2017 06 19 3. 2 e38

10.2196 / publichealth.7157

28630032

v3i2e38

PMC5495967

Stefanidis

一个

Vraga

Lamprianidis

Radzikowski

Delamater

雅各布森

Pfoser

Croitoru

一个

骗子

一个

推特中的寨卡病毒:地点、参与者和概念的时间变化

JMIR公共卫生监测 2017 04 20. 3. 2 e22

10.2196 / publichealth.6925

28428164

v3i2e22

PMC5418522

美国瓦茨

多兹

影响者，网络和公共舆论形成，消费者研究杂志2007;34 (4) ?458

消费者研究杂志 2007 441 458

10.1086/518527

艾弗里

Lariscy

孙

公共信息官员和记者在提供高质量卫生信息、卫生传播方面的障碍

健康传播 2009 24 4 327 336

10.1080 / 1041023090288936528

艾弗里

Lariscy

Amador

Ickowitz

普里姆

泰勒

一个

在不同社区人口规模的卫生部门公共关系从业者中，社交媒体的扩散

公共关系研究杂志 2010 07 02 22 3. 336 358

10.1080 / 10627261003614427

疾病控制和预防中心

美国寨卡病毒疾病累积病例数 2018

2018-10-24

美国寨卡病毒疾病病例累积计数，- https://www.cdc.gov/zika/reporting/case-counts.html

30.

Diga

米

凯莱赫

社交媒体的使用、决策权的认知和公共关系角色

公共关系检讨 2009 35 440 442

10.1016 / j.pubrev.2009.07.003

Bragazzi

问

Alicino

Trucchi

Paganino

barberi

我

马提尼

米

Sticchi

Trinka

Brigo

Ansaldi

Icardi

奥尔西

一个

全球对最近爆发的寨卡病毒的反应:来自大数据分析的见解

《公共科学图书馆•综合》 2017 9 12 9 e0185263

10.1371 / journal.pone.0185263

28934352

玉米饼- d - 17 - 03467

PMC5608413

Muppalla

米勒

米

巴纳吉

Romine

发现解释模型，以识别有关寨卡病毒的相关推文

IEEE工程医学生物学社会学 2017 12

第39届IEEE医学与生物工程学会国际年会

2017

西归浦市、韩国

1194 1197

10.1109 / EMBC.2017.8037044

夏普

霍普金斯

烹饪

Striley

连续波

使用贝叶斯变化点分析评估谷歌、Twitter和维基百科作为流感监测工具:比较分析

JMIR公共卫生监测 2016 10 20. 2 2 e161

10.2196 / publichealth.5901

27765731

v2i2e161

PMC5095368

纳加尔

元

问

Freifeld

Santillana

米

Nojima

一个

Chunara

布朗斯坦

纽约市2012-2013年流感季节的案例研究，从时间和时空角度使用每日地理编码的Twitter数据

J医疗互联网服务 2014 10 20. 16 10 e236

10.2196 / jmir.3416

25331122

v16i10e236

PMC4259880