卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

1438 - 8871

卡塔尔世界杯8强波胆分析

加拿大多伦多

v22i11e21504

33108306

10.2196/21504

原始论文

COVID-19大流行在线传播中的交流指责:用自动分析技术测量污名化线索和负面情绪的计算方法

Eysenbach

冈瑟

Fagherazzi

的家伙

廖

Qiuyan

McLennan

斯图尔特

胡

Zhiwen

沈

范

常

安琪拉

博士学位 1

通讯系社会科学学院澳门大学

氹仔大学大道E21-2056

澳门,100年

中国 853 88228991 wychang@um.edu.mo

https://orcid.org/0000-0003-3663-151X

舒尔茨

彼得约翰内斯

博士学位 2

https://orcid.org/0000-0003-4281-489X

你

ShengTsung

博士学位 3.

https://orcid.org/0000-0001-7911-6601

刘

马修Tingchi

博士学位 4

https://orcid.org/0000-0002-1820-5691

1 通讯系社会科学学院澳门大学

澳门

中国 2 传播和健康研究所卢加诺大学

卢加诺

瑞士 3. 广播电视系铭传大学

台北

台湾 4 管理与市场学系“，工商管理学院澳门大学

澳门

中国

通讯作者:Angela Chang wychang@um.edu.mo

11 2020

25 11 2020

22 11

e21504

17 6 2020 18 7 2020 28 8 2020 2 10 2020

©Angela Chang, Peter Johannes Schulz，涂圣松，Matthew Tingchi Liu。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2020年11月25日。

2020

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

2019年出现了一种新型冠状病毒的信息，并迅速在世界各地传播，引起了公众的极大关注，并引起了负面偏见。以指责为目的使用侮辱性语言引发了一场辩论。

客观的

本研究旨在识别社会群体中对应受责备行为者的社会污名和负面情绪。

方法

我们启用了一个定制的文本挖掘平台，通过检索和过滤在线资源来识别自然环境中的数据，并从自然语言处理中构建词汇并学习单词表示，以便与研究主题一起进行演绎分析。数据来源包括台湾的10个新闻网站、11个论坛、一个社交网络和两个主要的媒体共享网络。从2019年12月30日到2020年3月31日，新闻和社交网络分析的综合。

结果

我们整理了107万多篇中文文本。近三分之二的关于COVID-19的文本来自新闻服务(n=683,887, 63.68%)，其次是Facebook (n=297,823, 27.73%)，论坛(n=62,119, 5.78%)，以及Instagram和YouTube (n=30,154, 2.81%)。我们的数据显示，在线新闻是消极情绪的温床，也是情绪化社交帖子的驱动力。关于COVID-19的网上信息将其与中国联系在一起，并通过提到“武汉肺炎”将其与中国的某个城市联系在一起，这可能会鼓励仇外心理。尽管世界卫生组织的指导方针是避免偏见和种族歧视，但采用这个有问题的绰号的频率很高。社会污名通过负效价反应被揭露，这与最受指责的目标有关。

结论

我们的样本足以代表一个社区，因为它包含了广泛的主流在线媒体。与COVID-19大流行相关的污名化语言显示了公民责任的缺乏，助长了偏见、敌意和歧视。经常使用的侮辱性词汇被认为是冒犯性的，它们可能通过指责和鼓励仇外心理导致了最近对中国的反弹。强调了在COVID-19疫情期间，从健康风险沟通到减少污名化和仇外关切等方面的影响。了解与COVID-19疫情有关的术语和有偏见的术语至关重要。我们建议与传播专业人士团结一致，共同抗击COVID-19疫情和信息大流行。亟须找到遏制病毒偏见、污名化和歧视蔓延的解决办法。

责备罪魁祸首情绪分析 infodemic分析政治的不满新型冠状病毒肺炎沟通流感大流行社交媒体消极 infodemic infodemiology infoveillance 怪耻辱

简介 COVID-19的背景和指责设备

2019年底，中国大陆湖北省武汉市出现了一种新型冠状病毒。2020年2月11日，世界卫生组织(WHO)正式将这种新型人类传染病命名为“COVID-19”[ 1］．2020年3月11日，它被确定为全球大流行，在185个国家和地区蔓延[ 1］．由于病毒的快速传播和高度传染性，目前的COVID-19大流行可能是不可避免的。根据约翰·霍普金斯大学的仪表盘，截至2020年8月8日，全球确诊病例总数为15751658例，死亡人数为639207例[ 2］．没有人能想象COVID-19在全球的迅速传播和毁灭性影响。

各国政府因未能对COVID-19采取充分行动而受到批评。例如，中国政府被指责没有控制动物贸易，这被认为是导致人类感染的原因。早期的论述中有几篇文章表明，COVID-19可能起源于武汉的一个实验室[ 3.］．尽管缺乏关于病毒病理的站得住脚的科学证据，但信息仍在传播。美国总统唐纳德·特朗普和他的政府严厉指责中国未能遏制COVID-19，并将COVID-19称为“中国的新冠肺炎” ，可能煽动种族主义，并无意中攻击了世界各地的亚裔[ 4］．这些言论的质量如此之低，以至于来自中国境外的27位著名公共卫生科学家驳斥了这些有偏见的信息，并敦促坚决谴责有关病毒起源和事实的错误信息和阴谋论(例如，[ 5])。这些例子表明，不仅是病毒，而且谈论病毒的方式也会伤害到人。

在疾病爆发的背景下，社会污名来自于推卸责任的冲动;因此，大量研究已经承认，COVID-19会带来社会耻辱以及随之而来的指责和歧视(例如，[ 6- 8])。缺乏对COVID-19大流行社会污名化的清晰认识，可能会导致错误指责和负面偏见的传播，从而危及公众的心理社会发展和福祉。因此，在传染病爆发期间，有必要通过检查污名化线索和负面情绪以及指责信息来解决与疾病相关的污名化问题。

截至2020年8月8日，台湾疾控中心共报告477例确诊病例，7例死亡，83,117人接受检测[ 9］．随着新冠肺炎疫情的爆发，台湾可能因为与中国大陆的密切联系而陷入困境。然而，与周边许多国家和地区不同，台湾的病死率相对较低，也没有实施严格的城市封锁。相反，台湾民众被敦促通过保持社交距离、勤洗手和一直戴口罩来减少与他人的接触[ 9］．政府的这些要求造成了许多社会困境和暴力冲突，特别是在2019冠状病毒病危机期间。事实上，这些信息涉及社会污名化、抱怨、集体指责，往往通过网络交流表达出来，形成舆论，进而影响人们的认知。指责是一种表达意义的工具，通过它，公众试图理解意外的风险事件。与此同时，责备某人是指在表达怨恨、愤慨或不满的态度时，追究该代理人的责任。

归因责备和污名

归因责任的前提是相信在一个公正的世界里，人们的行为是公平的，每个人都会得到他们应得的。 10- 12］．因此，研究了三个变量，包括归因、责任和行动者意图，以表明被指控的代理人实际上是罪犯[ 13， 14］．以往对健康风险归咎属性的研究表明，归咎属性会导致一系列破坏性的社会后果。例如，在新冠肺炎疫情期间，旅居海外的华人遭受歧视，大多数在华华人对自己也表现出歧视态度[ 15］．在考虑与公共卫生问题相关的传播的各个方面时，COVID-19大流行往往会引发仇外心理、歧视和带有污名化名称的偏见[ 16- 18］．这表明，指责话语和公众对煽情媒体话语的不理解与社会条件的特殊性有着错综复杂的联系。向非专业公众提供健康信息的来源可能会用侮辱性的线索转移和分散指责。特别是，无处不在的网络媒体造成了信息过载，使人们难以区分真实和虚假的信息。 19- 21］．

某些阶层的人和代理人成为负面健康后果的指责对象并不是一个新现象。例如，指责中国是一种常见的现象，并助长了中国是一个不卫生实体的概念。一些记者认为，纽约唐人街的中国移民应对2013年爆发的严重急性呼吸系统综合症(SARS)负责，尽管公共卫生官员未能在那里发现SARS病例。 22］．假定中国人的健康状况导致了该社区的污名化。研究强调，公众对某些群体的反应和消极态度导致了COVID-19大流行的传播[ 23- 25］．指明特定群体的健康风险可能加剧因防治传染病而产生的消极后果。因此，研究人员通过使用侮辱性的绰号，证实了对中国人普遍存在的集体知觉偏见[ 8］．

责备可以反映用户的情绪状态和减轻潜在损失的努力。特别是，在交流背景中使用消极语气可以揭示对话者的意图，因为它们往往来自现有的沮丧和不满情绪[ 26- 28］．因此，评估关于COVID-19的新闻报道和评论中的信息的价值是消极的还是积极的，可以帮助研究人员对背景有一个基本的了解。

当公众应对意外的与健康相关的风险事件时，污名化的绰号可以表明谁在给予和接受基于效价的指责[ 29， 30.］．社交媒体通过传播不准确和有害的信息，放大了污名化问题。伤害不仅是医疗方面的，还包括对处于疫情中心的人的歧视[ 16， 17， 31， 32］．最近的一项研究通过从与COVID-19相关的推特标签中提取情绪关键词，证实了污名化问题[ 33］．他们发现，关键词“冠状病毒”和“武汉冠状病毒”与恐惧和愤怒的情绪有关，而推特上表达的最不常见的情绪是悲伤、喜悦和厌恶。对风险的感知可以被各种情绪放大或减弱，包括感知到的恐惧，缺乏可控性，以及通过各种媒体投射的不熟悉。社交媒体已被证明是最有影响力的平台之一，人们可以就有争议的话题进行互动，并发表攻击性或轻蔑的评论。 34- 38］．微博数量与武汉报告的新冠肺炎病例数量呈正相关关系，每40条微博报告的新冠肺炎病例约增加10例[ 39］．值得注意的是，据说武汉的效应量比中国其他城市的效应量要大。

本研究的目的

总而言之，本研究旨在分析网络媒体被用来传播带有污名化线索的COVID-19相关信息的频率，研究现场的主要代理人与有关COVID-19大流行的负面情绪接触的频率，并通过考虑指责情绪来评估有关COVID-19的话语。这项研究利用现有的理论来理解社会污名和随后的指责是如何带来挑战的，因为国家正在努力克服对个人行动的限制，并转向更正常的社会互动。

研究问题

研究人员提出了四个研究问题(rq)，以确定对话者的意图，以及网络媒体在多大程度上将指责归咎于情绪的集体表达。

记者提问1:新闻媒体和其他社交媒体对COVID-19及其相关主题的报道和讨论有多少?

RQ 2:在与COVID-19有关的讨论中，有哪些带有情绪色彩的污名化术语被提及?

问题3:在网络媒体中，哪些目标最受指责?

RQ 4:在COVID-19大流行中，指责情绪和媒体来源之间有什么联系?

方法自动计算方法

自然语言处理(NLP)在机器学习领域中，使计算机能够分析、操作并可能生成人类语言，已在世界范围内得到广泛应用(例如，[ 32， 35， 40])。采用了台湾的机器学习算法DivoMiner，该算法具有在大量数据集中自动识别和分类模式的能力。这个定制的文本挖掘平台有助于从非结构化文本语料库中获得关键术语、短语和情绪评估的见解。各种数字传播平台的集合通过自动化技术进行融合，从而实现对COVID-19话语的实时聚合、组织和分析[ 17］．

本次研究时间为2019年12月30日至2020年3月31日，确保及时提供COVID-19相关信息。它还确保各时间段具有可比性，因为业务原因，例如为什么某些星期的需求可能比其他星期高，或可能影响指责话语的其他因素。研究策略包括使DivoMiner能够通过检索和过滤在线媒体来源来识别自然环境中的数据[ 41， 42]以及从NLP中构建词汇和学习词汇表征，并与网络媒体类型的研究主题(污名化和情感语言)一起进行分析[ 41- 43］．

数据收集

基于台湾领先的数字新闻平台的高使用率，我们招募了这些平台。与此同时，社交网络和论坛已经成为越来越重要的新闻来源。在所有社交网络服务中，渗透率最高的是YouTube和Instagram，约有2300万(89%)用户，其次是Facebook，有超过2100万(82%)活跃用户，以及开放论坛，有超过330万(95.5%)年龄介乎12至38岁的用户[ 41］．上述媒体平台每天都提供卫生新闻和论述，覆盖广泛的人群。总而言之，本研究中招募的媒体源数据包括10个主流新闻服务，11个论坛，一个社交网络服务(Facebook)和两个主要的媒体共享网络(Instagram和YouTube)的人口数据集。

在3个月内发布的所有包含目标关键词的公开在线通信都通过DivoMiner应用程序自动收集。例如，我们招募了主流在线报纸《苹果每日新闻》及其Facebook粉丝页面，并观察到最大的基于终端的公告板系统PTT [ 41， 44］．然而，值得注意的是，一些流行的社交媒体平台，如Twitter，可以准确地反映英语世界的人口，但在中文世界却不能。因此，将文本数据限制在中文地区是获得洞察力的一种足够有效的手段。此外，诸如伦理考虑和随后侵犯隐私的合法性等问题不太令人担忧。

为了确保从语法明确的非结构化文本中捕获与COVID-19相关的观点的效率，我们对数据进行了训练，以在我们的模型中包含一些语义知识[ 42， 43， 45］．为了验证单词嵌入的可行性和可靠性，三名编码员手动标记并检查了1500个随机帖子。经过测试和训练，分类准确率达到75%(1125/1500)，可以接受[ 41， 42］．在剔除不相关的有主见的数据(如购物、非新闻)后，DivoMiner分类器实现了对记录数据的数字形式的过滤过程。

码的发展

为了从网络文本中解析含义，所有与COVID-19相关的术语和关键词最初收集自中国国际出版集团公司于2020年2月发布的官方文件[ 46］．为了满足计算分析的需要，采用Word2Vec技术寻找单词的连续嵌入。Word2Vec通过阅读中文维基百科语料库中的356,901篇文章，并记忆哪些单词往往出现在相似的上下文中来学习[ 43］．在对大型语料库进行预训练后，它为词汇表中的每个单词生成多维向量，含义相似的单词彼此更接近。通过几次试点测试，总共确认了106个关键字，创建了DivoMiner可以协助分析的逻辑术语和短语。

在定制平台uMiner中搜索分类法的一个例子是“肺炎”(肺炎)，四个可选术语是“病毒性肺炎”(病毒性肺炎)、“冠狀病毒”(冠状病毒新型冠状病毒)、“新型冠狀肺炎”(新型冠状病毒)和“2019新型冠狀病毒”(2019新型冠状病毒)。测量侮辱性绰号的变量是基于对中国或中国人的集体行为倾向的NLP [ 30.， 32， 45];5个被广泛使用且存在偏差的术语是“武漢病毒”(武汉病毒)、“武漢肺炎”(武汉肺炎)、“中國肺炎”(中国肺炎)、“中國人肺炎”(中国肺炎)和“中國病毒”(中国病毒)。

DivoMiner包含一个模块，用于确定每个意见的单词情绪。衡量三种情绪语调(积极、中性和消极)的变量是基于使用“快乐”、“快乐”和“喜欢”作为积极语调的参考点，而“愤怒”、“恐惧”和“悲伤”被用作消极语调的参考点。 22， 25， 26］．与上述情绪无关的单词和形容词的同义词被标记为具有中性语气[ 25- 27， 30.， 43］．负面情绪是衡量被指控者的指责时集体知觉偏见的理想指标[ 14， 19- 23］．第一作者和两名训练有素的研究助理对随机分配的1200个样本帖子进行了交叉检查。通过讨论解决分歧，达成共识。最终达成了77%(924/1200)的可接受水平。评价者之间的可靠性采用科恩kappa系数，通过计算情绪和目标人物、群体和组织的在线帖子。评分者间信度为0.5901 (95% CI 0.49-0.71; P=.06)，并被评为中等[ 42， 43］．

结果提及COVID-19的频率和趋势

我们在3个月的时间里，从台湾24个在线来源中筛选出了1,073,983条关于COVID-19的文本。关于COVID-19的第一篇文章是2019年12月31日在HiNet上发表的一篇新闻文章。据报道，台湾疾控中心已启动机上消毒检疫措施，以应对武汉肺炎疫情。值得注意的是，新冠肺炎在3周后被证实扩散到台湾。

在1073983条关于COVID-19的短信中，近三分之二来自新闻服务(n=683,887, 63.68%)，其次是Facebook (n=297,823, 27.73%)、论坛(n=62,119, 5.78%)以及Instagram和YouTube (n=30,154, 2.81%)。每日的新冠疫情短信量分别为:新闻服务7354条(0 ~ 14561条)、Facebook 3202条(0 ~ 5937条)、Instagram和YouTube 324条(0 ~ 678条)、论坛668条(0 ~ 1264条)。

关于COVID-19的报道和讨论的数量显示出几个值得注意的模式。首先，在2020年1月19日之前，每天的新故事数量一直远远低于500个，但在1月20日，这一数字上升到了1000多个。2020年1月21日，新闻故事爆发，大约有3500个故事，第二天略少于5500个。从那时起，新闻服务机构提供的新闻数量在工作日增加到约1.2万篇，周末增加到6000至8000篇。其次，历史新高是在3月16日开始的一周内达到的。在那一周的五个工作日中，有四个工作日的报道强度是三个月时间框架中最大的。第三，在时间框架上有一个惊人的每周节奏，故事数量从工作日的每天约12000个故事下降到周末的6000到8000个故事。第四，其他来源的模式大体上反映了新闻服务输出的发展。图1提供发展概况。

图1

社交媒体和新闻服务中关于COVID-19的传播强度。

在传染病爆发期间，据观察，社交媒体帖子将用户的风险认知联系起来的潜在机制通常很高，从而产生了宣泄作用。关键词分析确定了两个关键短语，“蔡英文”(n=1,082,632;“台湾总统”(n=1,008,486)和“肺炎”(n=1,008,486)的总频率最高，其次是地理术语“武汉”(n= 762004)和“中国”(n=343,489)。口罩和口罩配给计划是第五大最常用短语(n=305,769)。与2019冠状病毒病相关的两个目标紧随其后:新移民族群(如中国大陆人、越南人、菲律宾人和印度尼西亚人;李文亮博士是一名眼科医生，曾试图在大流行的早期阶段提醒政府和公众注意迫在眉睫的危险(n=6004)。结果显示，共有51个常见的中文关键词的英文翻译多媒体附件1．对前20个高频词按降序进行描述性分析表1．

调查与每个主题相关的反应，包括疾病在内的六个主题;预防感染;地理命名;组织、机构和活动;政策;政治人物也经常被报道。相比之下，长期以来在各种来源中被报道最少的两个主题是那些与非政治人物、团体和职业有关的主题。均分为专题数据分析提供了集中趋势的度量。对COVID-19消息的属性进行了描述性分析多媒体附件2为讨论总量，平均值，SD和评估的关键术语范围。

表1

台湾网络传播中与新冠肺炎相关的高频词汇

COVID-19-related的话	频率、n
蔡英文(或台湾政治人物或台湾总统)	1082632年
肺炎	1008486年
武汉	762004年
武汉肺炎	715719年
中国	343489年
口罩或口罩配给计划	305769年
冠状病毒	261643年
确诊病例	185818年
消毒	99817年
勤洗手/仔细洗手	96593年
强制隔离自我监控隔离	91097年
谁^一个	81134年
台湾同志(或台湾商人在中国大陆的两岸宪章)	69310年
陈世忠(或卫生福利部长)	62870年
城市封锁	51261年
台湾行政院行政院长苏庆卿	50863年
巡航，韦斯特丹，水瓶座，世界梦想，或钻石公主	46906年
	40664年
疫苗	29559年
疑似病例	23926年

^一个卫生组织:世界卫生组织。

COVID-19和污名化线索

“肺炎”和“病毒”的使用可以追溯到2019年12月30日。因此，在第二天有关新冠疫情的讨论中出现了带有负面情绪的侮辱性词汇。随着人们对误用“武汉肺炎”一词的兴趣日益浓厚(n=639,456)，它约占全部媒体来源的三分之一。独立卡方检验显示，关键词使用与媒体平台之间存在显著相关性(χ²₉= 2311455, P<措施)。侮辱性词汇在新闻中出现频率最高(n=519,261, 37.0%)，其次是Facebook (n=193,249, 34.4%)，论坛(n=38,650, 36.2%)和其他社交媒体网络(Instagram和YouTube;32.1%, n = 19325)。表2比较了不同媒体平台在COVID-19讨论中采用的污名化和非污名化术语的使用情况。

表2

按媒体类型比较非污名化(推荐)关键词和污名化术语。

变量	非污名化，n (%)	污名化，n (%)
新闻(n = 1405306)	886045 (63.0)	519261 (37.0)
Facebook (n = 561298)	368049 (65.6)	193249 (34.4)
论坛(n = 106807)	68157 (63.8)	38650 (36.2)
Instagram和YouTube (n= 60219)	40894 (67.9)	19325 (32.1)
总(n = 2133630)	1363145 (63.9)	770485 (36.1)

在带有情绪评估的侮辱性词汇中，“武汉肺炎”和“中国病毒”等具有潜在攻击性的词汇共累积了631192个带有相关情绪的帖子。消极语调超过50%与责备有关(n= 331,550,52.3%)，而积极语调为26.86% (n=169,541)，中性语调为20.61% (n=130,101)。情绪与污名化名词有显著相关(χ²₉= 994650, P<措施)。表3比较了不同媒体平台上与污名化术语相关的情绪。

表3

媒体类型对污名化用语的情绪评估。

变量	正，n (%)	中性，n (%)	负，n (%)
新闻(n = 359574)	106091 (29.5)	85681 (23.8)	167802 (46.7)
Facebook (n = 207768)	49150 (23.7)	29084 (14.0)	129534 (62.3)
论坛(n = 43464)	6866 (15.8)	11904 (27.4)	24694 (56.8)
Instagram和YouTube (n= 20386)	7434 (36.5)	3432 (16.8)	9520 (46.7)
总(n = 631192)	169541 (26.9)	130101 (20.6)	331550 (52.5)

最受指责的目标

情绪评估的数量从最低的6004个到最高的935691个不等。相比之下，有关情绪的帖子和报道最少的是政策、待遇、福利机构(0 ~ 1328)。对新闻服务和社交媒体活动中带有情绪的评论发展进行量化和理解后发现，一位政治家，即台湾“行政院长”，以两极分化的语气吸引了最多的关注，既有负面的(n=456,187, 48.8%)，也有正面的(n=280,814, 30.0%)。台湾卫生福利部长陈士忠的负面言论(n=22,033, 42.0%)多于正面言论(n=15,432, 29.4%)，因为他负责监督各部门和私人利益相关者对抗COVID-19的资源。

情绪分析与非政治目标，如新移民，外国劳工和外国配偶的消极情绪(n=3153, 43.2%)比积极情绪(n=2105, 28.8%)联系更多。出乎意料的是，举报人李文亮以及与他有关的问题与负面讨论(n=4358, 72.6%)的联系远远超过与正面讨论(n= 390,6.5%)的联系。李博士让其他人意识到病毒即将来临的问题，而与他有关的问题在病毒爆发的最初几个月里并没有得到赞扬。相反，李博士和与他有关的问题成为了批评的目标。唯一例外的是台湾“总统”蔡英文，在媒体上正面评论(n=7786, 45.7%)多于负面评论(n=3696, 21.7%)。具体而言，与她相关的正面评论主要集中在新闻服务(n=5318, 58.0%)，而社交媒体:Facebook (n=2714, 51.6%)，论坛(n=704, 39.1%)， YouTube和Instagram (n=252, 34.6%)。用于讨论这位政治领袖的情绪在不同的媒体类型(χ²₉= 11088 P<措施)。

以排名前六的人物和群体为目标，以三种情绪语调(积极、中立和消极)和四种媒体平台(新闻、Facebook、论坛、Instagram和YouTube)作为受试者之间的因素，进行了3 × 4方差分析，揭示了语调的主要影响( F_{2, 60}= 1.13, P=.33)及媒体平台( F_{1, 60}= 11.90, P= <措施)。因此，使用Tukey诚实显著差异检验的事后比较显示，三种不同媒体平台之间存在统计学上的显著差异( P=.003):(1)新闻和Facebook，(2)新闻和论坛，(3)新闻和社交网络(Instagram和YouTube)。带有情绪语调的网络新闻报道的平均值和SD (mean 4117, SD 3799)明显高于Facebook帖子(mean 1778, SD 1816)。这两个显著效应(新闻和Facebook，新闻和论坛)的效应量分别为0.79和1.33。此外，在线论坛帖子中表达的情绪的平均得分为530 (SD 346)，明显高于Instagram和YouTube(平均得分225,SD 217)，效应量为1.45。综上所述，这些结果表明带有情感色彩的新闻报道对Facebook、论坛帖子、Instagram和YouTube产生了影响。具体来说，我们的研究结果表明，当新闻文章涉及情绪时，这种情绪会传递到社交媒体上。中给出了析因设计的均值和标准差表4．

表4

根据事后测试，媒体场所与目标情绪的差异。

媒体^一个	意思是(SD)	意思是不同
		新闻	脸谱网	论坛	Instagram和YouTube
新闻	4177 (3799)	- - - - - -^b	- - - - - -	- - - - - -	- - - - - -
脸谱网	1778 (1816)	2339 (0.79)^{c, d}	- - - - - -	- - - - - -	- - - - - -
论坛	530 (355)	3587 (1.33)^c、e	12482年	- - - - - -	- - - - - -
Instagram和YouTube	225 (217)	3892 (1.45)^c、e	1553	305	- - - - - -

^一个单元格大小n=18。

^b不适用。

^c效果大小用括号表示。

^d P= .002。

^e P<措施。

讨论主要结果

这项研究揭示了一种模式，即网络上对COVID-19大流行的指责是如何针对那些有影响力的用户之前就对其不满或不满的群体和人物的。人们将责任归咎于他人的做法仍然容易出错，而且似乎很自然地假设，他们的感知偏见也是这种描述的对象的特征，而不仅仅是他们的实践的特征。使用社交媒体跟踪有关COVID-19和相关主题的新闻，在收集多样化和广泛的一般卫生新闻方面弥补了传统新闻的不足。公众通过各种资源对COVID-19进行解读，最引人注目的是主流网络新闻的呈现。总体而言，媒体来源的消极和积极语气之间存在很强的正相关。讨论频率的增加与在线媒体上情绪语调的增加相关。

病耻感是通过负价反应而不是与COVID-19相关数字相关的积极反应来揭示的。例如，台湾行政院长苏庆卿被认为是最受指责的人，尽管他被认为是负责预防和政策执行的当地人物之一。与他有关的指责主要出现在新闻上(n=519,261, 67.4%)，其次是Facebook (n=193,249, 25.1%)和论坛(n=38,650, 5.0%)。被指控的代理人实际上是经常与负面情绪联系在一起的罪魁祸首。

台湾的新闻媒体被形容为专业和独立。 42];然而，在线新闻服务一直在助长负面的论调。网络新闻一直在使用侮辱性词汇，从而引发了与侮辱性相关的情感词汇的采用。在这项研究中，它们首先出现在新闻中，并在2020年1月20日那一周的使用情况有所回升;之后，这些照片出现在Facebook和在线论坛上。网络新闻是负面情绪的温床，会在其他媒体上引发负面情绪和指责。这些带有侮辱性的词语显然被认为是冒犯性的，它们可能通过鼓励和指责中国和中国人民而助长了最近对中国和中国人民的反弹。 6- 8］．在考虑网上公众对做出偏见判断的反应和感受时，理解与COVID-19疫情有关的术语和偏见术语至关重要。网络媒体网红使用与大流行相关的污名化语言，显示出他们缺乏公民责任，助长了偏见和敌意。

限制

尽管本研究试图从所有媒体文本中建立推断意义的准确性，但本研究在研究设计和分析工作流程方面存在一些局限性。首先，在线媒体数据集的特点是类型的多样性，没有使用细粒度信息。特别是，来自个人社交媒体账户的数据以稀疏和短文本的形式出现，这不太可能导致对识别模糊信息的洞察。处理来自社交媒体的数据仍然是主观的，要量化合成的数据是一项挑战，因为这些数据不一定对客观真相有更接近的共同要求。其次，通过训练情感分析模型，我们的自动化方法不可避免地无法将文本简化为一个包含所有重要中文情感词汇的模型[ 43］．在这种情况下，中立标签是研究问题中最重要的部分之一。尽管应用预处理和后处理数据来捕获上下文，标记标准应该更加一致。此外，值得注意的是，与传统新闻中带有正式拼写的关键词相比，社交媒体中经常使用更高效的正字法和语音长度较短的混合词或标签。这种差异表明，基于关键字匹配的数据挖掘可能会低估实际使用量。最后，目前对情感语调的评估需要更深入地了解网络媒体中频繁用户的情感表达[ 26］．考虑到中文关键词在各种媒体中的多面性，可以更精确地生成情感评估的分类器进行测量。

与之前工作的比较

世卫组织和全球医疗权威机构已同意避免以地点或人群命名疾病，因为使用这些名称可能导致集体感知偏见、污名化和不准确的假设[ 5］．然而，与以往的研究一致(例如，[ 7， 8)，采用“武汉肺炎”这个有问题的绰号，集体生产和消费的频率很高。我们的数据还显示，COVID-19与中国以及中国某个特定城市高度相关，比如“武汉肺炎”，这可能会鼓励仇外心理。将结果与早期的研究结果进行比较(例如，[ 18， 38])，新闻和社交网络被观察到大致接近的信念，提供地理参照的情绪，将健康危机的虚拟空间和物质空间联系起来。此外，蔡英文比其他人有更有利的情感反应，而陈世中后来被观察到在2020年3月底新冠肺炎疫情爆发期间发表了无可指责的言论。新冠肺炎疫情期间传播的仇外情绪表明，个人可以提高媒体的曝光率和可信度，从而影响公众的观点和评价。对这两位台湾政客的积极情绪提供了一个机会，让我们反思在这场大流行的网络英雄主义动态框架中汲取的教训[ 23］．

结论

本研究探讨了在2019冠状病毒病(COVID-19)爆发期间，用英语以外的广泛使用的语言进行在线交流时，指责与各种目标之间的关联机制。鉴于迄今关于COVID-19的在线讨论的影响，在大流行期间减少污名化至关重要。这份及时的报告可用于为政策提供信息，并促进有关社会如何以减轻耻辱的方式应对大流行病的研究。特别是情绪分析在追踪传染源、预测传染病传播方面有很大的潜力[ 26， 29， 38， 45］．移动电话等在线数据源可以帮助研究人员在社区层面发现新的病原体，并可用于利用大数据和智能分析来促进公共卫生[ 30.］．

本研究调查了网络媒体动态的争议性和扭曲性，结论是台湾用户在日常交流中存在对COVID-19的感知偏见的集体行为。在本地范围内，社交媒体用户广泛占据相同的地理区域，这就是为什么认为探索大流行作为未来研究的参考是合适的。媒体用户用负面语气推动了前所未有的污名化术语的传播，直接指向敌意和指责。正因为如此，有害的语言可能会有更高的风险，线下伤害的风险可能会加剧。因此，通过授权个人、健康传播研究人员、卫生保健专业人员和政策制定者为他们的行为负责，促进了指责设备的意识。我们建议与传播专业人员团结一致，共同抗击COVID-19疫情，并找到遏制病毒偏见、污名化和歧视蔓延的解决方案。

多媒体附件1

中文关键词分类，英文翻译。

多媒体附件2

有关台湾新冠肺炎网上传播的话题。

缩写

疾病预防控制中心

疾病控制中心

NLP

自然语言处理

中华人民共和国

中移动

研究问题

“非典”

严重急性呼吸系统综合症

谁

世界卫生组织

本研究由澳门大学(MYRG2019-00079-FSS;MYRG2020-00206-FSS)和澳门高等教育局(HSS-UMAC-2020-09)。我们感谢两位博士生焦文和冼学昌的帮助，感谢匿名审稿人对我们手稿的仔细阅读和许多有见地的评论。

AC和PJS设计了本作品的主要概念。AC和ST进行数据采集。ST和MTL参与数据解释。AC和PJS进行数据分析，撰写和编辑本文。AC、PJS、MTL对稿件进行评审和推广。

没有宣布。

迪詹纳罗

Pizzol

马洛塔

安图内斯

米

Racalbuto

维罗纳人

史密斯

冠状病毒疾病(COVID-19)的现状和未来展望:叙述性回顾

国际环境与公共卫生 2020 04 14 17 8 2690

10.3390 / ijerph17082690

32295188

ijerph17082690

PMC7215977

约翰霍普金斯大学系统科学与工程中心(CSSE)的COVID-19仪表盘

约翰霍普金斯大学 2020

2020-08-08

https://coronavirus.jhu.edu/map.html

Velavan

迈耶

COVID-19疫情

Trop Med Int Health 2020 03 25 3. 278 280

10.1111 / tmi.13383

32052514

PMC7169770

盎

当COVID-19遇到集中的个性化权力时

Nat Hum行为 2020 05 4 5 445 447

10.1038 / s41562 - 020 - 0872 - 3

32273583

10.1038 / s41562 - 020 - 0872 - 3

Calisher

卡罗尔

Colwell

科里

Daszak

Drosten

Enjuanes

法勒

场

戈尔丁

Gorbalenya

一个

Haagmans

休斯

卡雷什

白平衡

Keusch

林

卢布罗特

麦肯齐

马多夫

Mazet

Palese称

帕尔曼

年代

胡桐

Roizman

赛义夫

苏巴拉奥

特纳

米

支持中国科学家、公共卫生专业人员和医疗专业人员抗击COVID-19的声明

《柳叶刀》 2020 03 07 395 10226 e42 e43

10.1016 / s0140 - 6736 (20) 30418 - 9

32087122

s0140 - 6736 (20) 30418 - 9

PMC7159294

阮

一个

Catalan-Matamoros

数字错误信息/虚假信息和公众参与卫生和科学争议:COVID-19的新视角

媒体Commun 2020 06 25 8 2 323 328

10.17645 / mac.v8i2.3352

Dhanani

弗朗茨

COVID-19大流行对公共卫生的意外后果:一项调查了美国反亚洲态度的全国性调查

公共卫生 2020 07 65 6 747 754

10.1007 / s00038 - 020 - 01440 - 0

32728852

10.1007 / s00038 - 020 - 01440 - 0

PMC7388430

乔

李

公园

金

韩国新型冠状病毒(COVID-19)爆发初期的网络信息交换和焦虑传播:结构主题模型和网络分析

J医疗互联网服务 2020 06 02 22 6 e19455

10.2196/19455

32463367

v22i6e19455

PMC7268668

COVID-19 (SARS-CoV-2感染)

台湾疾病预防控制中心 2020-07-25

https://www.cdc.gov.tw/En

Tognazzini

责备价值与责备的情感性解释

Philosophia 2013 3. 24 41 4 1299 1312

10.1007 / s11406 - 013 - 9428 - 3

Alicke

米

指责严重

J Cogn邪教 2008 01 01 8 1 - 2 179 186

10.1163 / 156770908 x289279

Furnham

一个

相信一个公正的世界:过去十年的研究进展

Pers Individ Dif 2003 4 34 5 795 817

10.1016 / s0191 - 8869 (02) 00072 - 7

Dawtry

卡兰

米

哈维

一个

Gheorghiu

一个

受害者、小插图和视频:元分析和实验证据表明，情感影响会增强对无辜受害者的贬损

Pers Soc Psychol Rev 2020 08 24 3. 233 259

10.1177 / 1088868320914208

32321373

PMC7506872

Khatri

棕色（的）

希克斯

噢

从指责文化到医疗保健的公正文化

医疗保健管理 2009 34 4 312 22

10.1097 / HMR.0b013e3181a3b709

19858916

00004010-200910000-00004

高

Bischoping

21世纪中国责备老人话语的出现

交叉崇拜Gerontol 2018 06 33 2 197 215

10.1007 / s10823 - 018 - 9347 - 7

29732523

10.1007 / s10823 - 018 - 9347 - 7

卡拉里斯诺尔

将文化与COVID-19混为一谈:全球大流行的恐惧影响

社会科学与人文开放 2020 2 1 100044

10.1016 / j.ssaho.2020.100044

他

周

聂

他

米

COVID-19疫情期间的歧视和社会排斥

国际环境与公共卫生 2020 04 23 17 8 2933

10.3390 / ijerph17082933

32340349

ijerph17082933

PMC7215298

史蒂芬斯

米

地理空间信息流行病:绘制关于COVID-19的推特阴谋论

哼哼，乔治 2020 06 23 10 2 276 281

10.1177 / 2043820620935683

吉尔摩

米克斯

Domke

为什么(我们认为)他们恨我们:反美主义，爱国主义信息，以及归咎于过失

国际J公社 2013 7 701 721

20.

霍尔顿

一个

Weberling

克拉克

史密斯

乔丹

责备框架:mmr -自闭症疫苗恐慌的媒体归咎

健康Commun 2012 27 7 690 701

10.1080 / 10410236.2011.633158

22236220

诺布罗克-维斯特维克称

年代

泰勒

指责游戏:因果归因的要素及其在新闻中与代理人站在一边的影响

Commun Res 2008 10 07 35 6 723 744

10.1177 / 0093650208324266

埃切尔伯格

SARS和纽约唐人街:恐惧流行期间风险和指责的政治

社会科学与医学 2007 09 65 6 1284 95

10.1016 / j.socscimed.2007.04.022

17544189

s0277 - 9536 (07) 00223 - 7

PMC7130736

Atlani-Duault

病房

罗伊

米

莫林

威尔逊

一个

追踪流行病中的网上英雄主义和指责

《柳叶刀公共卫生》 2020 03 5 3. e137 e138

10.1016 / s2468 - 2667 (20) 30033 - 5

32085818

s2468 - 2667 (20) 30033 - 5

PMC7129481

假珠宝饰物

图兰

我们如何平衡COVID-19公共卫生应对与减轻污名化之间的紧张关系?从艾滋病毒研究中学习

艾滋病Behav 2020 07 24 7 2003 2006

10.1007 / s10461 - 020 - 02856 - 8

32266502

10.1007 / s10461 - 020 - 02856 - 8

PMC7137404

罗伊

米

男人

卢梭

梅西埃

一个

威尔逊

一个

Atlani-Duault

埃博拉和社交媒体的局部指责:2014-2015年埃博拉疫情期间推特和脸书对话的分析

Cult医学精神病学 2020 03 44 1 56 79

10.1007 / s11013 - 019 - 09635 - 8

31214902

10.1007 / s11013 - 019 - 09635 - 8

PMC7088957

加斯帕

佩德罗

Panagiotopoulos

Seibt

超越积极或消极:社交媒体对意外压力事件反应的定性情绪分析

计算人类行为 2016 03 12 56 179 191

10.1016 / j.chb.2015.11.040

库马尔

一个

Garg

基于情境的社交多媒体情感分析系统文献综述

Multimed Tools应用 2019 02 23 79 21 - 22日 15349 15380

10.1007 / s11042 - 019 - 7346 - 5

Anagondahalli

特纳

米

预测心理连锁反应:文化认同、群体内/群体外认同和责任归因在危机沟通中的作用

风险肛门 2012 04 32 4 695 712

10.1111 / j.1539-6924.2011.01727.x

22050442

常

Bazarova

神经网络

管理病耻感:支持厌食症网站的披露-反应交流模式

健康Commun 2016 31 2 217 29

10.1080 / 10410236.2014.946218

26266693

30.

哦

年代

李

汉

传染病爆发期间社交媒体使用对预防行为的影响:自我相关情绪和公众风险感知的中介作用

健康Commun 2020 02 16 1 10

10.1080 / 10410236.2020.1724639

32064932

Vaezi

一个

Javanmard

上海

新冠肺炎时代的信息传播和风险沟通

Adv Biomed Res 2020 9 10

10.4103 / abr.abr_47_20

32309248

ABR-9-10

PMC7147513

华

肖

从数据视角看冠状病毒(Covid-19)“信息大流行”和新兴问题:以中国为例

国际环境与公共卫生 2020 03 30. 17 7 2309

10.3390 / ijerph17072309

32235433

ijerph17072309

PMC7177854

梅德福

萨利赫

Sumarsono

一个

Perl

莱曼

铜

“信息大流行”:利用大量推特数据来了解公众对2019年冠状病毒疾病爆发的早期情绪

开放论坛感染疾病 2020 07 7 7 ofaa258

10.1093 / ofid / ofaa258

33117854

ofaa258

PMC7337776

查尔斯·史密斯

勒

雷诺兹

卡梅隆

妈

康威

米

刘

EHY

奥尔森

Pavlin

晶澳

Shigematsu

米

Streichert

信用证

须

科里

使用社交媒体进行可操作的疾病监测和爆发管理:系统的文献综述

《公共科学图书馆•综合》 2015 10 10 e0139701

10.1371 / journal.pone.0139701

26437454

玉米饼- d - 15 - 21599

PMC4593536

蔡

另一

层

风投

李

科尔在

米

利用语义词汇链从社交媒体中挖掘短文本结构

Decis支持系统 2019 12 26 127 113142

10.1016 / j.dss.2019.113142

怀廷

Olufuwote

理查德·道金斯

Cravens-Pickens

有意的

在线指责和亲密伴侣暴力:社交媒体评论的内容分析

质量代表 2019 01 13 24 1 78 94

古伯伯

摩根大通

金

奥尔

Messner

米

Meganck

年代

Instagram和Twitter上的埃博拉:卫生组织如何在社交媒体参与中应对卫生危机

公共关系 2017 09 05 43 3. 477 486

10.1016 / j.pubrev.2017.04.009

刘

问

郑

陈

问

刘

陈

年代

楚

朱

Akinwunmi

黄

张

巴

明

W-K

中国新冠肺炎疫情暴发早期新闻媒体健康传播:数字主题建模方法

J医疗互联网服务 2020 04 28 22 4 e19118

10.2196/19118

32302966

v22i4e19118

PMC7189789

李

徐

问

库莫

Purushothaman

麦基

新冠肺炎疫情早期中国社交媒体平台微博的数据挖掘和内容分析:回顾性观察性信息监测研究

JMIR公共卫生监测 2020 04 21 6 2 e18700

10.2196/18700

32293582

v6i2e18700

PMC7175787

范德米尔

TGLA

自动内容分析和危机沟通研究

公共关系 2016 12 22 42 5 952 961

10.1016 / j.pubrev.2016.09.001

常

一个

焦

预测关注者-影响者网络中的健康传播模式:以COVID-19期间的台湾为例

亚洲公共意见杂志 2020 08 31 8 3. 246 264

10.15206 / ajpor.2020.8.3.246

常

一个

舒尔茨

畅

亚历山大-伍尔兹

非传染性疾病的网络报纸框架:中国大陆、台湾、香港和澳门的比较

国际环境与公共卫生 2020 08 03 17 15 5593

10.3390 / ijerph17155593

32756457

ijerph17155593

PMC7432841

默罕默德

一个

Wiratunga

洛锡安

社交媒体类型的情境情感分析

以知识为基础的系统 2016 09 15 108 92 101

10.1016 / j.knosys.2016.05.032

Statista

截至2019年第三季度，领先社交网络在台湾的渗透率 2020 02

2020-10-01

https://www.statista.com/statistics/295611/taiwan-social-network-penetration/

陈

胡

太阳

米

刘

王

刘

激进增强的中文词嵌入

基于自然标注大数据的中文计算语言学与自然语言处理 2018 10 07

可汗

施普林格

3. 11

新冠肺炎防控相关词汇，用英语怎么说?

中国翻译研究院 2020 02 05

2020-10-01

http://beta.tac-online.org.cn/index.php?m=content&c=index&a=show&catid=395&id=3611