这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
2019年出现了一种新型冠状病毒的信息,并迅速在世界各地传播,引起了公众的极大关注,并引起了负面偏见。以指责为目的使用侮辱性语言引发了一场辩论。
本研究旨在识别社会群体中对应受责备行为者的社会污名和负面情绪。
我们启用了一个定制的文本挖掘平台,通过检索和过滤在线资源来识别自然环境中的数据,并从自然语言处理中构建词汇并学习单词表示,以便与研究主题一起进行演绎分析。数据来源包括台湾的10个新闻网站、11个论坛、一个社交网络和两个主要的媒体共享网络。从2019年12月30日到2020年3月31日,新闻和社交网络分析的综合。
我们整理了107万多篇中文文本。近三分之二的关于COVID-19的文本来自新闻服务(n=683,887, 63.68%),其次是Facebook (n=297,823, 27.73%),论坛(n=62,119, 5.78%),以及Instagram和YouTube (n=30,154, 2.81%)。我们的数据显示,在线新闻是消极情绪的温床,也是情绪化社交帖子的驱动力。关于COVID-19的网上信息将其与中国联系在一起,并通过提到“武汉肺炎”将其与中国的某个城市联系在一起,这可能会鼓励仇外心理。尽管世界卫生组织的指导方针是避免偏见和种族歧视,但采用这个有问题的绰号的频率很高。社会污名通过负效价反应被揭露,这与最受指责的目标有关。
我们的样本足以代表一个社区,因为它包含了广泛的主流在线媒体。与COVID-19大流行相关的污名化语言显示了公民责任的缺乏,助长了偏见、敌意和歧视。经常使用的侮辱性词汇被认为是冒犯性的,它们可能通过指责和鼓励仇外心理导致了最近对中国的反弹。强调了在COVID-19疫情期间,从健康风险沟通到减少污名化和仇外关切等方面的影响。了解与COVID-19疫情有关的术语和有偏见的术语至关重要。我们建议与传播专业人士团结一致,共同抗击COVID-19疫情和信息大流行。亟须找到遏制病毒偏见、污名化和歧视蔓延的解决办法。
2019年底,中国大陆湖北省武汉市出现了一种新型冠状病毒。2020年2月11日,世界卫生组织(WHO)正式将这种新型人类传染病命名为“COVID-19”[
各国政府因未能对COVID-19采取充分行动而受到批评。例如,中国政府被指责没有控制动物贸易,这被认为是导致人类感染的原因。早期的论述中有几篇文章表明,COVID-19可能起源于武汉的一个实验室[
在疾病爆发的背景下,社会污名来自于推卸责任的冲动;因此,大量研究已经承认,COVID-19会带来社会耻辱以及随之而来的指责和歧视(例如,[
截至2020年8月8日,台湾疾控中心共报告477例确诊病例,7例死亡,83,117人接受检测[
归因责任的前提是相信在一个公正的世界里,人们的行为是公平的,每个人都会得到他们应得的。
某些阶层的人和代理人成为负面健康后果的指责对象并不是一个新现象。例如,指责中国是一种常见的现象,并助长了中国是一个不卫生实体的概念。一些记者认为,纽约唐人街的中国移民应对2013年爆发的严重急性呼吸系统综合症(SARS)负责,尽管公共卫生官员未能在那里发现SARS病例。
责备可以反映用户的情绪状态和减轻潜在损失的努力。特别是,在交流背景中使用消极语气可以揭示对话者的意图,因为它们往往来自现有的沮丧和不满情绪[
当公众应对意外的与健康相关的风险事件时,污名化的绰号可以表明谁在给予和接受基于效价的指责[
总而言之,本研究旨在分析网络媒体被用来传播带有污名化线索的COVID-19相关信息的频率,研究现场的主要代理人与有关COVID-19大流行的负面情绪接触的频率,并通过考虑指责情绪来评估有关COVID-19的话语。这项研究利用现有的理论来理解社会污名和随后的指责是如何带来挑战的,因为国家正在努力克服对个人行动的限制,并转向更正常的社会互动。
研究人员提出了四个研究问题(rq),以确定对话者的意图,以及网络媒体在多大程度上将指责归咎于情绪的集体表达。
记者提问1:新闻媒体和其他社交媒体对COVID-19及其相关主题的报道和讨论有多少?
RQ 2:在与COVID-19有关的讨论中,有哪些带有情绪色彩的污名化术语被提及?
问题3:在网络媒体中,哪些目标最受指责?
RQ 4:在COVID-19大流行中,指责情绪和媒体来源之间有什么联系?
自然语言处理(NLP)在机器学习领域中,使计算机能够分析、操作并可能生成人类语言,已在世界范围内得到广泛应用(例如,[
本次研究时间为2019年12月30日至2020年3月31日,确保及时提供COVID-19相关信息。它还确保各时间段具有可比性,因为业务原因,例如为什么某些星期的需求可能比其他星期高,或可能影响指责话语的其他因素。研究策略包括使DivoMiner能够通过检索和过滤在线媒体来源来识别自然环境中的数据[
基于台湾领先的数字新闻平台的高使用率,我们招募了这些平台。与此同时,社交网络和论坛已经成为越来越重要的新闻来源。在所有社交网络服务中,渗透率最高的是YouTube和Instagram,约有2300万(89%)用户,其次是Facebook,有超过2100万(82%)活跃用户,以及开放论坛,有超过330万(95.5%)年龄介乎12至38岁的用户[
在3个月内发布的所有包含目标关键词的公开在线通信都通过DivoMiner应用程序自动收集。例如,我们招募了主流在线报纸《苹果每日新闻》及其Facebook粉丝页面,并观察到最大的基于终端的公告板系统PTT [
为了确保从语法明确的非结构化文本中捕获与COVID-19相关的观点的效率,我们对数据进行了训练,以在我们的模型中包含一些语义知识[
为了从网络文本中解析含义,所有与COVID-19相关的术语和关键词最初收集自中国国际出版集团公司于2020年2月发布的官方文件[
在定制平台uMiner中搜索分类法的一个例子是“肺炎”(肺炎),四个可选术语是“病毒性肺炎”(病毒性肺炎)、“冠狀病毒”(冠状病毒新型冠状病毒)、“新型冠狀肺炎”(新型冠状病毒)和“2019新型冠狀病毒”(2019新型冠状病毒)。测量侮辱性绰号的变量是基于对中国或中国人的集体行为倾向的NLP [
DivoMiner包含一个模块,用于确定每个意见的单词情绪。衡量三种情绪语调(积极、中性和消极)的变量是基于使用“快乐”、“快乐”和“喜欢”作为积极语调的参考点,而“愤怒”、“恐惧”和“悲伤”被用作消极语调的参考点。
我们在3个月的时间里,从台湾24个在线来源中筛选出了1,073,983条关于COVID-19的文本。关于COVID-19的第一篇文章是2019年12月31日在HiNet上发表的一篇新闻文章。据报道,台湾疾控中心已启动机上消毒检疫措施,以应对武汉肺炎疫情。值得注意的是,新冠肺炎在3周后被证实扩散到台湾。
在1073983条关于COVID-19的短信中,近三分之二来自新闻服务(n=683,887, 63.68%),其次是Facebook (n=297,823, 27.73%)、论坛(n=62,119, 5.78%)以及Instagram和YouTube (n=30,154, 2.81%)。每日的新冠疫情短信量分别为:新闻服务7354条(0 ~ 14561条)、Facebook 3202条(0 ~ 5937条)、Instagram和YouTube 324条(0 ~ 678条)、论坛668条(0 ~ 1264条)。
关于COVID-19的报道和讨论的数量显示出几个值得注意的模式。首先,在2020年1月19日之前,每天的新故事数量一直远远低于500个,但在1月20日,这一数字上升到了1000多个。2020年1月21日,新闻故事爆发,大约有3500个故事,第二天略少于5500个。从那时起,新闻服务机构提供的新闻数量在工作日增加到约1.2万篇,周末增加到6000至8000篇。其次,历史新高是在3月16日开始的一周内达到的。在那一周的五个工作日中,有四个工作日的报道强度是三个月时间框架中最大的。第三,在时间框架上有一个惊人的每周节奏,故事数量从工作日的每天约12000个故事下降到周末的6000到8000个故事。第四,其他来源的模式大体上反映了新闻服务输出的发展。
社交媒体和新闻服务中关于COVID-19的传播强度。
在传染病爆发期间,据观察,社交媒体帖子将用户的风险认知联系起来的潜在机制通常很高,从而产生了宣泄作用。关键词分析确定了两个关键短语,“蔡英文”(n=1,082,632;“台湾总统”(n=1,008,486)和“肺炎”(n=1,008,486)的总频率最高,其次是地理术语“武汉”(n= 762004)和“中国”(n=343,489)。口罩和口罩配给计划是第五大最常用短语(n=305,769)。与2019冠状病毒病相关的两个目标紧随其后:新移民族群(如中国大陆人、越南人、菲律宾人和印度尼西亚人;李文亮博士是一名眼科医生,曾试图在大流行的早期阶段提醒政府和公众注意迫在眉睫的危险(n=6004)。结果显示,共有51个常见的中文关键词的英文翻译
调查与每个主题相关的反应,包括疾病在内的六个主题;预防感染;地理命名;组织、机构和活动;政策;政治人物也经常被报道。相比之下,长期以来在各种来源中被报道最少的两个主题是那些与非政治人物、团体和职业有关的主题。均分为专题数据分析提供了集中趋势的度量。对COVID-19消息的属性进行了描述性分析
台湾网络传播中与新冠肺炎相关的高频词汇
COVID-19-related的话 | 频率、n |
蔡英文(或台湾政治人物或台湾总统) | 1082632年 |
肺炎 | 1008486年 |
武汉 | 762004年 |
武汉肺炎 | 715719年 |
中国 | 343489年 |
口罩或口罩配给计划 | 305769年 |
冠状病毒 | 261643年 |
确诊病例 | 185818年 |
消毒 | 99817年 |
勤洗手/仔细洗手 | 96593年 |
强制隔离自我监控隔离 | 91097年 |
谁一个 | 81134年 |
台湾同志(或台湾商人在中国大陆的两岸宪章) | 69310年 |
陈世忠(或卫生福利部长) | 62870年 |
城市封锁 | 51261年 |
台湾行政院行政院长苏庆卿 | 50863年 |
巡航,韦斯特丹,水瓶座,世界梦想,或钻石公主 | 46906年 |
40664年 | |
疫苗 | 29559年 |
疑似病例 | 23926年 |
一个卫生组织:世界卫生组织。
“肺炎”和“病毒”的使用可以追溯到2019年12月30日。因此,在第二天有关新冠疫情的讨论中出现了带有负面情绪的侮辱性词汇。随着人们对误用“武汉肺炎”一词的兴趣日益浓厚(n=639,456),它约占全部媒体来源的三分之一。独立卡方检验显示,关键词使用与媒体平台之间存在显著相关性(χ29= 2311455,
按媒体类型比较非污名化(推荐)关键词和污名化术语。
变量 | 非污名化,n (%) | 污名化,n (%) |
新闻(n = 1405306) | 886045 (63.0) | 519261 (37.0) |
Facebook (n = 561298) | 368049 (65.6) | 193249 (34.4) |
论坛(n = 106807) | 68157 (63.8) | 38650 (36.2) |
Instagram和YouTube (n= 60219) | 40894 (67.9) | 19325 (32.1) |
总(n = 2133630) | 1363145 (63.9) | 770485 (36.1) |
在带有情绪评估的侮辱性词汇中,“武汉肺炎”和“中国病毒”等具有潜在攻击性的词汇共累积了631192个带有相关情绪的帖子。消极语调超过50%与责备有关(n= 331,550,52.3%),而积极语调为26.86% (n=169,541),中性语调为20.61% (n=130,101)。情绪与污名化名词有显著相关(χ29= 994650,
媒体类型对污名化用语的情绪评估。
变量 | 正,n (%) | 中性,n (%) | 负,n (%) |
新闻(n = 359574) | 106091 (29.5) | 85681 (23.8) | 167802 (46.7) |
Facebook (n = 207768) | 49150 (23.7) | 29084 (14.0) | 129534 (62.3) |
论坛(n = 43464) | 6866 (15.8) | 11904 (27.4) | 24694 (56.8) |
Instagram和YouTube (n= 20386) | 7434 (36.5) | 3432 (16.8) | 9520 (46.7) |
总(n = 631192) | 169541 (26.9) | 130101 (20.6) | 331550 (52.5) |
情绪评估的数量从最低的6004个到最高的935691个不等。相比之下,有关情绪的帖子和报道最少的是政策、待遇、福利机构(0 ~ 1328)。对新闻服务和社交媒体活动中带有情绪的评论发展进行量化和理解后发现,一位政治家,即台湾“行政院长”,以两极分化的语气吸引了最多的关注,既有负面的(n=456,187, 48.8%),也有正面的(n=280,814, 30.0%)。台湾卫生福利部长陈士忠的负面言论(n=22,033, 42.0%)多于正面言论(n=15,432, 29.4%),因为他负责监督各部门和私人利益相关者对抗COVID-19的资源。
情绪分析与非政治目标,如新移民,外国劳工和外国配偶的消极情绪(n=3153, 43.2%)比积极情绪(n=2105, 28.8%)联系更多。出乎意料的是,举报人李文亮以及与他有关的问题与负面讨论(n=4358, 72.6%)的联系远远超过与正面讨论(n= 390,6.5%)的联系。李博士让其他人意识到病毒即将来临的问题,而与他有关的问题在病毒爆发的最初几个月里并没有得到赞扬。相反,李博士和与他有关的问题成为了批评的目标。唯一例外的是台湾“总统”蔡英文,在媒体上正面评论(n=7786, 45.7%)多于负面评论(n=3696, 21.7%)。具体而言,与她相关的正面评论主要集中在新闻服务(n=5318, 58.0%),而社交媒体:Facebook (n=2714, 51.6%),论坛(n=704, 39.1%), YouTube和Instagram (n=252, 34.6%)。用于讨论这位政治领袖的情绪在不同的媒体类型(χ29= 11088
以排名前六的人物和群体为目标,以三种情绪语调(积极、中立和消极)和四种媒体平台(新闻、Facebook、论坛、Instagram和YouTube)作为受试者之间的因素,进行了3 × 4方差分析,揭示了语调的主要影响(
根据事后测试,媒体场所与目标情绪的差异。
媒体一个 | 意思是(SD) | 意思是不同 | |||
|
|
新闻 | 脸谱网 | 论坛 | Instagram和YouTube |
新闻 | 4177 (3799) | - - - - - -b | - - - - - - | - - - - - - | - - - - - - |
脸谱网 | 1778 (1816) | 2339 (0.79)c, d | - - - - - - | - - - - - - | - - - - - - |
论坛 | 530 (355) | 3587 (1.33)c、e | 12482年 | - - - - - - | - - - - - - |
Instagram和YouTube | 225 (217) | 3892 (1.45)c、e | 1553 | 305 | - - - - - - |
一个单元格大小n=18。
b不适用。
c效果大小用括号表示。
d
e
这项研究揭示了一种模式,即网络上对COVID-19大流行的指责是如何针对那些有影响力的用户之前就对其不满或不满的群体和人物的。人们将责任归咎于他人的做法仍然容易出错,而且似乎很自然地假设,他们的感知偏见也是这种描述的对象的特征,而不仅仅是他们的实践的特征。使用社交媒体跟踪有关COVID-19和相关主题的新闻,在收集多样化和广泛的一般卫生新闻方面弥补了传统新闻的不足。公众通过各种资源对COVID-19进行解读,最引人注目的是主流网络新闻的呈现。总体而言,媒体来源的消极和积极语气之间存在很强的正相关。讨论频率的增加与在线媒体上情绪语调的增加相关。
病耻感是通过负价反应而不是与COVID-19相关数字相关的积极反应来揭示的。例如,台湾行政院长苏庆卿被认为是最受指责的人,尽管他被认为是负责预防和政策执行的当地人物之一。与他有关的指责主要出现在新闻上(n=519,261, 67.4%),其次是Facebook (n=193,249, 25.1%)和论坛(n=38,650, 5.0%)。被指控的代理人实际上是经常与负面情绪联系在一起的罪魁祸首。
台湾的新闻媒体被形容为专业和独立。
尽管本研究试图从所有媒体文本中建立推断意义的准确性,但本研究在研究设计和分析工作流程方面存在一些局限性。首先,在线媒体数据集的特点是类型的多样性,没有使用细粒度信息。特别是,来自个人社交媒体账户的数据以稀疏和短文本的形式出现,这不太可能导致对识别模糊信息的洞察。处理来自社交媒体的数据仍然是主观的,要量化合成的数据是一项挑战,因为这些数据不一定对客观真相有更接近的共同要求。其次,通过训练情感分析模型,我们的自动化方法不可避免地无法将文本简化为一个包含所有重要中文情感词汇的模型[
世卫组织和全球医疗权威机构已同意避免以地点或人群命名疾病,因为使用这些名称可能导致集体感知偏见、污名化和不准确的假设[
本研究探讨了在2019冠状病毒病(COVID-19)爆发期间,用英语以外的广泛使用的语言进行在线交流时,指责与各种目标之间的关联机制。鉴于迄今关于COVID-19的在线讨论的影响,在大流行期间减少污名化至关重要。这份及时的报告可用于为政策提供信息,并促进有关社会如何以减轻耻辱的方式应对大流行病的研究。特别是情绪分析在追踪传染源、预测传染病传播方面有很大的潜力[
本研究调查了网络媒体动态的争议性和扭曲性,结论是台湾用户在日常交流中存在对COVID-19的感知偏见的集体行为。在本地范围内,社交媒体用户广泛占据相同的地理区域,这就是为什么认为探索大流行作为未来研究的参考是合适的。媒体用户用负面语气推动了前所未有的污名化术语的传播,直接指向敌意和指责。正因为如此,有害的语言可能会有更高的风险,线下伤害的风险可能会加剧。因此,通过授权个人、健康传播研究人员、卫生保健专业人员和政策制定者为他们的行为负责,促进了指责设备的意识。我们建议与传播专业人员团结一致,共同抗击COVID-19疫情,并找到遏制病毒偏见、污名化和歧视蔓延的解决方案。
中文关键词分类,英文翻译。
有关台湾新冠肺炎网上传播的话题。
疾病控制中心
自然语言处理
中华人民共和国
研究问题
严重急性呼吸系统综合症
世界卫生组织
本研究由澳门大学(MYRG2019-00079-FSS;MYRG2020-00206-FSS)和澳门高等教育局(HSS-UMAC-2020-09)。我们感谢两位博士生焦文和冼学昌的帮助,感谢匿名审稿人对我们手稿的仔细阅读和许多有见地的评论。
AC和PJS设计了本作品的主要概念。AC和ST进行数据采集。ST和MTL参与数据解释。AC和PJS进行数据分析,撰写和编辑本文。AC、PJS、MTL对稿件进行评审和推广。
没有宣布。