发表在24卷,第8号(2022): 8月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/38776,首次出版
COVID-19封锁期间在线攻击增加:深度文本挖掘和差中差分析的两阶段研究

COVID-19封锁期间在线攻击增加:深度文本挖掘和差中差分析的两阶段研究

COVID-19封锁期间在线攻击增加:深度文本挖掘和差中差分析的两阶段研究

原始论文

1中央研究院人文社会科学研究中心地理信息科学研究中心,台湾台北

2台北市建国中学,台北市

3.国立中央大学计算机科学与信息工程系,台湾桃园

通讯作者:

蔡宗汉博士

地理信息科学中心

人文社会科学研究中心

台湾中央研究院

学院道128号第二段

出门

台北,11529年

台湾

电话:886 2 27898150

传真:886 2 27894160

电子邮件:rthtsai@gate.sinica.edu.tw


背景:COVID-19大流行在全球引发了严重的公共卫生危机,政策制定者正在利用封锁来控制病毒。然而,威胁社会稳定的攻击性社会行为明显增加。封锁措施可能会对心理健康产生负面影响,导致攻击性情绪增加。发现封锁与侵略增加之间的关系对于制定适当的政策来解决这些不利的社会影响至关重要。我们将自然语言处理技术应用于互联网数据,以研究封锁对社会和情感的影响。

摘要目的:本研究旨在利用NLP技术分析美国推文的时空范围内愤怒、攻击性语言和仇恨言论这三种攻击性情绪,以了解封锁与攻击性增加之间的关系。

方法:我们对11,455名推特用户进行了纵向互联网研究,分析了他们在2019年至2020年发布的1,281,362条推文中的攻击性情绪。我们选择了互联网上3种常见的攻击性情绪(愤怒、攻击性语言和仇恨言论)作为分析的主题。为了检测推文中的情绪,我们训练了一个来自变形金刚的双向编码器表示(BERT)模型来分析每个州和每周攻击性推文的百分比。然后,我们使用差中差估计来衡量封锁状态对攻击性推文增加的影响。由于大多数其他可能影响结果的独立因素,如季节和区域因素,已经被时间和状态固定效应排除在外,因此这种差异中的差异分析的显著结果不仅可以表明具体的正相关,而且可以指出因果关系。

结果:在2020年封锁的前6个月,所有用户的攻击水平都比2019年同期有所上升。值得注意的是,被封锁的用户比未被封锁的用户表现出更大的攻击性。我们的差异中差估计发现,封锁与攻击性增加(愤怒)之间存在统计学上显著的正相关关系:P=。002,offensive language:P<措施,hate speech:P= .005)。从这些结果可以推断出存在因果关系。

结论:了解封锁和侵略之间的关系可以帮助政策制定者解决封锁对个人和社会的影响。应用自然语言处理技术和在社交媒体上使用大数据可以为这一努力提供关键和及时的信息。

中国医学信息学报;2010;31 (8):888 - 888

doi: 10.2196/38776

关键字



背景

2020年3月13日,为应对COVID-19大流行,美国宣布进入紧急状态。许多州实施了封锁措施,以减缓病毒的传播。然而,封锁(居家)政策影响着人类生活的许多方面。人们在长时间的禁闭中所经历的沮丧和孤独可能会产生负面的心理影响[1-3.]。此外,挫折感可以表现为攻击性的增强[4]。当人们与亲密的家庭成员住在一起时,情绪问题,如自杀念头和攻击性,可能会导致破坏性行为,并对社会产生直接影响[56]。科学调查是否证实了这些观察结果,可能对公共或私人治理产生重大的政策影响。不出所料,封锁与不良心理影响之间的关系越来越受到多学科研究人员的关注。然而,很少有关于封锁和攻击性情绪之间因果关系的有力测试。这项研究使用机器学习来产生可靠的数据。然后,我们使用统计差异分析来估计封锁与网络攻击增加之间的因果关系。机器学习技术在社会科学研究中的应用,可以在更广的范围内以更快的速度提供新的信息。

相关的工作

封锁的负面影响

在个人层面上,研究表明,封锁与自杀意念、焦虑症、噩梦、抑郁、孤独和精神健康状况不佳有关[7-12]。在社会层面,封锁的不利影响表现为离婚和性暴力的显著增加[13],以及家庭暴力[14]。所有这些影响对个人和社会的稳定和福祉构成相当大的威胁。因此,了解COVID-19封锁下的这些有害行为是一项紧迫的任务。

其他心理学研究关注的是封锁前和封锁后心理健康状况的恶化[7]。作者通过比较封城前和封城后的调查数据,观察到封城后一个月某些健康行为有所增加。然而,作者没有分析封锁与这些行为之间的因果关系。

情感是人类行为的主要驱动力之一。更具攻击性的心理状态会导致家庭暴力和性暴力等攻击性行为,这是合理的。有影响的挫折-攻击理论[15表明攻击性行为是由于个人目标受挫而产生的挫败感。在大流行的最初几个月,封锁导致许多计划取消和目标未实现。因此,封锁与攻击增加之间的因果关系是合理的。

值得注意的是,一项研究调查了禁闭与攻击性增加之间的关系[2]。Killgore等人曾进行问卷调查[2]。他们使用巴斯·佩里攻击问卷来测量在美国大流行的最初几个月里,被封锁和未被封锁的患者的攻击水平。他们发现,在封锁组和非封锁组之间,以下四种攻击行为在统计上有显著增加:身体攻击、言语攻击、愤怒和敌意。然而,由于传统问卷调查方法的局限性,例如缺乏大流行前的数据,本研究无法评估封锁与侵略增加之间的因果关系。此外,由于调查管理的实际限制,作者必须在每次抽样中调查不同的参与者,这提供了额外的不确定性来源。

COVID-19推特情绪分析

使用自然语言处理(NLP)对推文进行在线分析,为健康相关研究提供了有价值的信息。已经进行了一般情绪分析,以检查人们在封锁下的情绪[1617]。

有些与特定主题有关,例如疫苗接种[18-20.],而另一些则与特定的地区或国家有关[21]。然而,据我们所知,大多数研究并没有分析禁闭和情绪之间的关系。苏等[22分析了两个进入封城的不同城市的心理语言特征。虽然这种方法可以捕捉到推特词汇的特定上升趋势,但词典频率分析方法并不能捕捉到每个单词的上下文。因此,它不能像神经网络模型那样准确地预测情绪[23]。

我们的研究

本文阐述了当前心理学和NLP研究的不足之处。最近的大多数心理学文献都没有提供有意义的证据来证明封锁和攻击性情绪之间的因果关系。另一方面,目前情感分析方面的NLP研究主要集中在优化机器在大量数字化人类话语中捕捉情感的方法。然而,目前公共卫生领域的NLP文献很少探讨社会现象的因果关系。

我们使用新的NLP技术对在线Twitter用户及其推文进行了虚拟纵向研究,以调查封锁对以下三种侵略行为的影响:愤怒、攻击性语言(offensive)和仇恨言论(hate)。我们的信息监测方法使我们能够发现攻击水平的趋势,为政策制定者和卫生专业人员提供重要信息。此外,封锁前后的数据使我们能够使用差中差分析(一种用于理解非实验时间序列数据中的因果关系的既定计量经济学方法)来估计封锁与攻击行为增加之间的潜在因果关系[24]。这种跨学科的方法在理解封锁和攻击增加之间的关系方面产生了强有力的结果,并为应用NLP和互联网技术支持医学研究开辟了新的潜力。


概述

首先,我们在美国选取了一组Twitter用户作为分析对象。然后,我们使用Twitter的应用程序编程接口获取采样用户在2019年1月1日至2020年10月1日期间发布的所有推文。我们的目标是使用神经网络模型来检测这些推文在不同时期的不同程度的攻击性情绪。我们选择了来自变形金刚(BERT)模型的双向编码器表示,这是一种最先进的语言模型,可以通过上下文和细微差别更好地理解情感的含义,比以前基于词典的模型[2325]。为了训练用于情绪检测的BERT模型,我们基于已建立的数据集收集训练数据[26-28]。之后,我们使用训练好的BERT模型对tweet情绪进行分类。我们进行了一项观察性分析,以比较和对比不同地区、封锁状态和时间之间的攻击水平。在观察到禁闭后攻击行为的增加后,我们使用泊松回归作为差中差估计来测量禁闭状态与攻击水平之间的关系。

Twitter数据采样

在美国,各州保留实施封锁政策的权力。因此,本研究使用状态锁定状态来确定单个用户在特定时间是否处于锁定状态。我们随机抽取Twitter用户作为纵向互联网研究的参与者,这些用户在地理上被标记为美国各州。在对用户进行抽样后,我们对他们在2019年和特朗普总统于2020年3月宣布全国紧急状态后的前6个月发布的每一条推文进行了抽样。我们的采样产生了11,455名Twitter用户从2019年1月1日到2020年10月1日发布的1,281,362条推文的时空数据集。抽样用户来自美国各地,包括所有50个州的用户。在这项研究中,我们使用这些推文来调查封锁与社交媒体攻击性之间的关系。所有推文都遵循数据预处理协议[29],然后用BERT模型进行情绪检测分析。

培训数据收集

为了检测推文中的攻击性情绪,我们对3种攻击性情绪中的每一种都训练了BERT神经网络二分类模型。对于每个模型,我们收集了不同的训练数据集。我们对每种情绪的定义与训练数据集的定义相同。表1包含3种攻击性情绪的定义表2提供每个示例文本。

表1。每种情绪的定义。
积极的情感 定义
愤怒 不满:强烈的不愉快或对立的感觉[26
攻击性的语言 含有不可接受的语言(亵渎)并对弱势群体有潜在危害的言论[27
仇恨言论 侮辱性语言:对某一目标群体表达仇恨的语言,目的是贬损、侮辱和羞辱[2728
表2。包含每种攻击性情绪的示例文本。
积极的情感 手机文字输入的软件
愤怒 我希望这一切尽快结束。这是地狱
攻击性的语言 人们真的这么愚蠢吗?
仇恨言论 @user腐坏从顶部开始......特朗普的蠢货都是种族主义者......去他们的!
愤怒

我们选择GoEmotions数据集来训练愤怒分类模型[26]。它是最大的人工注释数据集之一,包含58000条英文Reddit评论。在数据集中,每个句子都被注释,以识别28种相对常见的情绪的存在。为了训练二元分类的BERT模型,我们选择了6000个包含愤怒的句子和6000个不包含愤怒的其他句子的随机样本。我们选择了1000个其他带注释的注释进行测试。基于GoEmotions,愤怒被定义为“一种强烈的不愉快或对抗的感觉。”

攻击性的语言

冒犯性语言是包含不可接受的语言(亵渎)的言论,对弱势群体有潜在的伤害。我们选择了“仇恨言论自动侦测及攻击性语言问题”[27]数据集作为我们的训练数据集,其中包含24,802条人工标记的推文。我们随机抽取7750个句子用于训练,613个句子用于测试。该研究将带有真正有害意图的仇恨言论与一般的攻击性词汇区分开来。例如,许多青少年经常以一种随意的方式使用像f*ck和b*tch这样的词,并没有恶意。AHSD为攻击性语言和更有害的仇恨言论提供注释数据。

仇恨言论

与一般的攻击性语言不同,仇恨言论是一种更具体的语言,会造成故意伤害。为了训练我们的仇恨模型,我们将AHSD数据集(如前所述)与大规模人群外包(Large Scale Crowd Sourcing) [28]数据集,它提供了额外的2067条被人类标记为可恨的推文。我们随机抽取了6450个句子用于训练,639个句子用于测试。这两个数据集都将仇恨言论定义为表达对目标群体的仇恨,旨在贬低、侮辱和羞辱的语言。这一定义在以往的研究中被广泛使用[30.-32]。

模型训练

我们使用BERT模型[29来识别推文中的情绪。这种预训练的神经网络模型是情感理解中最强大的模型之一。该模型拥有来自整个英文维基百科的丰富预训练数据,在我们进行最后的微调之前,该模型已经对英语有了基本的了解。该模型的上下文嵌入使其能够根据上下文理解单词,使其语言理解能力超越传统的词汇分析。我们的模型架构是在python模块pytorch 1.8.1和transformer 4.11.0下构建的。使用训练数据,我们获得了所有3种目标情绪的出色表现模型(具体统计如下所示)。

模型评价

我们首先在测试集(训练-测试分割)上测试我们的模型预测。结果显示在表3,以及中的混淆矩阵图1。然后,我们在用于进一步分析的抽样Twitter数据集上测试了我们的模型。为了评估模型在自采样Twitter数据上的性能,我们选择了1080条推文,其中540条来自被封锁的人,540条来自未被封锁的人,每周随机选择5-6条推文。然后,2名以英语为母语的人根据上述每种情绪的定义对推文进行注释。注释器和模型性能之间的Cohen kappa值报告于表45,分别。通过这一点,我们可以验证我们的模型在Twitter数据上的能力,用于进一步的下游分析。

表3。模型在测试集上的性能。
模型 精度 回忆 F1
愤怒 0.869 0.826 0.847
攻击性的语言 0.953 0.988 0.970
仇恨言论 0.956 0.920 0.933
图1所示。我们模型的混淆矩阵:愤怒(A)、攻击性(B)和仇恨(C)。右下和左上象限是模型正确预测的地方,分别代表真阴性和真阳性。象限颜色越深表示预测能力越强。
查看此图
表4。评级者之间的科恩卡帕协议。
情感 卡巴
愤怒 0.928
攻击性的语言 0.937
仇恨言论 0.890
表5所示。在抽样的Twitter数据集上建模性能。
模型 精度 回忆 F1
愤怒 0.795 0.888 0.839
攻击性的语言 0.843 0.922 0.880
仇恨言论 0.810 0.872 0.839

数据分析方法

概述

为了理解推文中的攻击性水平,我们测量了所有随机抽样推文中包含攻击性的推文的比例。首先,我们对每一种攻击性情绪(即愤怒、攻击性和仇恨)使用单独的BERT模型来分析我们的Twitter样本数据。分析产生了3个数据集,每个数据集代表一种攻击性情绪。在每个数据集中,对于50个州中的每个州,我们计算了从2019年1月到2020年10月的92周内包含攻击性情绪的推文的百分比。这种分析产生了3个数据集,每个数据集有4600个数据点。

虽然我们的数据由不同时空设置下的攻击性推文数量组成,但我们分析了攻击性推文占总推文的比例,而不是攻击性推文的数量,以调查Twitter上的攻击性水平。这是因为攻击性推文数量的增加可能是由于发布的推文总数的增加,这并不一定表明攻击性水平更高。测量攻击性推文的比例更准确地描述了Twitter上的攻击性水平。

经过3个阶段的观察和分析,我们从不同的角度来看待这些数据。在第一部分中,我们比较了大流行前6个月不同封锁状态群体之间的攻击水平。在那之后,我们把重点放在了经历了封锁的州,我们观察了它们在封锁前后的侵略水平。最后,我们使用差异中差异分析来估计封锁对攻击行为增加的影响。

观察禁闭状态下和非禁闭状态下群体攻击水平的差异

为了了解封锁对攻击性情绪的影响,我们调查了每个特定时间和地点的攻击性推文比例,并比较了封锁下和非封锁下人群的比例。为此,我们设计了第一个目标。在2019年1月1日至2020年10月1日的92周内,我们将封锁州和非封锁州分为两组。然后,我们分别汇总攻击性推文的数量和总推文的数量。我们根据合并后的数据计算了92周内两组中每组每周攻击性推文的百分比。请注意,每个州的用户代表处于封锁状态的患者,而不是基于该州当前的封锁状态而处于封锁状态的患者。

观察在封锁前后几周经历封锁的州的侵略趋势

在上一节中,我们观察并比较了封锁下和非封锁组之间的攻击情绪。在本节中,我们重点了解了经历封锁的州的趋势。更具体地说,我们通过比较封锁前后的数据,研究了封锁后攻击行为的增加。我们根据封锁的第一周按时间顺序排列了每个封锁状态的数据。更具体地说,对于曾经经历过封锁的每个州,封锁开始的那一周被表示为第0周。其他周依次编号(即第0周之后的第一周为第1周,第0周之前的第一周为- 1周,以此类推)。使用这种方法,我们可视化了封锁后攻击性的增加。请注意,这仅仅是对封锁前后攻击趋势的观察。它没有衡量封锁状态对攻击水平的净影响。为了具体衡量影响并调查因果关系,我们在下一节中应用差中差估计,以统计方式量化封锁组和非封锁组之间攻击水平的差异。

用泊松回归分析差异中的差异

调查因果关系的传统方法是对随机分配的受试者进行实验,参与者被随机分为两组。一组接受治疗,另一组不接受治疗。然而,在包括我们在内的许多情况下,由于实际或道德原因,实验是不可行的。例如,我们不能随机分配人员并延长封锁时间。一些社会科学研究人员使用多元回归来解决这个问题,当感兴趣的自变量,X,以及其他相关变量,Z1、……Zk共同行动决定结果,Y。虽然这种方法可以控制所选效果Z变量,其他一些潜在的相关变量可能缺乏数据或难以识别,留下重要变量未被考虑的可能性。为了解决这个问题,科学家们使用了差异中的差异方法。

正如Callaway和Sant 'Anna所指出的,“差异中的差异(DID)已经成为最流行的研究设计之一,用于评估政策干预中的因果效应”[33]。差异中的差异是指治疗组与对照组在某一时刻(T1)与另一时刻(T2)的差异,以某一特定干预作为间隔。这种方法比较T1 (DT1)与T2 (DT2),并衡量两者之间的差异DT1DT2(差异中的差异)与干预有因果关系。简而言之,差异中的差异衡量的是干预是否会对差异产生因果影响DT1DT2(34]。在本研究中,治疗组是指被封锁的推特用户,对照组是指未被封锁的推特用户。干预区已被封锁我们的目的是比较这两组人在攻击程度上的差异(DT2)与封锁前两组之间(DT1),并衡量两者之间的差异DT1DT2与封锁有因果关系

为了实现时间序列数据的差中差估计,我们使用固定效应模型。固定效应模型通过控制每个地理和时间数据组(简而言之,数据组)的平均值来处理看不见的变量。每个数据组的平均值由许多因素组成,包括我们可能知道也可能不知道的Z个变量。换句话说,我们需要控制的Z变量的影响是在每个数据组的平均值中捕获的。通过从每个数据组的结果中减去平均值,固定效应模型控制了杂项Z变量的影响,并测量了X变量贡献的Y变量的净增长。以“州的固定效应”为例,不同的政治倾向和种族构成导致的侵略水平的差异被捕获在各州的平均侵略水平中。在减去平均值之后,我们现在测量了相对于每个州的标准,攻击性水平是如何增加的。在这项研究中使用的具有固定效应的模型“比普通回归分析更接近于实现对因果效应的无偏估计”[35]。

为了实现上面的固定效应模型,我们需要将固定效应添加到最适合我们数据的回归模型中。因为我们最初的观察是在特定时空设置中发布的攻击性推文的数量,所以我们的数据表示一种计数数据。因此,对于具有固定效应的计数数据,我们选择了经典泊松模型[36]。最初使用的公式如下:

ln (积极的推文数量s t) =α 0+α 1 在封锁+μ状态+σ时间+ε (1)

在这种情况下,积极的推文数量s t为特定时间(t)下特定状态(s)下攻击性推文的数量。α0是标准回归模型中的常数。变量α1表示治疗效果在封锁在激进的推特数量上。在封锁是一个二元变量(本实验中的解释变量),其值为0表示未处于锁定状态,1表示处于锁定状态。模型还包括状态和时间固定效应如下:μ状态σ时间。这两个变量没有特定的范围,而是代表其对应数据组的平均值(例如,某个州或特定周的数据)。ε是包含在所有统计回归中的误差项。

然而,如上所述,攻击性推文数量的增加可能是由于发布的推文总数的增加,这并不一定表明攻击性水平更高。测量攻击性推文的比例更准确地描述了Twitter上的攻击性水平。因此,为了使用这种基于计数的模型测量攻击性推文的比例,我们通过添加术语ln()将估计暴露于推文的总数。总计),系数固定为1,为方程。这个动作是为像我们这样的情况而设计的,并且得到暴露()选项[37]。更具体地说,我们现在的方程如下:

ln (积极的推文数量s t) =α 0+α 1 在封锁+μ状态+σ时间+ε+ ln (总计s t(2)

为了理解ln()总计s t)允许我们估计比例而不是数量,我们可以用下面的方式来看待这个方程:当减去ln(总计s t),估计相当于对攻击性推文的比例进行建模。方程如下:

ln (积极的推文数量s t/总计s t) =α 0+α 1 在封锁+μ状态+σ时间+ε (3)

我们的模型更接近于捕捉观测数据中自变量对因变量的无偏因果效应[35]。由于大多数其他可能影响结果的独立因素,如季节和区域因素,已经被时间和状态固定效应所吸收,因此这种差异中的差异分析的显著结果不仅可以表明具体的正相关,而且强烈表明因果关系。所有分析均使用Stata BE Edition 17.0 (StataCorp)进行。


观察禁闭状态下和非禁闭状态下群体攻击水平的差异

该分析比较了封锁状态下和未封锁状态下的侵略水平。美国于2020年3月13日宣布进入紧急状态。在实施封锁的42个州中,有40个州在2020年3月20日至4月4日的两周内开始封锁。图2显示了2020年4月至10月的数据,当时美国的疫情日益严重,一些州开始封锁。它说明了封锁下和非封锁下群体之间攻击水平的每周差异。图3缩小时间框架以包括2019年的数据,将大流行下的数据置于更广阔的视角。

图2。自2020年4月1日以来,所有三种攻击性情绪的每周攻击性推文百分比:愤怒(A)、攻击性(B)和仇恨(C)。显示了封锁状态(洋红色)和未封锁状态(青色)。
查看此图
图3。自2019年1月1日以来,所有三种攻击性情绪的每周攻击性推文百分比:愤怒(A)、攻击性(B)和仇恨(C)。显示了封锁状态(洋红色)、未封锁状态(青色)和封锁开始前的数据(黄色)。
查看此图
愤怒

在强烈的不满或对抗情绪方面,2020年5月的推特数量突然增加,在被封锁的人群中尤为明显。自4月以来的前9周,被封锁组的平均愤怒水平比另一组高2%-3%。图3显示2019年愤怒推文的比例在20%左右波动。到2020年5月,这一比例升至34%。在2020年夏天,愤怒程度下降了,两组的愤怒推文比例相似。

攻击性的语言

对于可能伤害弱势群体的不可接受的语言,自2020年4月以来的7周内,推文比例急剧上升(图2)。2019年,攻击性水平在6%左右波动(图3)。第7周,封锁组和非封锁组的攻击性推文比例分别飙升至12.2%和9.8%。之后,数量开始逐渐减少。尽管在封锁组和未封锁组中都看到了类似的趋势,但封锁组的推文百分比始终比另一组高2%-3%。

仇恨言论

对于旨在表达对目标群体仇恨的贬损、羞辱和侮辱性言论,推文比例在2020年4月1日起的第8周达到峰值(图2)。仇恨言论的百分比从疫情开始时的3%左右飙升至被封锁和未被封锁人群的8%和6%。百分比在2020年夏季下降,此后几个月逐渐稳定。与攻击性语言的趋势类似,仇恨推文的百分比在下降(图3)。在最初的激增之后,封锁下的仇恨言论百分比比另一组高1%-2%。

三种攻击性情绪的攻击性水平均出现飙升,在2020年4月1日之后的6-8周左右达到峰值(图2)。在整个过程中,被封锁的人比未被封锁的人表现出更强的攻击性倾向。未被封锁的人与被封锁的人经历了类似的趋势,但程度没有那么严重。在攻击性增加的初始峰值之后,三种情绪推文百分比都下降到一个相对稳定的平台。这种稳定可能表明,人们正在逐渐适应这种情况,与封锁初期的突然不满相比,情绪相对缓和。尽管出现了暂时的下降,但攻击性推文的比例仍远高于2019年的水平(图3)。

观察封锁前后几周的攻击趋势

我们选择了经历封锁的州,并比较了封锁前后的侵略水平。我们看到了封锁后越来越多的攻击趋势。图4显示包含目标情绪的tweet的每周变化。在封锁后的10周内,这三种攻击性情绪的推特百分比都有明显的上升。下表显示了平均每周推特百分比(封锁前60周和封锁后22周)。封锁后,这三种情绪的比例都有所上升(愤怒从18.51%升至23.77%;进攻型,5.80% - 8.79%;憎恨,2.97%对4.85%)。这些描述性数据使我们基本掌握了封锁与攻击增加之间的潜在联系。请注意,这部分并没有得出增加完全是由封锁造成的结论,而是显示了封锁前后攻击的总体趋势,这可能是由多种因素引起的。在接下来的部分中,我们进行了差异中差异分析,以精确估计封锁对攻击增加的净影响。

图4。在封锁前后,愤怒(A)、攻击性(B)和仇恨(C)的攻击性推文百分比。第0周的垂直红线表示封锁的开始。请注意,由于各州可能在不同的时间开始封锁,因此第0周在不同的州可能有所不同。然而,各州普遍在2020年3月20日至2020年4月4日之间开始封锁。
查看此图

用泊松回归分析差异中的差异

在本节中,我们使用泊松回归模型进行了差异中差异分析。封锁与所有三种攻击性情绪的攻击性推文比例增加有关。在对数线性模型中,原始系数,α1, X和Y之间表示X每增加一个单位,ln(Y)的增加,由于对数的存在,这很难解释。发病率比(IRR)是感兴趣的自变量e的指数系数α1,表示x每增加一个单位,Y就增加一个单位。对于所有3种攻击性情绪,攻击性推文比例与封锁状态之间的IRR均大于1(愤怒,1.049;攻势,1.168;仇恨(1.114),这表明在最初的封锁之后,愤怒、攻击性和仇恨的情绪推文平均分别增加了4.9%、16.8%和11.4%。3个结果均具有较高的统计学意义(anger:P=。002,offensive:P<措施,hate:P= .005)。差异中的差异结果显示在表6。在状态和时间固定效应的控制下,消除了大多数可能导致误读的因素。因此,我们可以衡量封锁状态对攻击水平的净影响。我们的估计强烈表明,在所有三种攻击性情绪中,封锁和攻击性增加之间存在因果关系。

表6所示。情绪推文比例与锁定状态的泊松回归结果。
锁定状态 发病率比 标准错误 z P价值 95%可信区间
被封锁(愤怒) 1.049745 0.0163949 3.11 .002 1.018099 - -1.082375
处于封锁状态(进攻) 1.168261 0.0319202 5.69 <措施一个 1.107345 - -1.232529
被封锁(讨厌) 1.114432 0.0432653 2.79 .005 1.032780 - -1.202541

一个STATA回归得到P=组织。


主要研究结果

禁闭状态下攻击情绪的信息监控研究

了解攻击情绪的趋势是了解大流行期间与攻击行为相关的各种社会问题的第一步。受Killgore等人问卷研究的启发[2],我们使用NLP作为一种信息监测方法来观察大流行前几个月的在线攻击趋势。我们希望这种方法能够支持传统的心理学调查,利用计算机技术提供一种更有效的理解人群情绪的方法。

通过使用全州范围的封锁状态来分析推文,我们可以在很长一段时间内捕捉到攻击水平的高峰和低谷。我们还可以确定不同封锁状态的群体之间的攻击水平差异。在观察到的时间范围内,攻击性水平有几个特别明显的峰值。这些偏差或许可以解释各种社会事件对公众情绪的影响。从2020年4月初,大多数州实施封锁,到同年5月下半月,攻击水平上升了2019年没有的幅度,被封锁的人比其他人表现出更严重的上升。全国新冠肺炎死亡人数从3月末的每天不到100人激增到4月中旬的2000多人,人们的情绪和生活方式受到了前所未有的冲击。通过封锁,死亡人数在接下来的几个月里稳步下降,在6月份达到较低的平衡。在全国大流行最严重的一个月里,当各州经历高死亡人数和内乱时,所有三种攻击性情绪都达到了顶峰。

在大约两个月的封锁期后,攻击性水平下降了。这种下降可能是由于流行病的疲劳,使人们感到压力较小,表现出较少的攻击性[38]。根据世界卫生组织的一份报告,“在危机开始时,大多数能够利用他们的激增能力——一种人类在极度紧张的情况下短期生存的精神和身体适应系统的集合。然而,当糟糕的情况持续下去时,他们不得不采取不同的应对方式,结果可能是疲劳和失去动力。[39]。尽管有所下降,但封锁状态下的攻击水平仍高于非封锁状态下的攻击水平。

尽管这三种攻击情绪的攻击倾向大致遵循相同的模式,但每种情绪都有一些略微不同的特征,这些特征揭示了每种情绪的独特性。愤怒是这三种情绪中最常见的。在最初的高峰之后,在接下来的几个月里,不同封锁状态的群体之间的攻击线交织在一起。攻击性和仇恨比愤怒更少出现。然而,在大流行的前6个月,被封锁者的攻击性和仇恨程度一直高于未被封锁者的水平。

我们的信息监测研究捕捉了特定时间段内人们情绪的波动,为政策制定者和公共卫生专业人员提供了重要信息。

禁闭与攻击性增加之间因果关系的发现

我们的估计表明,封锁与攻击性增加之间存在因果关系。为计数数据指定的泊松回归分析适合于估计在一段时间内发布的攻击性推文的数量。时间和状态固定效应能够解决锁定状态以外的因素对结果的不良影响。使用这个严格的统计模型,我们可以显示封锁状态对攻击性推文增加的净影响。在所有三种攻击性情绪(愤怒:P=。002,offensive:P<措施,hate:P= 0.005)与我们在信息监测研究中的观察结果相吻合,即被封锁的人具有更高的攻击水平。封锁状态下的攻击性情绪会引发家庭暴力、离婚等社会问题。我们的研究结果为了解大流行期间攻击性情绪的原因提供了重要信息。

潜在的政策影响

大流行期间,统计数据和科学证据在理性决策中发挥关键作用[40]。利用大数据发现封锁与攻击之间潜在的因果关系,可以指导政府在封锁期间实施心理健康支持政策。过去,精神健康支助有各种不同的形式,包括但不限于家庭暴力保护[41]、学校辅导[42]和心理咨询[43]。我们希望,我们对侵略趋势的时空探测可能有助于更有效地将公共资源分配给最需要的地区。此外,我们希望激励未来的研究人员使用机器学习来检测引起适当政策响应的社会趋势。此外,我们希望我们的因果分析能够提高社会和政治对大流行期间精神卫生政策重要性的认识。

与前期工作比较

基尔戈尔等人[2发现封锁后攻击性水平上升,这在被封锁的人群中尤为明显。我们的研究使用固定效应的泊松回归模型来精确测量封锁和攻击的净影响。这种广泛建立的计量经济学方法指出,封锁与侵略增加之间存在因果关系[33]。与传统的问卷调查一次只能收集一个主题的数据相比,我们从Twitter获得的数据更加多样化。通过调整分析方法,可以将其应用于其他课题的研究。

以前的NLP情绪分析研究主要集中在使用机器来理解大量文本中的情绪[1617]。然而,很少有人将这一技术应用于公共卫生领域社会现象的因果关系研究。受传统心理学问卷调查的启发,我们将NLP技术应用于情绪的纵向互联网研究。这种跨学科的努力为理解导致攻击性增加的因素提供了重要的信息。它为NLP技术提供了新的机会,使心理学和公共卫生研究更加高效和及时。

局限性和未来工作

我们的研究有一些局限性,也有可能在未来的工作中得到改进。首先,Twitter的数据过多地代表了更年轻的用户,他们更容易使用移动应用程序,并且生活在一种促进社交媒体的文化中。这些用户可能不能准确地反映整个人口,因为不同人口和社会经济地位的某些群体可能代表性不足[4445]。然而,这一局限性并非本研究独有,而是存在于所有涉及Twitter数据的研究中。其次,由于时间和计算的限制,考虑到可用tweet的总数,我们采样的tweet数量不是很大。在未来,我们可以使用这个研究过程来增加推文样本的数量,在更细粒度的尺度上检测空间和时间上的攻击水平。尽管如此,目前采样的推文数量足以让本研究显示全州范围内的攻击性波动,并得出统计上显著的主张。第三,为了确定每个用户的锁定状态,本研究只能使用用户的地理标记美国状态的锁定状态。由于我们无法在个人层面询问用户的锁定状态,这可能导致在确定用户的锁定状态时出现一些不准确的情况。这种限制是互联网上的社会事件研究所固有的。因此,我们的研究是在用户在其状态下遵循锁定策略的假设下进行的。此外,针对快速变化的大流行形势,出现了不同类型和严格程度的封锁政策。 This research only measured the initial lockdown where people were restricted to staying at home. Future research is open to measuring the effect of lockdown policies at different levels and nuances on aggressive emotions and behaviors. Another source of uncertainty comes from the Twitter user location labels, since the location is per user rather than per tweet (“a user who moves from one city to another [and updates his location] will have all of his tweets considered as being from the latter location” [46])。此外,Gore et al和Frank et al的研究表明,tweet的情绪与其所构成的地理区域(即城市)高度相关。4748]。最后,我们的研究方法并不局限于测量攻击性情绪。未来的研究可以很容易地将我们的方法应用于其他情绪和研究主题。使用NLP技术来帮助心理学和公共卫生研究在未来具有巨大的潜力。

结论

信息监控研究在现代社会非常有用。随着NLP的最新进展,可以训练模型准确地理解文本中的情绪。NLP技术可以应用于分析大量社交媒体数据中的情绪。这种大规模的公众情绪时空数据可以进一步分析,以探讨情绪趋势与封锁等特定政策之间的相关性和因果关系。将计算机技术应用于社会科学研究具有广阔的前景。

致谢

作者谨此感谢张云谦博士、何汉伟博士、林昌清博士、陈伯伟博士、杨殿汉博士、丁浩轩博士、卢辛恩博士、周丽芬博士、潘伟丽博士、蔡佩琴博士、林琴博士、梁志远博士和张爱玲博士对本文的帮助。本研究得到了国家科学技术委员会109-2221-E-008-062-MY3和109-2221-E-008-058-MY3的部分资助。

数据可用性

本研究的源代码可在GitHub [49]。

利益冲突

没有宣布。

  1. 2019冠状病毒病大流行:禁闭孤独大流行和数字技术的作用医学互联网研究,2020年11月05日;22(11):e22287 [J]免费全文] [CrossRef] [Medline
  2. Killgore WD, Cloonan SA, Taylor EC, Anlap I, Dailey NS。在COVID-19封锁期间,侵略行为日益加剧。[J]心理疾病学报,2011;5:1003 [J]免费全文] [CrossRef] [Medline
  3. Muñoz-Fernández N, Rodríguez-Meirinhos A.西班牙青少年在COVID-19隔离期间的担忧、习惯、同伴活动、挫折和乐观。中华临床医学杂志[J]; 2011;10(4):798 [J]免费全文] [CrossRef] [Medline
  4. 李建军,李建军。挫折攻击理论。编辑:Sturmey P。威利暴力与侵略手册。新泽西州霍博肯:威利;2017.
  5. 新冠肺炎疫情对自杀率的影响。吉林大学学报(自然科学版);2020年10月1日;113(10):707-712 [j]免费全文] [CrossRef] [Medline
  6. Moreira DN, Pinto da Costa M. 2019冠状病毒病大流行对亲密伴侣暴力的影响。国际法律与精神病学杂志[J]; 2009; 31 (1): 391 - 391 [免费全文] [CrossRef] [Medline
  7. Niedzwiedz CL, Green MJ, Benzeval M, Campbell D, Craig P, Demou E等。COVID-19封锁之前和初期期间的心理健康和健康行为:英国家庭纵向研究的纵向分析中华流行病学杂志[J]; 2011; 31 (3): 559 - 561 [J]免费全文] [CrossRef] [Medline
  8. Marroquín B, Vine V, Morgan R. COVID-19大流行期间的心理健康:居家政策、社会距离行为和社会资源的影响。精神病学杂志2020年11月;29:113419 [j]免费全文] [CrossRef] [Medline
  9. 王晓,Hegde S, Son C, Keller B, Smith A, Sasangohar F.新冠肺炎大流行期间美国大学生心理健康状况的横断面调查研究。医学互联网研究,2020,Sep 17;22(9):e22817 [J]免费全文] [CrossRef] [Medline
  10. 裴思宁,李建军,李建军,王建军,等。大流行梦境:对COVID-19封锁期间梦境内容的网络分析。中华精神病杂志2020年10月1日;11:57 - 39 [j]免费全文] [CrossRef] [Medline
  11. Groarke JM, Berry E, Graham-Wisener L, McKenna-Plumley PE, McGlinchey E, Armour C. COVID-19大流行期间英国的孤独感:来自COVID-19心理健康研究的横断面结果。PLoS One 2020 Sep 24;15(9):e0239698 [j]免费全文] [CrossRef] [Medline
  12. COVID-19大流行和封锁:印度办公室工作人员和学生睡眠中断、抑郁、躯体疼痛和屏幕暴露增加的原因。中国生物医学工程学报,2013;37(8):1191- 11200。(CrossRef] [Medline
  13. Usta J, Murr H, El-Jarrah R. 2019冠状病毒病封锁和对妇女的暴力行为增加:了解大流行期间的家庭暴力。2021年9月1日;8(3):133-139。(CrossRef
  14. 冠状病毒封锁对家庭暴力的影响。中国生物医学工程学报,2016:1-27 [j]。免费全文] [CrossRef
  15. 挫折-攻击假说:检验与重构。精神病学杂志1989;106(1):59-73。(CrossRef] [Medline
  16. Kruspe A, Häberle M, Kuhn I,朱XX。COVID-19大流行期间欧洲Twitter消息的跨语言情绪分析。出来了。2020.URL:https://arxiv.org/abs/2008.12172[2022-07-13]访问
  17. 李X,周,吴J,元,吴F,李J .分析COVID-19在线社交媒体:趋势、情绪和情感。出来了。2020.URL:https://arxiv.org/abs/2005.14464[2022-07-13]访问
  18. Mehedi Shamrat FMJ, Chakraborty S, Imran MM, Muna JN, Billah MM, Das P等。基于NLP和监督KNN分类算法的COVID-19疫苗推文情感分析[j] .中国生物医学工程学报,2011;23(1):463。(CrossRef
  19. 张宏,Rempel E, Roe I, Adu P, Carenini G, Janjua NZ。追踪加拿大推特上公众对COVID-19疫苗接种的态度:使用基于方面的情绪分析。[J] .中国医学信息学报,2010;24(3):391 - 391 [J]免费全文] [CrossRef] [Medline
  20. 胡涛,王生,罗伟,张敏,黄霞,严勇,等。用推特数据揭示美国公众对COVID-19疫苗的看法:时空视角[J]医学互联网研究,2021,sept;23(9):e30854 [J]免费全文] [CrossRef] [Medline
  21. Mohamed riddhwan K, Hargreaves CA.利用Twitter数据了解公众对新加坡COVID - 19疫情的情绪。国际信息管理与数据洞察学报(英文版);2011;1(2):100021。(CrossRef
  22. 苏勇,薛健,刘翔,吴鹏,陈健,陈超,等。考察武汉和伦巴第封锁对武汉和伦巴第的影响:微博和推特的心理语言学分析国际环境与卫生杂志,2020年6月24日;17(12):4552 [J]免费全文] [CrossRef] [Medline
  23. Kotelnikova A.深度学习和基于规则的情感分析方法的比较。2020年工业工程与现代技术国际多会议(FarEastCon);2020年10月6日至9日;俄罗斯符拉迪沃斯托克。(CrossRef
  24. Hernán MA, Robins JM。因果推理:如果。博卡拉顿,佛罗里达州:CRC出版社;2020.
  25. 李建军,刘建军。基于语义的情感分析与基于语义的情感分析。电子学2022年1月26日;11(3):374。(CrossRef
  26. Demszky D, Movshovitz-Attias D, Ko J, Cowen A, Nemade G, Ravi S. GoEmotions:一个细粒度情绪数据集。出来了。2020.URL:https://arxiv.org/abs/2005.00547[2022-07-13]访问
  27. david T, Warmsley D, Macy M, Weber I.仇恨言论自动检测与攻击性语言问题。出来了。2017.URL:https://arxiv.org/abs/1703.04009[2022-07-13]访问
  28. Founta AM, Djouvas C, Chatzakou D, Leontiadis I, Blackburn J, Stringhini G,等。大规模的众包和推特滥用行为的特征。2018年出席:第十二届AAAI网络与社交媒体国际会议;2018年6月25日至28日;斯坦福大学,CA。
  29. Devlin J, Chang MW, Lee K, Toutanova K. BERT:基于深度双向变换的语言理解预训练。出来了。2018.URL:https://arxiv.org/abs/1810.04805[2022-07-13]访问
  30. Badjatiya P, Gupta S, Gupta M, Varma V.基于深度学习的推文仇恨言论检测。In: WWW '17 Companion:第26届万维网伴侣国际会议论文集。2017提交于:第26届万维网伴侣国际会议;2017年4月3日至7日;澳大利亚珀斯。(CrossRef
  31. 华纳W,赫施伯格J.在万维网上检测仇恨言论。第二届社会媒体语言研讨会论文集,发表于:第二届社会媒体语言研讨会;2012年6月7日;加拿大蒙特利尔。
  32. 施密特A, Wiegand M.基于自然语言处理的仇恨言论检测研究。2017第五届社交媒体自然语言处理国际研讨会论文集,发表于:第五届社交媒体自然语言处理国际研讨会;2017年4月3日;瓦伦西亚,西班牙。(CrossRef
  33. Callaway B, Sant 'Anna PH.多时间段的差异中的差异。计量经济学[j]; 2011;22(2):200-230。(CrossRef
  34. angist JD, Pischke JS。基本无害的计量经济学:经验主义者的伴侣。普林斯顿,新泽西州:普林斯顿大学出版社;2009.
  35. 《社会测量百科全书》。荷兰阿姆斯特丹:爱思唯尔;2004.
  36. Hilbe JM。建模计数数据。英国剑桥:剑桥大学出版社;2014.
  37. Stata 17基础参考手册。大学城,得克萨斯州:Stata出版社;2021.
  38. 李晓明,李晓明,李晓明,等。亲密关系中的压力、愤怒和言语攻击:个体和双群体应对的调节作用。社会与人际关系杂志2010年4月22日;27(3):408-424。(CrossRef
  39. 大流行疲劳:重振公众预防COVID-19的精神:对世卫组织欧洲区域会员国的政策考虑世界卫生组织。URL:https://apps.who.int/iris/handle/10665/335820[2022-07-15]访问
  40. Dattner I, Gal R, Goldberg Y, Goldshtein I, Huppert A, kennett RS,等。统计学家在以色列应对COVID-19中的作用:一个整体的观点。[J]卫生政策研究,2010;11(1):22 [J]免费全文] [CrossRef] [Medline
  41. Chandan JS, Taylor J, Bradbury-Jones C, Nirantharakumar K, Kane E, Bandyopadhyay S.:需要一种公共卫生方法来管理家庭暴力。《柳叶刀公共卫生2020》;5(6):e309。(CrossRef
  42. 平卡斯R,汉诺-沃克T,赖特L,法官J. COVID-19对学生的影响:学校辅导员如何挺身而出。NASSP通报2020,12月11日;104(4):241-256。(CrossRef
  43. Kavoor AR, Chakravarthy K, John T. COVID-19大流行时代的远程会诊:澳大利亚地区公共急性精神卫生保健机构的初步经验。中华精神病学杂志[J]; 2009; 31 (1): 391 - 391 [J]免费全文] [CrossRef] [Medline
  44. Wilson K, Atkinson K, Deeks S.利用新技术提高疫苗信心的机会。专家Rev疫苗2014 Aug 14;13(8):969-977。(CrossRef] [Medline
  45. Karami A, Kadari RR, Panati L, Nooli SP, Bheemreddy H, Bozorgi P.地理标记行为分析:地理标记用户是否代表Twitter人口?[j] .地球物理学报,2021;02;10(6):373.](CrossRef
  46. Mislove A, Lehmann S, Ahn YY, Onnela JP, Rosenquist j。发表于:第五届AAAI网络日志和社交媒体国际会议;2011年7月17日至21日;西班牙巴塞罗那。
  47. 戈尔RJ,迪亚洛S,帕迪拉J.你就是你的推特:将美国肥胖率的地理差异与推特内容联系起来。PLoS One 2015 Sep 2;10(9):e0133505 [j]免费全文] [CrossRef] [Medline
  48. Frank先生,Mitchell L, Dodds PS, Danforth CM。幸福和生活模式:一项地理定位推文的研究。科学通报2013;9 (1):2625 [j]免费全文] [CrossRef] [Medline
  49. COVID-19封锁期间在线攻击增加:深度文本挖掘和差中差分析的两阶段研究。GitHub。URL:https://github.com/JeromeTH/Increased-Online-Aggression-During-COVID-19-Lockdowns[2022-08-02]访问


AHSD:自动仇恨言论检测和攻击性语言问题
伯特:来自变压器的双向编码器表示
IRR:发病率比
NLP:自然语言处理


编辑:A Mavragani;提交17.04.22;A . Klein, R . Gore的同行评审;对作者06.05.22的评论;修订版本收到19.06.22;接受23.06.22;发表09.08.22

版权

©徐子厚,蔡宗汉。最初发表于医学互联网研究杂志(//www.mybigtv.com), 2022年8月9日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map