发表在第24卷第8期(2022):8月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/36085,首次出版
评估社交机器人在COVID-19大流行期间的作用:信息流行、分歧和批评

评估社交机器人在COVID-19大流行期间的作用:信息流行、分歧和批评

评估社交机器人在COVID-19大流行期间的作用:信息流行、分歧和批评

原始论文

1加的斯大学生物医学、生物技术和公共卫生系,Cádiz,西班牙

2计算社会科学数据实验室,加的斯大学社会科学研究所,赫雷斯德拉弗朗特拉,西班牙

通讯作者:

Victor Suarez-Lledo,理学士,理学硕士

生物医学、生物技术和公共卫生系“,

加的斯大学

Av Ana de Viya

加的斯,11009

西班牙

电话:34 956019080

电子邮件:victor.sanz@uca.es


背景:社交媒体改变了我们的生活和交流方式,也为改善我们生活的许多方面提供了前所未有的机会,包括健康促进和疾病预防。然而,社交媒体也有其阴暗的一面,并不总是像它可能的好处那么明显。事实上,社交媒体也为与健康错误信息有关的新的社会和健康风险打开了大门。

摘要目的:这项研究旨在研究社交媒体机器人在COVID-19爆发期间的作用。

方法:在疫情爆发的早期阶段,Twitter流API用于收集关于COVID-19的推文。然后使用底部测量工具来获取每个账户是否是机器人的可能性。机器人分类和主题建模技术用于解释Twitter对话。最后,根据推文的来源比较了与推文相关的情绪。

结果:关于谈话话题,不同的说法有显著的差异。非机器人账户的内容与大流行的演变、支持和建议有关。另一方面,在自称为机器人的情况下,内容主要是新闻,如诊断测试的存在、大流行的演变和科学发现。最后,就机器人而言,其内容大多是政治性的。最重要的是,批评和反对的语气普遍压倒一切。在情感分析方面,主要的差异与谈话的语气有关。在自称机器人的情况下,这往往是中性的,而正常用户的对话得分是积极的。相比之下,机器人往往得分很低。

结论:通过根据账户成为机器人的可能性对其进行分类,并进行主题建模,我们能够对关于COVID-19的推特对话进行细分。机器人账户倾向于批评为遏制大流行而采取的措施,表达与政治家的不同意见,或质疑社交媒体上分享的信息的真实性。

中国医学杂志,2018;24(8):e36085

doi: 10.2196/36085

关键字



社交媒体已经从根本上改变了我们的生活和交流方式。这些新的交流平台为改善我们生活的许多方面,包括公共卫生,提供了前所未有的机会。12].它们有助于改善我们获得循证卫生信息的途径,这些信息对于促进健康习惯和促进风险预防至关重要[2].此外,网络上与健康有关的知识和内容的逐步增长,已被发现对需要获得医疗技能和提高自我效能以坚持治疗或疗法以及预防疾病的患者很有用[3.].

然而,社交媒体也为新的社会和健康风险打开了大门。45].减少错误信息和虚假健康谣言的政策正变得越来越普遍。事实上,一些最广泛的社交媒体平台,如Facebook、Instagram和Twitter,已经实施了政策,以打击有关COVID-19大流行的错误信息的传播。然而,基于网络的生态系统仍然充斥着健康神话、骗局和假新闻故事,这些都是由社交媒体用户出于不同目的而有意识或无意识地传播的。这些信息可能导致态度和行为的改变,从而可能导致不适当的健康决策[67].研究还发现,在危险情况和H5N1、埃博拉和寨卡等疫情爆发期间,卫生错误信息的影响对卫生决策具有决定性作用[5]病毒和最近的COVID-19大流行[89].误导性信息甚至阻碍了为应对疫情而采取的公共卫生行动[10-12].例如,在COVID-19大流行的背景下,发现了关于病毒来源、可用的潜在治疗和保护措施以及疾病的实际影响的误导性信息[13].在一个与COVID-19有关的推文样本中,24.8%的推文包含错误信息,17.4%的推文包含无法证实的信息[13].最近,大流行期间的许多错误信息集中在关于疫苗接种过程的辩论以及随后新疫苗在人群中引起的怀疑[14].

因此,社交媒体在COVID-19大流行期间发挥了至关重要的作用。尽管这些新平台在大流行最关键的时刻有助于让公众了解情况,但卫生当局抗击疫情的反应之后出现了大规模的“信息大流行”,最近的定义是“信息过剩——有些准确,有些不准确——使人们在需要时很难找到值得信赖的来源和可靠的指导”[15].在社交媒体生态系统中,与COVID-19相关的信息消费、意见形成和社会传染过程已成为研究人员面临的主要挑战[16],因为这些过程会严重影响人们的行为,并降低政府和卫生组织实施的对策的有效性[17].

最近,由于所谓的“社交机器人”(即自动网络账户)的出现,错误信息动态增加了复杂性。在政治竞选和选举期间,社交机器人在社交媒体平台上传播错误信息方面的作用已得到广泛认可。18]以及与卫生辩论有关,特别是在卫生危机期间[19].关于社交媒体平台上的健康传播,有研究发现社交机器人被用于推广某些产品,以增加公司利润,并支持某些意识形态立场[20.]或与健康证据相矛盾[2122].机器人具有某些行为特征,使其成为潜在的虚假信息超级传播者(例如,过度发布和频繁转发新兴新闻,标记和提及有影响力的话题或相关人物)[20.2324].这些帐户经常使用放大作为一种传播内容的策略,这些内容基于这些自动帐户创建者的利益[25],但它们也常被用作制造分歧和社会两极分化的工具[22].

在COVID-19信息大流行的背景下,社交机器人的活动急剧增加[25]因为他们参与了关于控制大流行的卫生措施的辩论,以及在此期间出现的疫苗[26].迄今为止,已经确定的是,在复杂的社交媒体生态系统中,社交机器人(特别是未经验证的账户)的逐渐扩散可能会加剧COVID-19错误信息的传播,并导致大流行的后续演变,要么放大了质量可疑的信息,要么在有争议的问题上产生两极分化[25].然而,我们需要更好地理解这些机器人在COVID-19信息大流行中的作用[27].为了填补这一知识空白,这项研究旨在探索社交机器人在COVID-19大流行早期阶段的作用。我们的目标是回答3个基本问题:(1)COVID-19爆发期间推特上的主要对话主题是什么?(2)这些主题如何根据信息源(非机器人、机器人或自称的机器人)而变化?(3)谈话的基调如何随着来源的不同而变化?


数据收集

数据收集从2020年3月16日开始,到6月15日结束,使用带有以下标签的Twitter流API:covid_19covid19covid,冠状病毒.这些标签在此期间用于记录COVID-19第一波疫情期间的对话。为了简化后续的分析,只选择了用英语写的推文。最终的数据样本包含了来自约28.5万个不同Twitter账户的约1400万条推文。

机器人的分类

我们使用Botometer(原BotOrNot;OSoMe计划)[28]来获得每个账号是否是机器人的可能性。BotometerTwitter是一项公开服务,利用1000多个功能来评估Twitter账户与社交机器人已知特征的相似程度。与其他研究一样[2930., 0.8是用来将一个账户归类为机器人的分数。此外,在基准研究中,机器人账户占Twitter账户总数的比例在9%至15%之间[31].在我们的例子中,这个分数将大约14%的帐户归类为机器人。

除了成为机器人的整体可能性,Botometer还为6种不同的机器人类型给出了具体的分数:回音室,假追随者,金融,自我声明,垃圾邮件发送者和其他。考虑到社交机器人的不同性质,人们认为有必要在自称的机器人和其他类型的机器人之间做出区分。从Botwiki提取自我声明的机器人[2832].

主题建模

最后,在对机器人进行分类的同时,我们还应用了主题建模技术。这种无监督的分类方法允许对文本进行分类,使用诸如聚类之类的技术来查找具有相似内容的文本组。在这种情况下,我们使用潜伏狄利克雷分配(LDA),这是一种流行的主题建模技术,它将每个文档视为各种主题的随机混合,将每个主题视为单词的混合[33].

为了正确解释结果,我们考虑了语料库中主题的分布、每个主题的关键词以及主题间距离[34].在此基础上,提取语料库中不同文档中最常见的主题。对于每个主题,我们根据模型获得了最相关的单词和50条最具特征的推文。然后,我们进行了归纳定性过程来描述每个主题,然后是描述性过程来编纂信息[35].分歧由双方协商解决。我们还分析了不同类型的帐户在主题中的分布情况。这种方法使我们能够确定主要的谈话主题。36]以及每种帐户最常见的帐户名称。

此外,我们还绘制了一张专题间距离图[34]以在二维空间中可视化主题。主题圈的面积与字典中属于每个主题的标记(即单个单词)的数量成比例。这些圆圈是根据它们所包含的单词使用多维缩放算法绘制的,距离越近的主题有更多的共同单词。

情绪分析

对于每一组,我们都使用情绪分析来检查与内容相关的语气或情绪。情感分析是自然语言处理、文本分析和计算语言学领域的一个知识领域,用于从资源中识别和提取主观信息。在文本挖掘的情况下,情感分析涉及到基于文档中语言的积极或消极内涵自动对文档进行大规模分类[37].

对于情绪提取,我们使用了价感词典和情绪推理器(VADER),这是一种基于规则的工具,专门针对社交媒体平台上表达的情绪[38].VADER使用与词汇相关的情感组合,这些词汇通常根据语义方向标记为积极或消极。与其他文本分析工具不同,VADER可以很好地处理从社交媒体平台提取的文本,因为它不需要像其他工具那样多的文本[39-41].

该方法的另一个特点是输出值。大多数情感分析将文本分为积极的、消极的和中性的;例如,被认为是积极的文字、表达或写作方式占主导地位的文本就被归类为积极的。但是,这里使用的方法返回一个介于-1到1之间的情绪分数,允许在不同类型的帐户之间进行更高级别的比较。


机器人的分类

表1显示结果分类。如果一个账号是bot的概率低于0.8,我们将其视为普通用户(即非bot)。如果一个账户是一个自称的bot的概率高于0.8,我们将其归类为自称的bot。机器人的概率高于0.8,而自称机器人的概率低于0.8的账户被归类为机器人。在205,298个账户中,大部分(n=187,992, 91.6%)是正常用户;4.2% (n=8616)被归类为机器人账户的可能性很高;4.2% (n=8690)被归类为自称的机器人。机器人账号平均每个用户发布123.3条推文。在3个月的时间窗口内,被归类为自称机器人的账户平均每个用户发布121.1条推文。然而,被归类为机器人可能性较低的账号平均每个用户发布42.5条推文。 These differences between the mean values were statistically significant (F2284814年= 1056;P<措施)。Broniatowski等人也指出[22],最活跃的账号平均被归类为机器人账号。

并不是所有的群体都贡献了相同的程度。同样,与会者在全球讨论中的贡献也是极不平等的。基尼系数被用来衡量这种不平等。基尼系数是衡量收入分配的指标,基尼系数越高,表明收入不平等程度越高。图1显示了这些分布,自称机器人的基尼指数为0.786,非机器人的基尼指数为0.744,机器人的基尼指数为0.686。自封机器人的分布最不平等:75%(6517/8690)的自封机器人发布了12.5%(131559 / 1052471)的推文。相比之下,75%(6462/8616)的机器人账户发布了25%(265,499/1,061,997)的推文。

表1。机器人分类分布。
账户(N=205,298), N (%) 推特(N = 10098455)


n (%) 的意思是 中位数
Nonbot 187992 (91.6) 7983987 (79.1) 42.5 9.0
机器人 8616 (4.2) 1061997 (10.5) 123.3 35.5
自称的机器人 8690 (4.2) 1052471 (10.4) 121.1 15.0
图1。洛伦兹曲线显示了推文数量的不平等。
查看此图

在自称为机器人的情况下,最活跃的账户传播官方数据(COVID-19病例数和死亡率等)。其次,这些账户中有几个是数字杂志或独立新闻机构。在对这些账户的描述中提到,它们创建信息,定期报告疫情情况,通报COVID-19的全球演变或大流行演变的重大变化。其中许多报告表明,它们的目的是提供资料。鉴于这种情况,这些概要文件与分析中归类为常规机器人的概要文件分开。

被归类为机器人的账户的描述彼此非常不同。许多账户都自称是科技公司。其他人则认为自己是政治、环境甚至军事方面的积极分子。这些账户在推特上谈论了大流行、所采取的政治措施,或对不作为造成的情况的抱怨。

主题建模

对账号进行分类后,采用LDA提取主题。为了选择正确的主题数量,我们依赖于变异系数,它衡量了由模型推断的主题之间的一致性。换句话说,系数表明哪个主题的组合是最连贯的。较高的值表示主题在语义上是可解释的。主题一致性测量是通过测量主题中得分较高的词之间的语义相似程度来对单个主题进行评分。这一概念汇集了若干评估主题之间一致性的措施。为了选择主题的数量,我们重新应用LDA模型,使用不同的输出,选择变异系数最高的主题(多媒体附件1).共抽取18个主题,并使用主题间距离图进行绘制。

在下面的主题间距离图中(图2),每个气泡代表一个主题。每个主题都被分配了一个数字,这取决于它里面的推文数量。相应地,Topic 1的令牌比例高于Topic 2,依此类推。气泡越大,本主题中分类的代币数量就越多。话题之间的距离越远,它们之间的差异就越大。因此,相邻的两个题目之间并没有太大的差异。相反,距离越远,差异就越大。

图2。专题间距离图。PC:主成分。
查看此图

我们还在柱状图中绘制了最常见的术语(图3).这些词汇是根据它们出现的次数排序的。彩色的条形图显示了一个术语在每个主题中出现的估计次数。灰色条表示语料库中每个词的总体频率。在解释结果时,不仅需要考虑最常见的术语,而且还需要考虑最突出的术语。显著性是一个词出现概率加权的结果,P(w)通过其特殊性,衡量特定术语对确定生成主题的信息量有多大。因此,显著性是衡量这个词在其他话题中出现次数少或根本不出现的程度。36].

然后我们进行了定性阶段,双方作者在89%(16/18)的案例中意见一致。表2显示在分类中获得的结果。

图4,每一行是一个主题,每个圆点代表每个主题中帐户的百分比。主题1包含关于疫情信息的推文。这些信息的重点是提供有关这一流行病蔓延的信息,以及需要采取哪些行动来制止这一流行病。最常见的单词是保持首页,家庭。其他推文分享了这类信息,但只针对特定地区。例如,主题9集中在非洲地区,主题13集中在印度的封锁。

这两个主题在自称的机器人和其他账户之间有最大的区别。主题9累积了最高比例(1581/8690,18.2%)的自述机器人账户,相比之下,机器人(896/8616,10.4%)和非机器人(201115 / 187992,10.7%)。同样,主题13中自称机器人的百分比为5.7%(495/8690),而机器人的百分比为3.4%(293/8616),非机器人的百分比为3.8%(7144/187,992)。

专题2载有关于大流行病演变的资料。本专题的重点是关于第二波死亡人数的资料。最常见的关键词是情况下死亡报告,总计.在下列专题中,示范小组的内容涉及遏制这一流行病的具体措施。Topic 3提到了缺乏测试。一些话题提醒人们呆在家里(Topic 4),提醒人们戴口罩的重要性(Topic 11),提醒人们洗手(Topic 12)。

其他信息则与美国政治或特朗普总统有关。话题17中的大多数推文都是关于美国国会的决定。话题18提到了一些国家的政治丑闻。话题8集中在批评特朗普总统的政策。这些推文将特朗普总统描述为骗子和不负责任的人。一些最常见的关键字是总统特朗普中国病毒一年,世界.这个话题在机器人和其他账户的百分比之间有最大的差异。在话题16中,大部分推文都提到了美国总统缺乏诚实。还有人抱怨说,需要分享真实的信息,无视谣言(话题15)。在这最后两个主题中,机器人账户的百分比略高于其他账户。

图3。随主题的单词分布。
查看此图
表2。每个主题的主旨。
ID 主题
1 关于冠状病毒的新闻
2 第二波疫情和疫苗
3. 对缺乏COVID-19检测的抱怨
4 呆在家里
5 中国与疫情的关系
6 尊重卫生保健工作者
7 大流行期间的财政援助和慈善事业
8 特朗普和大流行
9 在马哈拉施特拉邦和非洲报告阳性病例
10 指出COVID-19不同于流感
11 戴口罩
12 预防COVID-19传播的技巧
13 印度封锁
14 名人之死
15 需要真正的领导力
16 呼唤诚实
17 美国国会的决定
18 国家丑闻
图4。主题内的帐户分布。
查看此图

情绪分析

非机器人组的VADER得分平均值为0.0109 (SD 0.414),自称机器人组的VADER得分平均值为0.00784 (SD 0.383),机器人组的VADER得分平均值为-0.0155 (SD 0.427)。采用方差分析(ANOVA)检验各组的平均值是否有统计学显著性差异(F2284814年= 5216;P<措施)。图5显示了平均分在这段时间内的演变。在机器人的情况下,平均值几乎总是更低,这表明在这一组中有更多与负面情绪相关的词汇。被归类为自称机器人的账户的值更接近于0。另一方面,被归类为机器人的账户得分为负。

如果我们考虑构成这些对话的不同主题,就能更好地理解非机器人、自我声明的机器人和未声明的机器人之间的情绪差异。虽然大多数由非机器人发布的推文都集中在分享人们因疫情而经历的情况,但自我宣布的机器人倾向于在世界各地发布关于疫情的新闻,而未宣布的机器人通常集中在批评政治措施,参议员或州长之间的人际指责,以及针对政府或政治领导人对健康危机管理不善的批评。在分析的这一点上,鉴于难以充分控制大流行,未声明的机器人似乎更有可能传播对政治和卫生当局的不同意见、批评和抱怨。

图5。价值感知字典和情感推理器(VADER)情感分析的平均值。
查看此图

主要研究结果

这项研究对COVID-19大流行早期阶段推特上社交机器人的作用进行了评估。所识别的不同帐户类型(自我声明的机器人、未声明的机器人和非机器人)之间存在一致的差异。尽管与大量的人类用户相比,Twitter上未公开的机器人所占的比例相对较低,但已经确定的是,机器人通常与具有争议性和两极分化的网络对话有关。从这个意义上说,考虑到这些自动代理在扩大我们社会中产生冲突的思想和意见方面所发挥的作用,它们的作用远非可以忽略不计[4243].

采用的分类可以比较大流行最初几个月里3个不同Twitter用户的对话中出现的不同主题。此外,据我们所知,与其他不考虑信息来源和类型的一般方式分析情感的作品相比,这项研究有几个优势[44-46].首先,我们的研究提供了关于信息源(非机器人、自称机器人和机器人)的额外信息,特别是关于不同Twitter用户的可信度。其次,它可以根据COVID-19大流行爆发期间的话题和相关情绪对推特对话进行更深入的分析。第三,根据来源对主题进行比较,不同类型的账号之间存在内部一致性。因此,与不同推特用户账户(特别是与机器人相关的账户)相关联的主题和情绪的区分,对于识别、描述和监测可能在信息大流行中出现的虚假信息源是相关的。47].

另一方面,情绪分析还提供了在COVID-19大流行的头几个月里,未申报的机器人或自动账户的策略。我们的研究表明,社交机器人被用来批评和骚扰政治对手,而不是在面对广泛的错误信息急需高质量信息的情况下,提供有关健康措施和自我保护行为的有用信息[47].与我们的研究结果一致,最近的一项研究表明,右翼自媒体账户和阴谋论者可能会导致这种观点两极分化,而恶意机器人可能会促进不可信信息的传播[42].我们没有发现关于卫生问题的大量错误信息,而是发现了关于政治决策过程和应对COVID-19大流行措施(如疫苗和防护措施等)的重大分歧。从这个意义上说,自动帐户的对话更多地指向产生冲突和分歧[43].

尽管有这些发现,但还需要更多的证据来确定大流行最初几个月滥用社交机器人对社会和健康的影响。同样,有必要确定这些因素在多大程度上阻碍了不同政府对卫生危机的预防和控制。在任何情况下,这是一个新的工作假设,仍然是开放的,应该在未来的研究中详细分析。

局限性和优势

这项研究受到一些限制。首先,从Twitter收集的数据受到Twitter流API的技术特征的限制。虽然流式API比REST API更准确,但它从不返回关于对话的推文总数[48].此外,由于技术上的限制,不可能分析整个对话。此外,通过只选择用英语写的推文,对话的内容主要集中在美国和英国的话题上。其次,所分析的时期处于疫情爆发的早期阶段,对话往往会像大流行那样演变。第三,当在互联网上观察自我表达时,只能捕捉到用户当时选择表达的思想和情感,这些思想和情感可能是为了投射一个公共形象而战略性地组成的[49].尽管如此,许多心理健康研究表明,社交媒体是其用户的一个有价值的出口和支持来源[50].主题建模是获得对话中不同主题的大致概念的一种很好的技术。然而,这种技术的缺点是必须预先选择主题的数量。在我们的例子中,我们使用变异系数来确定每个组的最佳数量。

另一方面,这项研究也有几个优点。首先,要考虑到信息源的可信度。在社交媒体平台的研究中,这方面很少被提及[2].其次,这项研究分析了关于大流行爆发的对话,社交媒体网站是这种情况下的热点[5,随着用户在这些平台上的信息搜索量增加。

结论

通过根据成为机器人的可能性对账户进行分类,并应用主题建模,我们能够对关于COVID-19大流行的推特对话进行细分。例如,非机器人账户倾向于分享信息或就如何应对大流行提出建议。这些被宣布为机器人的账户主要共享关于大流行的信息和统计数据。最后,没有被宣布为机器人的账户往往会批评为遏制大流行而采取的措施,表达与政治家的不同意见,或质疑社交媒体平台上分享的信息的真实性。我们还使用情绪分析来比较这些不同组的谈话语气。自称的机器人会以中立的语气进行对话。非机器人账户写的信息的语气往往比前者更积极。相反,未申报的机器人的语气总是比自行申报的机器人的语气更消极。因此,有必要在信息传染病时代对这些病原体进行识别和监测。

致谢

我们要感谢可持续社会发展大学研究所、Cádiz大学以及西班牙科学与创新部运营的拉蒙卡哈尔项目的支持。

这项工作得到了授予JAG的Ramon和Cajal赠款(RYC-2016-19353)和DCODES项目(pid2020 - 118589tb - i00)的支持,由MCIN/ AEI/10.13039/501100011033资助。

利益冲突

没有宣布。

多媒体附件1

题目数量变异系数得分。

PDF档案(adobepdf档案),119kb

  1. McGloin AF, Eslami S.数字和社交媒体改变饮食行为的机会。生态学报2015年5月;74(2):139-148。[CrossRef] [Medline
  2. 周伟,吴A,克莱因WMP。解决社交媒体上有关健康的错误信息。JAMA 2018 12月18日;320(23):2417-2418。[CrossRef] [Medline
  3. Neter E, Brainin E.电子卫生素养:将数字鸿沟扩展到卫生信息领域。J Med Internet Res 2012 1月27日;14(1):e19 [免费全文] [CrossRef] [Medline
  4. Suarez-Lledo V, Alvarez-Galvez J.社交媒体上健康错误信息的流行率:系统回顾。J Med Internet Res 2021年1月20日;23(1):e17187 [免费全文] [CrossRef] [Medline
  5. Alvarez-Galvez J, Suarez-Lledo V, Rojas-Garcia a .疾病暴发期间信息传染病的决定因素:系统综述。前方公共卫生2021;9:603603 [免费全文] [CrossRef] [Medline
  6. Cavallo DN, Chou WS, McQueen A, Ramirez A, Riley WT.使用社交媒体的癌症预防和控制干预:用户生成的方法。癌症流行病学生物标志物2014 Sep;23(9):1953-1956 [免费全文] [CrossRef] [Medline
  7. Naslund JA, Grande SW, Aschbrenner KA, Elwyn G.通过社交媒体自然发生的同伴支持:严重精神疾病患者使用YouTube的经历。PLoS One 2014;9(10):e110171 [免费全文] [CrossRef] [Medline
  8. 芬克S,吉拉德E,沃特金斯C,詹森VAA。认识的传播及其对流行病爆发的影响。中国科学院学报(自然科学版)2009年4月21日;21 (16):6872-6877 [免费全文] [CrossRef] [Medline
  9. 互联网在消除传染病中的作用。管理对疫苗接种的认识和误解。德语文章。2013年9月24日;56(9):1279-1286。[CrossRef] [Medline
  10. 通过社交媒体和电子新闻媒体传播埃博拉病毒:一项横断面研究。卫生信息学杂志2016年9月26日;22(3):470-478 [免费全文] [CrossRef] [Medline
  11. Catalan-Matamoros D, Peñafiel-Saiz C.传统媒体如何传播疫苗:系统回顾。展望公共卫生2019 1月07日;139(1):34-43。[CrossRef] [Medline
  12. 互联网对健康的益处和风险。中华医学杂志2002 12月26日(6):495-510。[CrossRef] [Medline
  13. 郭志刚,张志刚,张志刚,张志刚,等。冠状病毒病毒式传播:量化推特上COVID-19错误信息的流行。治愈2020年3月13日;12(3):e7255 [免费全文] [CrossRef] [Medline
  14. Wilson SL, Wiysonge C.社交媒体与疫苗犹豫。BMJ Glob Health 2020 Oct;5(10):e004206 [免费全文] [CrossRef] [Medline
  15. 卫生组织流行病信息网。世界卫生组织2020年。URL:https://www.who.int/teams/epi-win[2020-03-09]访问
  16. Zarocostas J.如何对抗信息疫情。柳叶刀2020年2月29日;395(10225):676 [免费全文] [CrossRef] [Medline
  17. Cinelli M, Quattrociocchi W, Galeazzi A, Valensise CM, Brugnoli E, Schmidt AL,等。COVID-19社交媒体信息大流行。科学通报2020年10月06日;10(1):16598 [免费全文] [CrossRef] [Medline
  18. Caldarelli G, de Nicola R, del Vigna F, Petrocchi M, Saracco F.推特上机器人小队在政治宣传中的作用。公共物理2020年5月11日;3(81):1-15。[CrossRef
  19. 阿利姆J,费拉拉E.社交机器人会对公众健康构成威胁吗?美国公共卫生杂志2018年8月;108(8):1005-1006。[CrossRef] [Medline
  20. Bessi A, Ferrara E.社交机器人扭曲了2016年美国总统大选的在线讨论。2016年11月3日;21(11)第一个星期一。[CrossRef
  21. Betsch C, Brewer NT, Brocard P, Davies P, Gaissmaier W, Haase N,等。Web 2.0对疫苗接种决策的机遇和挑战。疫苗2012年5月28日;30(25):3727-3733。[CrossRef] [Medline
  22. 陈涛,陈涛,张志强,等。武器化的健康传播:推特机器人和俄罗斯喷子放大了疫苗的争论。美国医学杂志公共卫生2018年10月;108(10):1378-1384。[CrossRef] [Medline
  23. Shao C, Ciampaglia GL, Varol O, Yang K, Flammini A, Menczer F.社交机器人低可信度内容的传播。Nat Commun 2018年11月20日;9(1):4787 [免费全文] [CrossRef] [Medline
  24. 袁X,舒查德RJ,克鲁克斯AT。在推特上两极分化的在线疫苗接种辩论中研究新兴社区和社交机器人。Soc Media Soc 2019年9月04日;5(3):205630511986546。[CrossRef
  25. Himelein-Wachowiak M, Giorgi S, Devoto A, Rahman M, Ungar L, Schwartz H,等。机器人和虚假信息在社交媒体上传播:对COVID-19的影响。J Med Internet Res 2021年5月20日;23(5):e26933 [免费全文] [CrossRef] [Medline
  26. 张敏,齐旭,陈震,刘杰。社交机器人参与推特上的COVID-19疫苗讨论。国际环境与公共卫生杂志2022年1月31日;19(3):1651 [免费全文] [CrossRef] [Medline
  27. Gallotti R, Valle F, Castaldo N, Sacco P, De Domenico M.评估应对COVID-19流行病的“信息传染病”风险。Nat Hum Behav 2020 12月29日;4(12):1285-1293。[CrossRef] [Medline
  28. Sayyadiharikandeh M, Varol O, Yang K, Flammini A, Menczer F.基于专业分类器集合的新型社交机器人检测。2020年10月19日发表于:CIKM '20:第29届ACM信息与知识管理国际会议论文集;2020年10月19日至23日;虚拟事件爱尔兰第2725-2732页。[CrossRef
  29. Luceri L, Badawy A, Deb A, Ferrara E.红色机器人做得更好:社会机器人党派行为的比较分析。2019年5月13日发表于:WWW '19: 2019年万维网大会伴生论文集;2019年5月13日至17日;旧金山,加州,1007-1012页。[CrossRef
  30. Yang K, Varol O, Davis CA, Ferrara E, Flammini A, Menczer f用人工智能武装公众,对抗社交机器人。人类行为与新兴技术2019年2月06日;1(1):48-61。[CrossRef
  31. Varol O, Ferrara E, Davis C, Menczer F, Flammini A.在线人机交互:检测,估计和描述。2017.05.03发表于:第十一届网络与社交媒体国际AAAI会议论文集;2017年5月15-18日;加拿大魁北克省蒙特利尔p. 280-289网址:https://ojs.aaai.org/index.php/ICWSM/article/view/14871
  32. Botwiki。URL:https://botwiki.org/[2022-07-18]访问
  33. Rehurek R, Sojka P. Gensim——python框架的向量空间建模。2011年发表于:EuroScipy 2011;2011年8月25-28日;法国巴黎网址:https://www.fi.muni.cz/usr/sojka/posters/rehurek-sojka-scipy2011.pdf
  34. 雪莉·k·戴维斯:一种可视化和解释主题的方法。交互式语言学习、可视化和界面研讨会论文集巴尔的摩,马里兰州,美国:计算语言学协会;2014年6月发表于:交互式语言学习、可视化和界面研讨会论文集;2014年6月27日;马里兰州巴尔的摩,第63-70页。[CrossRef
  35. 李志强,李志强。健康科学研究中的定性描述方法。HERD 2016 july;9(4):16-25 [免费全文] [CrossRef] [Medline
  36. 张志刚,张志刚,张志刚。文本主题模型的可视化评估方法。纽约州纽约:计算机协会;2012年5月21日发表于:AVI '12:先进视觉界面国际工作会议论文集;2012年5月21-25日;意大利卡普里岛,74-77页。[CrossRef
  37. 情感分析与意见挖掘。人类语言技术综合讲座2012年5月23日;5(1):1-167。[CrossRef
  38. Hutto C, Gilbert E. VADER:一个简约的基于规则的社交媒体文本情感分析模型。2014年5月16日出席:第八届国际AAAI网络日志和社交媒体会议;2014年6月1日至4日;密歇根州安娜堡,216-225页网址:https://ojs.aaai.org/index.php/ICWSM/article/view/14550
  39. 基于自然语言工具箱和VADER情感分析器的推特情感分析。见:2019年《工程与计算机科学》课堂讲稿,发表于:2019年国际工程师和计算机科学家会议论文集;2019年3月13日至15日;中国香港,第12-16页。[CrossRef
  40. Pano T, Kashef R.对COVID-19时代比特币(BTC)推文进行了完整的基于vader的情绪分析。大数据认知计算2020年11月09日;4(4):33。[CrossRef
  41. Adarsh R, Patil A, Rayar S, Veena K.用于情感分析的VADER和LSTM的比较。国际最新技术工程2019年3月1日;7(6):540-543。
  42. 徐伟,Sasahara K.在COVID-19信息大流行期间,Twitter上机器人的角色特征。计算机科学进展(英文版);2011;26 (2):366 - 366 [J]免费全文] [CrossRef] [Medline
  43. J Uyheng, Carley KM。COVID-19大流行期间的机器人和在线仇恨:美国和菲律宾的案例研究计算机科学进展(英文版);2011;29 (3):344 - 344 [免费全文] [CrossRef] [Medline
  44. Pokharel基点。尼泊尔COVID-19疫情期间推特情绪分析。SSRN杂志2020年6月11日:1-26。[CrossRef
  45. Rosenberg H, Syed S, Rezaie S. Twitter大流行:在COVID-19大流行期间,Twitter在传播医疗信息和错误信息方面的关键作用。CJEM 2020 july 06;22(4):418-421 [免费全文] [CrossRef] [Medline
  46. 分析推特数据,评估人们对COVID-19时代公共卫生政策和事件的态度。国际环境与公共卫生杂志2021年6月10日;18(12):6272 [免费全文] [CrossRef] [Medline
  47. Stella M, Ferrara E, de Domenico M.机器人会增加在线社交系统中负面和煽动性内容的曝光率。中国科学院学报(自然科学版)2018年12月04日;免费全文] [CrossRef] [Medline
  48. Wang Y, Callan J, Zheng B.我们要用样品吗?分析从Twitter的流API采样的数据集。ACM Trans Web 2015 Jun 20;9(3):1-23。[CrossRef
  49. 马歇尔PD。交际与人格:交际的公共自我。中国生物医学工程学报2015;10(1):23-31。[CrossRef
  50. McCloud RF, Kohler RE, Viswanath K.癌症风险促进信息:年轻人的沟通环境。Am J Prev Med 2017 Sep;53(3S1):S63-S72 [免费全文] [CrossRef] [Medline


LDA:潜狄利克雷分配
维德:价感字典和情感推理器


编辑:M Gisondi, L Westafer;提交31.12.21;M Anderson, J Uyheng, I Skafle同行评审;对作者13.02.22的评论;修订版本04.05.22收到;接受24.05.22;发表25.08.22

版权

©Victor Suarez-Lledo, Javier Alvarez-Galvez。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年8月25日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map