JMIR J医学网络杂志 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v24i6e37623 35671411 10.2196/37623 原始论文 原始论文 了解COVID-19错误信息如何以及由谁在社交媒体上传播:编码和网络分析 Gisondi 迈克尔 戈特利布 迈克尔 Ceron 威尔逊 Chalghaf Nasr 北京日报 博士学位 1 2 https://orcid.org/0000-0002-8412-2878 Sicheng 英航 1 https://orcid.org/0000-0003-3900-1169 王ydF4y2Ba 羌族 英航 1 https://orcid.org/0000-0003-0826-8821 天一 英航 1 https://orcid.org/0000-0002-3704-1645 英航 1 https://orcid.org/0000-0002-3081-6727 博士学位 1 2 https://orcid.org/0000-0002-0131-0823 Sanhong 博士学位 1
信息管理学院 南京大学 贤林路163号 栖霞区 南京,210023年 中国 86 2589685996 sanhong@nju.edu.cn
2 https://orcid.org/0000-0002-6910-3935
信息管理学院 南京大学 南京 中国 江苏省数据工程与知识服务重点实验室 南京大学 南京 中国 通讯作者:邓三红 sanhong@nju.edu.cn 6 2022 20. 6 2022 24 6 e37623 28 2 2022 19 4 2022 10 5 2022 7 6 2022 ©赵月华,朱思成,万强,李天一,邹春,王浩,邓三红。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年6月20日。 2022

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。

背景

在2019冠状病毒病(COVID-19)大流行等全球卫生危机期间,社交媒体上的错误信息迅速传播。人们分析了与COVID-19相关的错误信息,但很少关注开发一个全面的分析框架来研究其在社交媒体上的传播。

客观的

我们提出了一个基于阐述似然模型的理论模型来理解社交媒体上与covid -19相关的虚假信息的说服过程。

方法

该模型融合了中心路径特征(内容特征)和外围特征(创作者权威、社会证明和情感)。中央层面的新冠肺炎相关错误信息功能包括五个主题:医疗信息、社会问题和民生、政府应对、疫情传播和国际问题。首先,我们基于事实核查来源创建了一个与COVID-19大流行相关的错误信息数据集,以及现实社会媒体上包含这种错误信息的帖子的数据集。基于收集到的帖子,我们分析了传播模式。

结果

我们的数据集包括11,450个错误信息帖子,其中医疗错误信息是最大的类别(n=5359, 46.80%)。此外,研究结果显示,活跃用户中最不活跃的(4660/11,301,41.24%)和最活跃的(2320/11,301,20.53%)都有分享错误信息的倾向。此外,与国际话题相关的帖子最有可能在社交媒体上产生深刻和持久的影响,它们的分布深度(最大深度=14)和宽度(最大宽度=2355)最高。97.00%(2364/2437)的传播具有辐射传播特征。

结论

我们提出的模型和发现可以通过检测可疑用户和识别传播特征来帮助对抗错误信息的传播。

健康的错误信息 新型冠状病毒肺炎 社交媒体 错误的信息传播 infodemiology 全球健康危机 错误信息 理论模型 医疗信息 疫情 流感大流行
简介 背景

早在2020年2月15日,世界卫生组织总干事在慕尼黑安全会议上就表示:“我们不仅仅是在抗击一场流行病;同时也是一场信息大流行”[ 1].由于在大流行期间实行检疫限制,信息的获取仅限于互联网和社交媒体,这助长了错误信息的传播。根据一项调查,87%的互联网用户接触到与大流行病有关的错误信息[ 2].

社交媒体上错误信息的传播可能会被个人定制内容的信息竖井和回音室放大。库齐等人[ 3.]报告称,他们检查的673条推文中有153条(24.8%)包含COVID-19大流行错误信息,673条推文中有107条(17.4%)包含无法核实的信息。源自社交媒体账户的关于病毒起源的错误信息已吸引了超过2000万次点击[ 4].

理论背景

在社交媒体上,虚假信息可以定义为旨在说服其他用户的信息。说服理论认为传播者、信息内容和接收者都对沟通有影响。除了研究帖子本身,也有必要检查在社交媒体上传播错误信息的用户。为了揭示虚假信息传播者的特征,我们依靠说服理论来帮助理解虚假信息是如何在社交媒体上传播的。细化似然模型(ELM)是一种广泛使用的说服模型,根据该模型,用户通过中心路径或外围路径形成对信息的态度[ 5].在中心路径中,用户对信息的质量和强度进行评估,而在外围路径中,他们更关注信息来源的声誉、视觉吸引力和呈现方式等表面因素[ 6].因此,网络健康虚假信息的特征可分为中心和外围两个层次[ 7].在不同国家的背景下,已经记录了网络冠状病毒错误信息的中央层面特征[ 8 9错误信息在全球迅速传播。然而,人们对与covid -19相关的错误信息的外围特征知之甚少。因此,本研究的第一个研究问题是:与COVID-19相关的传播错误信息的中心和外围层面特征是什么?为了回答这个问题,我们基于ELM提出了一个社交媒体上与covid -19相关的虚假信息说服过程的理论模型。所示 图1,强调中心路线特征(内容类型)和外围特征(包括创作者的权威、社会证明和情感)。

误导性信息的传播导致公众的不确定性增加,对值得信赖的消息来源缺乏信任,从而导致病毒传播加剧,遏制无效[ 4].迄今为止,研究主要关注与冠状病毒疾病相关的错误信息的程度[ 3.].相比之下,人们缺乏对与covid -19相关的错误信息的病毒性的全面理解,特别是在社交媒体背景下。因此,指导本研究的第二个研究问题如下:与covid -19相关的错误信息如何在社交媒体上传播?为了回答这个问题,我们从多个角度衡量了社交媒体上与covid -19相关的错误信息的病毒性,包括转发数量、转发深度、转发宽度和转发速度。

新冠肺炎相关虚假信息在社交媒体上传播的理论模型。

相关工作 说服理论与错误信息

说服可以被定义为"通过改变他人的信仰、价值观或态度来影响他人的人际沟通" [ 10].ELM认为说服主要是一种认知事件,这意味着说服性信息的接收者使用动机和推理(或缺乏推理)的心理过程来接受或拒绝信息[ 5].

在外围路线中,信息依赖于接收方的情感参与,接收方被更肤浅的手段说服。Cialdini [ 11 12发现了7种常用的暗示使用外围信息的信号:权威、承诺、对比、喜欢、互惠、稀缺和社会证明。权威作为一种外围线索,可以用来说服听众接受所呈现的信念或行为。之前的心理学研究表明,参与者倾向于相信来自他们认为可信的人的信息。 13].从社交媒体的角度来看,用户的关注者和关注者(朋友)的数量可能代表了他们的社会资本[ 14],这可能表明他们的权威。拥有众多粉丝的用户(如意见领袖)发布的帖子被认为是值得信赖的[ 15].此外,Suh等[ 16]发现社交媒体用户的关注者数量/关注者数量正向影响其帖子的转发概率。

社会证明的外围证据是基于古老的同辈压力概念[ 11 12].经验证据表明,社交媒体平台提供的参与度指标,如点赞数和发帖数,也会增加人们对社交媒体内容的信任,尤其是在虚假信息的情况下[ 17].最后,外围路径不是专注于事实,而是依赖于与积极属性的关联,如积极情绪[ 18].

在社交媒体上传播虚假信息

博德和弗拉加[ 19]将错误信息定义为“没有证据支持的事实错误信息”。周等[ 20.的研究表明,带有情绪性和比较性词汇的错误信息比正确信息更容易传播。

此外,研究人员研究了基于用户的特征,以进一步了解在社交媒体上发布或传播虚假信息的个人类型[ 21].验证状态通常被分配给公众号和公众人物,用来告知人们该账号的真实性,通常被用来衡量社交媒体内容的可信度[ 22].由于危机被定义为情绪状况,情绪在与公共卫生突发事件相关的错误信息研究中的作用需要进一步研究[ 23].

现有的关于错误信息传播特性的研究主要集中在时间因素上[ 24 25而不是传播结构[ 26].为了捕捉虚假信息在社交媒体上传播的高阶传播模式,Ma等人[ 26]在Twitter上构建了一个错误信息传播网络,并发现错误信息通常首先由一个低调的用户发布,然后由一些受欢迎的用户帮助传播,而真正的信息首先由一个知名用户发布,然后直接由许多普通用户分享。

covid -19相关错误信息的特征

表1总结了此前对社交媒体上与covid -19相关的错误信息的研究。宋等人[ 9]通过分析事实核查帖子,研究了在韩国COVID-19大流行期间传播的错误信息的类型。Ceron等人[ 8]从巴西事实核查项目的两个Twitter账户收集数据,并在大流行期间提出了被驳斥的主题。陈、唐[ 27]报告称,突发公共卫生事件中的虚假信息传播具有明显的地方性和高再现性特征。

除了基于内容的特征外,研究表明,与经过验证的账户相比,未经验证的账户的推文包含更多的错误信息(未经验证的账户占31%,经过验证的账户占12.6%; P<措施)( 3.].拥有更多粉丝的推特账户发布虚假信息的推文更少(20.1%, P<措施)。Cinelli等人[ 28]发现,尽管可疑来源的帖子数量占可信来源的帖子数量的70%,但对可疑来源的帖子的回应量是对可信来源的回应量的3倍。

总之,我们在本研究中解决了现有文献中的两个潜在空白。以往的研究从多个角度研究了关于COVID-19大流行的错误信息的特征[ 3. 8 9 27 29].心理学研究已经证明了新闻来源可信度对说服的影响[ 13],特别是在错误信息的情况下[ 30.].然而,关于这方面的实证研究还很有限与COVID-19大流行相关的错误信息(即发布错误信息的用户)以及社交媒体平台上的错误信息传播模式。此外,在ELM的基础上,我们提出了虚假信息传播的外围层面特征包括创作者的权威、情感和社会证明,并在此基础上研究了社交媒体上与COVID-19相关的虚假信息的特征。据我们所知,没有一项研究考虑到与covid -19相关的错误信息的所有上述特征。

此前对社交媒体上与covid -19相关的错误信息的研究。

研究 标题 方法 数据
宋等人[ 9 韩国政府应对新冠肺炎错误信息的对策:分析疾病管理本部网站的“事实和问题核查” 内容分析 90个帖子 韩国疾病管理本部网站
库齐等人[ 3. 冠状病毒传播:量化推特上covid - 19错误信息的流行 统计分析 673条 推特
Ceron等人[ 8 新冠肺炎时代的假新闻议程:通过事实核查内容识别趋势 主题分析 5115条 推特
秦( 29 突发公共卫生事件中健康谣言的特征分析——以新冠肺炎期间的“双黄连”事件为例 案例分析 134年的标题 丁香园公布的新冠肺炎谣言列表
陈、唐[ 27 突发公共事件中微博谣言传播特征分析——以新冠肺炎疫情为例 编码和可视化分析 968个帖子 微博谣言反驳
方法 过程

首先,我们基于事实核查来源创建了一个与COVID-19大流行相关的错误信息数据集,然后创建了另一个包含来自现实世界社交媒体平台的这种错误信息的流传帖子的数据集。基于收集到的帖子,我们进一步分析了新冠病毒虚假信息在社交媒体上的传播模式,并提出了外围层面的特征。详细的数据收集和分析程序描述在 图2

数据收集和数据分析过程。

数据收集 错误的定义

对公众来说,准确识别未知的错误信息是困难的,因为这需要多学科的专业知识。可以通过处理权威的不确认信息来实现对错误信息的可靠访问。例如,从反驳信息“吸烟可以预防冠状病毒感染。”这是错误的,“我们可以提取“吸烟可以预防冠状病毒感染”的错误信息。

获取与COVID-19大流行有关的错误信息

作为权威的虚假信息来源,我们选择了三个权威的网络平台:中国互联网辟谣联合平台[ 31(由中央网络安全和信息化委员会办公室运营),腾讯事实核查平台[ 32](由大型互联网综合服务提供商运营)、微博报告处理大厅[ 33(由大型公共社交媒体平台运营)。我们开发了一个网络爬虫,自动收集2019年12月1日至2020年12月1日期间各平台发布的关键词为“新型冠状病毒(新冠病毒)/COVID/Epidemic(疫情)”的辟谣信息。在人工清理不相关和重复信息后,我们获得了1065个与COVID-19大流行相关的错误信息帖子。

收集含有与COVID-19大流行相关的虚假信息的帖子

为了收集包含新冠肺炎大流行相关错误信息的传播帖子,我们从收集到的所有错误信息中提取关键词,然后创建相应的查询,在微博.cn网站上进行高级搜索。考虑到错误信息可能会被延迟和长期传播,查询搜索仅限于2019年12月1日至2021年2月2日之间的原始帖子。

为确保收集的职位准确无误,第一轮的收集工作采用半自动收集工具进行手动查询。如果检索到的有效帖子超过50个,则使用自动web爬虫执行第二轮收集,然后进行数据清理。经过两轮收集,将含有虚假信息的微博帖子与相应的虚假信息进行匹配,最终识别出11450条微博。

编码过程

以往研究综述[ 34- 36]关于社交媒体上与大流行相关的虚假信息分类的资料,见 多媒体附录1.受之前研究的启发,为了描述COVID-19错误信息的内容,我们根据Richards和Hemphill提出的6个步骤手动编码了1065个错误信息帖子[ 37]:(1)初步的组织和规划,(2)开放和轴向编码,(3)初步码本的开发,(4)码本的试点测试,(5)最终编码过程,(6)码本的评审和主题的确定。

本研究开发的编码方案见 表2.将新冠肺炎相关错误信息分为政府应对(中国相关)、疫情传播(中国相关)、医疗信息(中国相关)、社会问题和民生问题(中国相关)、国际问题等5种内容。Krippendorff(后 38方法,招募了4名编码员进行两轮手工标记。在第一轮试验中,对300个错误信息条目进行了标记。经过进一步的讨论,剩余的765个错误信息项在第二轮由4个编码员独立标记,α值为.78。这意味着四个编码员在主题分配上取得了实质性的一致[ 39].在编码过程中,对于涉及两个或两个以上主题的错误信息项目,四名编码人员都进行了讨论,并将项目归入最相关的类别。随后,11,450个帖子根据相应错误信息的标签进行了标记。

与COVID-19大流行相关的错误信息主题。

主题 插图 例子
政府响应(服务) 交通管控、复工复学、停工停课、疫情防控等相关信息 据悉,武汉今天喷洒完消毒液粉后,发热患者将被送往指定医院。
疫情传播情况(与中国有关) 与大流行病传播有关的信息 广汉家的女婿从武汉回来住了几天。这家人隐瞒了工作地址,每天都去打牌。他今天病了。邻居们非常生气,去砸了他的房子。
医疗信息(服务) 有关病毒本身、感染、预防、治疗、消毒等医疗信息 一位医生朋友寄来的。为了应对这种新型冠状病毒,可以使用维生素C(对抗病毒)和紫锥菊(增强免疫力)的含量来预防它。
社会问题与民生(与中国有关) 名人、捐赠援助、社会方面、民生方面的信息 国家层面的反应!所有出租的房屋、公寓、商店和工厂将在2月份免租一个月,在3月和4月免租半个月!希望所有的“房东”都能积极回应!一起克服困难
国际问题 有关其他国家回应的信息,网上政治谣言 日本向武汉派出了1000人的医疗队,没有戴口罩,也没有喊口号。
岗位特征提取

我们使用微博ID通过weibo.cn/repost/网站获取了每条微博的具体转发、点赞和评论信息。根据转发关系,我们创建了收集到的帖子的转发网络。继Avram等人之后[ 17,我们使用了参与度指标,包括每个帖子的点赞数、评论数和转发数,来代表包含错误信息的帖子的社会证明特征(总结在 表3).

包含与covid -19相关的虚假信息的帖子及其用户的特征。

类别 描述 数据类型
社会认同功能
转发 转发的频率 整数
评论 频率的评论 整数
喜欢 喜欢的频率 整数
概要文件特性
验证状态 验证或不 验证/不验证
验证类型 验证类型 类别
Mrank 微博会员级别 整数(鹿)
Urank 用户级 整数(0-48)
互动功能
Posts_count 数量的帖子 整数
Followers_count 数量的追随者 整数
Following_count 数量的追随者 整数
用户特征提取

除了因为被屏蔽等原因而无法捕获的用户外,在微博上共收集了11301名发布了关于COVID-19的错误信息的用户。

微博的用户认证机制为不同类型的用户提供了一个证明身份的渠道。验证类型包括个人用户、政府用户、媒体用户和企业用户。用户水平作为微博用户的基本特征,在很大程度上可以代表账号的活跃程度。用户级别越高,用户越活跃。会员级别反映了用户使用微博的习惯。会员级别高的用户可以被认为是忠实用户。

除了个人资料的特征之外,互动特征(即关注者、关注者和帖子的数量)也可以表征用户在社交媒体上的权威。帖子的数量反映了用户在社交媒体平台上的参与度。拥有相当数量粉丝的用户可以与一大群人分享自己的观点[ 16],而拥有众多关注者的用户则拥有广泛的信息源[ 14].因此,个人资料功能和交互功能都表征了发布了包含错误信息的帖子的用户的权威。这些特性的详细描述可以在 表3

情绪分析

情绪特征被认为是区分网络谣言和虚假评论的有效特征[ 40].在本研究中,我们通过对百度Senta系统上收集的数据集应用预训练卷积神经网络模型来进行情感分析[ 41].Senta将情绪知识整合到预先训练的模型中,并对大多数测试数据集产生最新的结果[ 42].Senta作为一个开放的情感分析平台,可以接触到来自多个环境的大量语料库,这大大提高了其分析的有效性[ 42 43].Senta采用无监督方法自动挖掘情感知识,在14个典型的中文情感分析任务中全面超越其他方法[ 41].每一个输入到Senta的帖子返回一个0到1之间的积极情绪可能性的结果,可以作为帖子的情绪特征。

传播网络建设

为了描述社交媒体上与冠状病毒相关的错误信息的流行程度,除了每个帖子的转发数量外,我们还爬取了研究上一步创建的数据集中每个帖子的详细转发信息,并收集了原始错误信息帖子的转发列表。每个帖子的转发信息包括转发原帖子的用户、转发内容、转发收到的转发数和点赞数。微博平台使用“//”符号将转发的内容划分为不同的转发级别。因此,可以根据转发内容提取每篇文章的转发级别。此外,每个帖子的传播网络可以根据相应的转发关系,通过一系列的转发来构建。因此,除了因为例如被屏蔽或删除而无法捕获的帖子外,我们为包含关于COVID-19信息的共2437个帖子构建了一个传播网络。在这些网络中,每个节点代表一个单独的帖子,而有向链接代表从源节点到转发节点的转发关系。例如,如果post A转发原始post B,则从节点B到A绘制一条边。

提取传播规模、深度、宽度和速度

在构建的传播网络中,每个节点代表一个参与了与COVID-19相关的错误信息传播的帖子。基于每个原帖的网络,传播规模是指网络中节点的数量,对应于原帖的转发数量。传播深度是指原帖在网络中转发量最高的级别,而传播宽度等于网络中节点数最多的级别的节点数。

图3显示了一个职位的传播网络的例子。节点A表示包含与covid -19相关的错误信息的原始帖子。帖子B1、B2和B3转发原来的帖子。随后,B1岗位由岗位C1、C2和C3转发,B3岗位由岗位C4转发;post C3也由D1转发。在这种情况下,原帖子A已经被转发了8次,因此传播尺度为8。第二级转发涉及大部分帖子,这意味着原帖子A的传播宽度等于4。转发的最高级别表示传播深度为3。

说明一个样本帖子的传播规模、深度、宽度和速度。每个节点代表一个参与传播与COVID-19有关的错误信息的帖子。

道德的考虑

由于本研究基于公开数据,不涉及个人身份数据,因此不需要伦理批准。

结果 邮政中心路线特征

为了回答第一个研究问题,我们进行了编码分析,以确定包含与covid -19相关的错误信息的帖子的内容类型/主题。共有11 450个此类帖子被归类为5个主题:政府应对(n=1021)、流行病传播(n=639)、医疗信息(n=5359)、社会问题和人民生计(n=4132)和国际问题(n=299)。最常见的主题是医疗错误信息(5359/11,450,46.80%),包括关于病毒、感染、预防、治疗和消毒的错误信息。第二受欢迎的话题是社会问题和民生问题(4132/ 11450,36.09%),尤其是与名人虚假言论有关的话题。这一类别还包括提到被驳斥的捐款的帖子。

为了区分不同主题的帖子,在图中标出了帖子的数量和相应的日期 图4其中较暖的颜色代表在特定时期内更受欢迎的错误信息话题。社会和生计方面的虚假信息在3月中旬最为突出,当时出现了几个广泛传播的虚假信息话题,包括关于一名马来西亚萨满可以施法治愈冠状病毒的言论。2月至5月是中国新冠肺炎疫情最严重的时期,虚假医疗信息的帖子出现频率最高。

包含错误信息的帖子数量随时间的变化。

邮政外围路线特征 概述

为了回答第一个研究问题,我们还考察了收集到的帖子的社会证明特征、帖子的情感特征和发布帖子的用户的权威特征。

职位的社会证明功能

收集到的与新冠肺炎相关的错误信息帖子平均收到11个转发、13个评论和189个赞。的饼状图 图5表示不同主题包含错误信息的帖子的数量,柱状和直线表示每个主题的帖子收到的点赞、评论和转发的标准差(在左y轴上)和平均值(在右y轴上)。就错误信息主题而言,获得最多赞(平均713个)、评论(平均67个)和转发(平均82个)的帖子包含有关国际问题的错误信息,而关于医疗信息的帖子获得的关注最少,平均有40个点赞、7个评论和5个转发(见 图5).在所有5个主题中,包含国际问题错误信息的帖子仅占所有帖子的2.61%(299/ 11450),但获得了更高的关注度。这可能表明,涉及国际问题的错误信息,虽然频率较低,但在所有三种类型的社会证明特征中传播得更广,表明这类错误信息的潜在严重后果。

与各种虚假信息主题相关的帖子的社会证明功能。

帖子的情感特征

考虑到错误信息的话题, 图6描述了新冠病毒相关错误信息帖子生成的情绪强度值均值的方差。颜色越暖,情绪越积极,反之,颜色越冷,情绪越消极。随着时间的推移,这些帖子的平均情绪值保持中性到正面。一些包含关于未经证实的预防措施和治疗的错误信息的帖子似乎是相对积极的。例如,“在家里洗个热水澡是保护易感人群最简单、最有效、最便宜的方法!传达了极其乐观的情绪。与大流行期间公众普遍的负面情绪形成鲜明对比的是[ 44],含有错误信息的帖子倾向于表达积极情绪,以吸引公众注意。

与其他主题相反,传播与流行病传播有关的错误信息的帖子往往始终是负面的。特别是,有关解除封锁和交通限制的错误信息表达了非常负面的情绪,如“哈尔滨关闭了!”紧急关闭。没有任何旅行的机会。”

与各种虚假信息主题相关的帖子的情感特征。

用户权限特征

在发布与新冠肺炎相关的虚假信息的用户中,认证用户占46.60%(5266/ 11301)。其中,认证个人用户是最主要的信息源(2475/5266,47.00%),其次是媒体用户(1159/5266,22.01%)和政府账号(1013/5266,19.24%)。未验证用户数仅比验证用户数多6.8%,占消息总数的53.40%(6035/11,301)。这表明,在检测错误信息时,是否由认证帐户发布不能作为确定信息权威的标准。

我们发现在不同主题上发布虚假信息的用户的权威特征有明显的差异。就国际问题而言,医疗信息认证用户(160/292,54.8%)的数量超过了未认证用户(132/292,45.2%),而认证用户(3160/5310,59.51%)的数量也超过了未认证用户。相比之下,关于社会问题和民生的虚假信息由非认证用户发布的比例(2586/4093,63.18%)高于认证用户(1507/4093,36.82%),关于疫情传播的虚假信息由非认证用户发布的比例(409/630,64.9%)。

在不同主题上发布错误信息的用户级和会员级分布显示在上面 图7.从用户级别和会员级别来看,级别最低的用户(用户级别为0-13,会员级别为0)发布错误信息的责任最大,分别占41.24%(4660/11,301)和46.77%(5285/11,301)。令人惊讶的是,第二负责任的用户群体是那些拥有最高用户(在42-48;2320/11,301, 20.53%)和会员(范围在6-7;2680/11,301 23.71%)的水平。这可能表明错误信息是由最不活跃和最不活跃的用户发布的。对于国际错误信息和医疗错误信息,用户级别最高的用户(在42-48范围内)占比最多(1516/5602,27.06%),而其他三个主题的错误信息往往由用户级别较低的用户(在0-13范围内;2758/5699, 48.39%)。

下半部分 图7显示在不同主题上发布包含错误信息的消息的用户的平均交互特征。虚假信息发布者的粉丝数量平均超过10万,显示出他们在社交媒体上拥有巨大的社会资本。

相比之下,发布有关国际问题和医疗信息的错误信息的用户比发布有关政府应对、社会问题和人民生活、疫情传播的错误信息的用户具有更高的权威。发帖数、关注者数和发布与政府响应相关的错误信息的用户关注数是五个主题中最低的,代表权限较低的用户。

用户级和会员级分布以及用户发布关于各种主题的错误信息的平均交互特征。

邮政的分发模式

基于构建的2437个包含与covid -19相关的虚假信息的帖子的传播网络,我们提取了每个帖子的传播规模、深度、最大宽度、平均宽度和速度。在本研究中,最大宽度测量最宽层所涉及的节点数量,平均宽度测量所有层的平均数量。 表4汇总所有员额的传播方式的描述性统计数字。在我们的数据集中,传播最广的帖子由传播网络中的7604名用户组成。传播最深的帖子被14个级别的用户转发,而传播最广的帖子被2355个级别的用户转发。平均来看,所有帖子的传播尺度为19.7,平均深度为1.5,平均最大宽度为20.5。

传播模式的描述性统计。

传播的措施 意思是(SD) 最大
规模 19.7 (236.03) 7604
深度 1.5 (0.99) 14
最大宽度 20.5 (87.82) 2355
平均宽度 15.9 (23.74) 688
速度 2.4 (8.20) 96.9

图8显示了与每个主题相关的帖子的传播规模、深度、最大宽度、平均宽度和速度的手段的95% CI图。含有与社会问题和人民生活有关的虚假信息的帖子显然比关于其他主题的帖子吸引了更多的用户参与传播网络。与其他主题相比,与政府响应相关(平均传播尺度28.2)和与社会问题和民生相关(平均传播尺度27.4)的错误信息吸引了更多的用户参与到讨论和传播中。从传播深度、最大宽度和平均宽度来看,国际问题帖子在各个传播层次的受众都更多,传播也更深入。与其他话题不同的是,大多数国际虚假信息帖子都吸引了一定程度的公众关注(转发率为168/ 299,56.2%),这表明这种类型的虚假信息更有可能受到广泛、大规模和激烈的主流讨论。

根据结构,我们将虚假信息发帖的传播网络划分为三种主要类型:(1)辐射型传播网络,第一级传播比其他各级传播都要广;(2)扇区传播网络,传播网络中其他层次的宽度大于第一级,转发量最高的节点获得的转发量大于点赞量;(3)病毒式传播网络,传播网络中其他级别的宽度都大于第一级,点赞量最高的节点获得的点赞量比转发量多。 图9展示了所有三种网络的代表性例子。

对岗位的审查发现,97.00%(2364/2437)是通过辐射传播网络传播的,只有0.98%(24/2437)属于部门传播网络,2.01%(49/2437)属于病毒传播网络。所示 图9A,从原始节点辐射出的第一级转发宽度远远大于后续层的转发宽度,这体现在根节点周围的节点密度远远高于其他层上的节点。在这种类型的传播网络中,创建原始帖子的用户通常拥有更高的权威(例如,大量的关注者);这类用户包括公共组织和新闻媒体。此外,这些帖子的内容很可能带有政治色彩。节点密度随着级别的增加有降低的趋势,说明在一级转发后,这些帖子的潜在影响下降。对于所示的传播网络 图9B和c,虽然第一层的宽度比较大,但其他层的节点都是扇形的,节点从多个子层节点中辐射出来。在属于行业的帖子和病毒式传播网络的传播中,存在多个具有高度传播能力的节点。与辐射传播网络中出现的帖子相比,一些意见领袖在版块和病毒传播网络中也起到了传播作用,他们拥有大量的关注者,没有被验证为权威机构或公共组织。

传播模式的置信区间图。

每种传播网络类型的示例。(a)辐射传播网。(b)部门传播网。(c)病毒传播网络。

虚假信息传播者的聚类分析

为了进一步描述在社交媒体上发布关于冠状病毒的错误信息的用户,我们利用k-means聚类算法基于用户权限特征(包括用户级别、成员级别、发帖数、关注数和关注数)对用户进行分类。为保证聚类质量,利用R中的Nbclust函数检验k的不同值,基于肘法,选择5作为最优聚类数量。 图10以散点图矩阵的形式显示用户,使用GGally R包中的ggpairs函数[ 45].每个点都用k-means聚类算法识别的聚类进行着色。

根据k-means聚类算法,将发布虚假信息的用户分为5组:普通用户、平台用户、不活跃用户、有影响力用户和混混用户。共有2342名用户被归类为普通用户,他们参与社交媒体,但不太愿意为会员付费。他们的会员水平往往较低,但用户水平较高,在帖子数和关注者数方面的表现相对正常。平台用户(包括2980名用户)的行为模式与普通用户相似,但不同的是其成员级别。他们的会员级别往往明显更高,这表明他们都积极参与社会互动,并购买会员以享受特权。最大的一组是不活跃用户,共有5652名用户在所有五个功能上出现的频率较低。相比之下,影响力用户,最小的用户群体(由101个用户组成),发布的频率比其他人更高,也收获了大量的关注者。这一组的用户倾向于保持在用户和成员级别的最高位置。最后,混入组的用户拥有比其他用户组更多的关注者,但他们发布的帖子更少。混入组226名用户的特征与Kozinets识别的特征一致[ 46,他们在社交媒体上保持着强大的社交关系,但对活动不感兴趣。

不同类型的用户在不同主题上发布错误信息的分布如图所示 图11.不活跃用户更倾向于发布关于社会问题和民生的错误信息,这与其他四种用户类型有显著差异。有影响力的用户对医疗错误信息传播的贡献最大,但不太可能发布与社会问题和民生相关的错误信息。

用户权限特征的散点图和相关矩阵。a:相关性在0.001的显著性水平上显著(双面);b:相关性显著,显著性水平为0.01(双侧);c:相关性显著,显著性水平为。05(双侧)。

各类用户发布与不同主题相关的虚假信息的分布情况。

拓扑属性与用户权限特征的关联关系

我们还进行了相关分析,以检验传播网络特征是否与创建帖子的用户的权威特征显著相关。用斯皮尔曼等级相关系数来衡量创作者的权威特征与由此产生的传播网络特征之间的相关性。 表5显示在双面检验条件下,追随者数量和成员级别与传播网络的所有五个特征(即传播规模、深度、平均宽度、最大宽度和速度)均显著相关( P< . 01)。

从网络的角度来看,拥有众多粉丝的用户发布的消息往往在社交媒体上获得更多关注。会员级别高的用户更有可能参与社交媒体互动。类似与灾害有关的资料[ 14研究发现,关注者数量对帖子的传播规模、深度和速度有显著的正向影响。这表明,来自高权限级别用户的错误信息在广泛广播中具有很高的强度,从而可能产生严重的后果。

斯皮尔曼相关( ρ)拓扑属性与用户权限特征之间的分析。

传播变量 文章数 粉丝数 后数 会员级别 用户级
规模
ρ 0.114 0.344 0.009 0.171 0.107
P价值 <措施 <措施 .77点 <措施 措施
最大宽度
ρ 0.103 0.349 0.008 0.17 0.1
P价值 .002 <措施 .80 <措施 .002
平均宽度
ρ 0.081 0.345 -0.007 .171 0.096
P价值 . 01 <措施 <措施 .003
深度
ρ 0.174 0.197 0.106 0.08 0.118
P价值 <措施 <措施 措施 02 <措施
速度
ρ 0.023 0.174 -0.003 0.105 0.047
P价值 .48 <措施 公布 措施 16
讨论 主要研究结果

理解人们为什么会相信错误信息的潜在心理是制定有效干预措施的关键。 30.].这项对包含与covid -19相关的错误信息的帖子的研究,揭示了其在社交媒体上传播的重要洞见。为分析中心层面特征,将新冠肺炎相关错误信息内容分为5类:医疗信息(5359/ 11450,46.80%)、人民社会和民生信息(4132/ 11450,36.09%)、政府应对(1021/ 11450,8.92%)、疫情传播(639/ 11450,5.58%)、国际问题(299/ 11450,2.61%)。内容的分类与先前对近期流行病的研究一致[ 34].与之前关于COVID-19的研究一致,在这些研究中,大多数错误信息与医疗相关[ 1 3.],我们发现错误信息的主要主题与医疗信息以及社会和生计问题有关。特别是,带有医疗错误信息的帖子在大流行最严重的阶段出现得最频繁。

引起注意的错误信息可以引发激烈的讨论,从而促进信息的传播。除了中央级别的特征外,关于与covid -19相关的错误信息的帖子的社交证据显示,这种错误信息得到了积极的回应(平均11个转发、13个评论和189个点赞)。有趣的是,与国际问题相关的错误信息占所有帖子的2.61%(299/ 11450),但获得了惊人的高关注度(平均82个转发、67个评论和713个赞),这表明涉及国际问题的错误信息往往会在社交媒体上传播开来,从而可能产生严重的后果。这与推特上的经验发现一致,与covid -19相关的阴谋性错误信息最有可能在推特上传播[ 47].

与大流行期间公众出现的负面情绪相比[ 48],在大流行期间出现的错误信息帖子中,情绪由积极转为中性。特别是,一些关于未经检验的预防措施和治疗的错误信息似乎非常积极,引起了公众的注意。我们的研究结果支持以下观点:在设计大流行期间的错误信息干预措施时,应考虑错误信息主题[ 47].

对用户配置文件特征的分析显示,用户级别和成员级别最低和最高的用户对发布错误信息的责任最大。我们的研究结果表明,最不活跃和最活跃的用户都倾向于分享错误信息。与Kouzy等人的实证结果相反[ 3.在美国,未经认证的Twitter账户发布的错误信息明显多于经过认证的账户,经过认证的微博用户在包含与covid -19相关的错误信息的所有消息中占了近一半(5266/11,301,46.60%)。这说明用户验证状态不适用于微博冠状病毒相关错误信息检测。

虚假信息发布者的平均关注人数非常高(>10万),表明他们在社交媒体上拥有的可信度和社会影响力。一些以营销为导向的账号为了吸引用户,改变了真实新闻的主体内容。至于医疗方面的虚假信息,一些企业账号捏造了虚假信息(如“纳豆能灭活病毒”)来宣传他们的产品。

虚假信息帖子的平均传播尺度为19.7,平均深度为1.5,平均最大宽度为20.5。李等[ 14]的数据显示,灾害相关帖子的平均传播规模和深度分别为68.64和1.113。这表明,与疫情相关的虚假信息比灾害相关的帖子传播得更深,但传播规模低于灾害相关的帖子。此外,关于国际问题的帖子最可能在社交媒体上产生深远和持久的影响,在传播深度、最大宽度和平均宽度方面数量最高。这突显了应对与covid -19有关的错误信息的重要性,特别是与国际问题有关的错误信息。

在捕捉传播网络的拓扑属性时,可以在错误信息帖子的传播中区分三种主要类型的网络:辐射型、扇形和病毒式。与Twitter上的谣言传播不同,在Twitter上,新闻通常首先由一个影响较小的用户发布,然后由一些受欢迎的用户分享。 26],微博上的新冠肺炎错误信息大多以辐射传播网络为代表,这些信息首先由一个知名用户发布,然后由许多普通用户直接分享。此外,原始用户往往拥有更高的权威(公共组织和新闻媒体),这表明有影响力的用户在传播COVID-19错误信息方面发挥了关键作用;这与Wang等人的研究结果一致[ 47),他们发现唐纳德·特朗普的推文可能会影响人们的信息分享行为。

限制

这项研究有几个局限性。首先,我们只调查了微博上流传的关于新冠肺炎的错误信息。此外,我们还选择了“新型冠状病毒(新冠病毒)/COVID/Epidemic(疫情)”作为与COVID-19相关的关键词。然而,由于疾病术语在早期可能存在不一致,用户可能使用了本研究没有收集到的其他关键词,如武汉肺炎(武汉肺炎)和不明原因肺炎(未知原因肺炎),来描述与covid -19相关的对话或话题。因此,我们研究中确定的特征可能并不代表所有与covid -19相关的错误信息。未来的研究应该考虑其他社交媒体平台上的错误信息,以确定这些发现的稳定性。第二,我们关注中文的错误信息。其他语言关于大流行病的错误信息可能导致不同的结果,这也应在今后的工作中加以探讨。

结论

在2019冠状病毒病大流行期间,我们目睹了假新闻和阴谋论的大规模传播,特别是在社交媒体上。本研究对社交媒体平台上传播的COVID-19错误信息进行了全面审查。

本研究的理论贡献主要体现在以下两个方面。尽管人们努力分析社交媒体平台上与新冠肺炎相关的虚假信息,但目前还没有以心理学理论为指导的综合分析框架来研究这种虚假信息,特别是与新冠肺炎相关的虚假信息。基于ELM,这项工作为理解与covid -19相关的错误信息的潜在说服过程提供了第一步。通过开发说服过程的理论模型,本研究包括一组全面的特征,以理解与covid -19相关的虚假信息在社交媒体上的传播。此外,尽管以往的研究通常将大流行错误信息的检测视为一个二元分类问题,但我们的研究结果表明,不同主题的错误信息似乎在情感、社会参与指标和发布者权威特征方面具有不同的特征。因此,本研究建议在开发错误信息检测算法和预防机制时,应考虑错误信息的具体主题。针对不同话题的虚假信息特点,制定有针对性的策略是必要的。

本研究的实际贡献有两个方面。首先,尽管人们对与covid -19相关的错误信息进行了广泛研究,但据我们所知,没有研究试图揭示在社交媒体上发布关于新型冠状病毒的错误信息的用户的综合特征。因此,本研究同时考察了虚假信息作者的档案特征和互动特征。通过揭示虚假信息发布者的特征,我们的研究结果不仅扩展了分析与covid -19相关的虚假信息的研究,而且为发现可能容易发布虚假信息的可疑用户提供了一种可能的解决方案。此外,用户的权威特征与传播网络的拓扑属性之间存在显著的正相关关系,说明权威特征可能对错误信息的传播产生影响。为了打击错误信息,我们的研究结果表明,重要的是,有影响力的用户、公共组织和新闻媒体要意识到他们有责任提供经过核实的信息,特别是在公共卫生危机期间。

表S1。社交媒体上与冠状病毒相关的虚假信息分类研究综述。

缩写 榆树

详尽可能性模型

本研究得到国家自然科学基金项目(72004091,72174083)和教育部人文社会科学基金项目(20YJC870014)的部分资助。

没有宣布。

Cuan-Baltazar 司法院 Munoz-Perez 乔丹 Robledo-Vega C Perez-Zepeda 曼氏金融 Soto-Vega E 互联网上关于COVID-19的错误信息:信息流行病学研究 JMIR公共卫生监测 2020 04 09 6 2 e18444 10.2196/18444 32250960 v6i2e18444 PMC7147328 年代 关于新冠肺炎谣言传播和应对的信息研究 研究科学普及 2020 15 1 70 78 10.19293 / j.cnki.1673-8357.2020.01.011 Kouzy R Abi Jaoude J Kraitem 一个 埃尔阿拉姆 MB 卡拉姆反对 B 阿迪 E Zarka J Traboulsi C 阿克勒说道 电子战 巴多尔 K 冠状病毒传播:量化推特上COVID-19错误信息的流行 Cureus 2020 03 13 12 3. e7255 10.7759 / cureus.7255 32292669 PMC7152572 一个 年代 冠状病毒:错误信息的传播 BMC医学 2020 03 18 18 1 89 10.1186 / s12916 - 020 - 01556 - 3 32188445 10.1186 / s12916 - 020 - 01556 - 3 PMC7081539 R Cacioppo J 说服的阐述似然模型 Adv Exp社会精神病 1986 19 123 205 10.1007 / 978 - 1 - 4612 - 4964 - 1 _1 Ebnali Kian C 促使用户做出更健康的决定:一种针对健康论坛中错误信息的设计方法 2019 AHFE 2019设计传播中应用人为因素国际会议 2019年7月28日 华盛顿特区 10.1007 / 978 - 3 - 030 - 20500 - 3 _1 Y J J 检测在线健康社区中的健康错误信息:将行为特征纳入基于机器学习的方法 正过程管理 2021 01 58 1 102390 10.1016 / j.ipm.2020.102390 Ceron W de-Lima-Santos Quiles 毫克 新冠肺炎时代的假新闻议程:通过事实核查内容识别趋势 在线社会网络媒体 2021 01 21 100116 10.1016 / j.osnem.2020.100116 首歌 Y Ko l 张成泽 上海 韩国政府应对新冠肺炎错误信息的对策:分析疾病管理本部网站的“事实和问题核查” 亚太公共卫生协会 2021 07 06 33 5 620 622 10.1177 / 10105395211014705 33955279 西蒙斯 H 说服:理解、实践和分析 1976 澳大利亚墨尔本 addison - wesley出版公司 Cialdini R Shavitt 年代 布鲁克 TC 人际关系的影响 说服:心理学的洞察力和观点 1994 李约瑟的高度,马 阿林和培根 195 217 Cialdini RB 影响力:说服的心理学 2006 纽约,纽约 哈珀商业 Pornpitakpan C 来源可信度的说服力:对五十年证据的批判性回顾 应用Social Pyschol 2004 02 34 2 243 281 10.1111 / j.1559-1816.2004.tb02547.x l J J 内容和创作者特征对在社交媒体上分享灾害相关信息的影响 正管理 2021 07 58 5 103489 10.1016 / j.im.2021.103489 Turcotte J 纽约 C 欧文 J 肖勒 RM Pingree RJ 社交媒体意见领袖新闻推荐对媒体信任和信息寻求的影响 J Comput-Mediat通讯 2015 06 01 20. 5 520 535 10.1111 / jcc4.12127 Suh B 在香港 l Pirolli P E 想被转发?推特网络转发影响因素的大规模分析 2010 SOCIALCOM '10: 2010 IEEE第二届社会计算国际会议 2010年8月20 - 22日举行, 华盛顿特区 10.1109 / socialcom.2010.33 阿夫拉姆 失物 N 帕蒂尔 年代 Menczer F 暴露于社会参与指标增加了对错误信息的脆弱性 香港Misinfo审查 2020 7 25 1 5 1 11 10.37016 / - 2020 - 033先生 Dainton Zelley 艾德 沟通理论在职业生活中的应用:实践导论 2010 CA千橡市 圣人出版物,公司 波德 l Vraga 埃克 在相关新闻中,这是错误的:通过社交媒体上的相关故事功能纠正错误信息 J Commun 2015 06 23 65 4 619 638 10.1111 / jcom.12166 C K Y 语言特征与社交媒体错误信息传播:信息丰富性的调节作用 正过程管理 2021 11 58 6 102679 10.1016 / j.ipm.2021.102679 年代 l J 社交媒体上含有虚假信息的帖子的说服策略 正过程管理 2021 09 58 5 102665 10.1016 / j.ipm.2021.102665 卡斯蒂略 C 门多萨 Poblete B 推特上的信息可信度 2011 第20届国际万维网会议 2011年3月28日至4月1日 海得拉巴,印度 10.1145/1963405.1963500 范德梅尔先生 TGLA Y 寻找公共卫生危机中错误信息处理的公式:纠正信息类型和来源的影响 健康Commun 2020 05 14 35 5 560 575 10.1080 / 10410236.2019.1573295 30761917 Kwon 年代 荣格 K 不同时间窗口的谣言检测 《公共科学图书馆•综合》 2017 12 1 e0168344 10.1371 / journal.pone.0168344 28081135 玉米饼- d - 16 - 31512 PMC5230768 Kwon 年代 荣格 K W Y 网络社交媒体谣言传播特征突出 2013 2013 IEEE第十三届数据挖掘国际会议 2013年12月7 - 10日 达拉斯,TX 10.1109 / icdm.2013.61 J W K 利用核学习传播结构检测微博帖子中的谣言 2017 第55届计算语言学协会年会 2017年7月 温哥华公元前 10.18653 / v1 / p17 - 1066 D 年代 突发公共卫生事件中微博谣言传播特征分析——以新冠肺炎疫情为例 科学普及研究 2021 16 01 98 10.19293 / j.cnki.1673-8357.2021.01.005 Cinelli Quattrociocchi W Galeazzi 一个 Valensise 厘米 Brugnoli E 施密特 艾尔 左拉 P Zollo F Scala 一个 2019冠状病毒病社交媒体信息大流行 Sci代表 2020 10 06 10 1 16598 10.1038 / s41598 - 020 - 73510 - 5 33024152 10.1038 / s41598 - 020 - 73510 - 5 PMC7538912 清ydF4y2Ba Y 突发公共卫生事件中健康谣言的特征分析——以新冠肺炎期间的双黄连事件为例 J新闻Res 2020 11 20. 104 115 Pennycook G 兰德 DG 假新闻的心理 趋势Cogn Sci 2021 05 25 5 388 402 10.1016 / j.tics.2021.02.007 33736957 s1364 - 6613 (21) 00051 - 6 中国互联网联合辟谣平台 2020-12-01 https://www.piyao.org.cn/2020yqpy/ 腾讯事实核查平台 2020-12-01 https://vp.fact.qq.com/home 微博举报处理大厅 2020-12-01 https://service.account.weibo.com/ W H 新冠肺炎疫情中谣言的心理动因及对策 J大理大学 2021 6 1 111 116 10.3969 / j.issn.2096-2266.2021.01.018 K 新型冠状病毒感染相关谣言的内容分析及治理思考——基于Nvivo 11的368份样本分析 J东北农业大学社会科学版 2020 18 05 27 35 一个 J Y Z 重大突发公共卫生事件的谣言演变与治理对策 正科学 2020 38 07 22 29 10.13833 / j.issn.1007-7634.2020.07.004 理查兹 冰斗 Hemphill 协同定性数据分析的实用指南 J教体育教育 2018 04 37 2 225 231 10.1123 / jtpe.2017 - 0084 Krippendorff K 内容分析:介绍其方法 2012 纽伯里公园, 圣人出版 Zapf 一个 名卡斯特尔 年代 Morawietz l Karch 一个 衡量名义数据的评级者之间的可靠性-哪些系数和置信区间是合适的? BMC医学治疗方法 2016 08 05 16 1 93 10.1186 / s12874 - 016 - 0200 - 9 27495131 10.1186 / s12874 - 016 - 0200 - 9 PMC4974794 溃败 JK 辛格 年代 耶拿 SK 问题 年代 利用有标签和无标签数据进行欺骗性评论检测 Multimed工具: 2016 8 19 76 3. 3187 3211 10.1007 / s11042 - 016 - 3819 - y H C X H B H H F 怀疑知识增强了情绪分析的前训练 arXivcs 2022-05-09 http://arxiv.org/abs/2005.05635 Y l J Y 一个 F 利用社交媒体数据评估新冠肺炎对中国心理健康的影响 Psychol地中海 2021 04 20. 1 8 10.1017 / S0033291721001598 33875036 S0033291721001598 PMC8060544 Y T 年代 丽安 P 如果我要走了,你会想我吗?挪威喜悦的意外市场退出和客户满意度 旅游管理 2020 02 76 103951 10.1016 / j.tourman.2019.103951 Z 沙阿 N 库莫 R 棕色(的) J 麦基 T 描述COVID-19大流行早期中国武汉的微博社交媒体帖子:定性内容分析 JMIR公共卫生监测 2020 12 07 6 4 e24125 10.2196/24125 33175693 v6i4e24125 PMC7722484 物物交换 RL B Superheat:一个R包,用于创建漂亮且可扩展的热图,以可视化复杂数据 J计算图统计 2018 27 4 910 922 10.1080 / 10618600.2018.1473780 30911216 PMC6430237 Kozinets 房车 E-tribalized营销?:虚拟消费社区的战略意义 欧元等J 1999 6 17 3. 252 264 10.1016 / s0263 - 2373 (99) 00004 - 3 X 风扇 W K 了解社交媒体上COVID-19错误信息的传播:话题和政治领导人的推动的影响 美国科学技术协会 2021 09 27 73 5 726 737 10.1002 / asi.24576 34901312 ASI24576 PMC8653058 开启 K Durkin J 马丁 年代 Vanderslott 年代 Vindrola-Padros C 开启 l 杰克逊 D 澳大利亚COVID-19大流行期间关于家庭暴力的公众情绪和话语:对社交媒体帖子的分析 J医学网络杂志 2021 10 01 23 10 e29025 10.2196/29025 34519659 v23i10e29025 PMC8489563
Baidu
map