发表在7卷第12名(2021): 12月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/31540,首次出版
COVID-19大流行期间克罗地亚在线媒体的信息监测:使用自然语言处理的一年纵向研究

COVID-19大流行期间克罗地亚在线媒体的信息监测:使用自然语言处理的一年纵向研究

COVID-19大流行期间克罗地亚在线媒体的信息监测:使用自然语言处理的一年纵向研究

原始论文

1里耶卡大学信息系,克罗地亚里耶卡

2人工智能和网络安全中心,里耶卡大学,里耶卡,克罗地亚

3.克罗地亚里耶卡的里耶卡大学人文和社会科学学院

通讯作者:

斯洛博丹·贝利加博士

资讯学系

里耶卡大学

拉德米尔·马泰季奇2

里耶卡,51000

克罗地亚

电话:385 51584726

电子邮件:sbeliga@inf.uniri.hr


背景:网络媒体在突发公共卫生事件中发挥着重要作用,是重要的传播平台。在COVID-19大流行期间对在线媒体进行信息监控是更好地理解危机传播的重要一步。

摘要目的:本研究的目标是基于自然语言处理对网络媒体上的covid -19相关内容进行纵向分析。

方法:我们收集了克罗地亚在线媒体在大流行前13个月发表的新闻文章的数据集。首先,我们测试了文章数量与每日新增COVID-19病例数量之间的相关性。其次,通过提取频率最高的词汇,运用Jaccard相似系数对内容进行分析;第三,我们比较了两次大流行期间大流行相关术语的出现情况。最后,应用命名实体识别技术提取最频繁的实体,并跟踪观察期内的变化动态。

结果:结果显示,文章数量与每日新增病例数无显著相关性。此外,大流行期间发表的所有文章中使用的术语都有高度重叠,与大流行相关的术语在第一波和第二波之间略有变化。最后,研究结果表明,最具影响力的实体对所确定的人员具有较低的重叠,而对地点和机构具有较高的重叠。

结论:我们的研究表明,网络媒体对疫情的反应迅速,出现了大量与covid -19相关的文章。在前13个月,经常使用的术语有很高的重叠,这可能表明在某些时期报告的重点狭窄。然而,与大流行相关的术语已被充分涵盖。

JMIR公共卫生监测2021;7(12):e31540

doi: 10.2196/31540

关键字



背景

媒体报道在新冠肺炎大流行等突发公共卫生事件中发挥着重要作用,也是全球卫生危机期间的重要传播平台[1].媒体是科学与社会之间的桥梁,在形成集体意见、态度、观点和行为方面具有巨大的力量。2].最近的研究提出了新的疾病传播模型,将媒体报道作为疾病传播背景下可能影响人类行为的一个强大因素[3.-5].所有这些研究都证实了媒介可以影响传染病的传播和控制。王等[4]解释说,媒体报道对公共干预和控制政策的实施有影响。他们指出,其中一项措施是通过所有可用的信息来源教育人们并解释如何预防这种疾病。

另一方面,媒体,尤其是基于互联网的信息源,可能会导致信息泛滥,这被描述为信息过剩、错误信息和虚假信息。应对这些现象创造了信息流行病学这门学科[67].Eysenbach [8他定义了信息管理的四个支柱,包括信息监测,或称信息监视,这使人们能够更好地了解媒体如何应对危机。

信息大流行是COVID-19大流行的严重后果之一[910].这在海量数据集方面为信息监控任务提出了许多挑战,例如大量的通信量、与COVID-19相关的新术语、媒体中出现的各种主题和领域(例如,医疗保健、经济、政治、教育),以及社交媒体中参与通信的大量用户。最近,自然语言处理(NLP)技术在处理大量累积的文本数据方面取得了进展[11],因此是有前途的底层方法,作为信息监视方法学的一个组成部分。

之前的工作

媒体在流行病背景下的重要性和影响在COVID-19之前的几次流行病中得到了广泛研究,如H5N1流感[12]、严重急性呼吸系统综合症(沙士)[13]、中东呼吸综合征[14]、H1N1流感[15],以及寨卡病毒[16].COVID-19大流行的爆发催生了大量研究出版物,重点关注公共传播的不同方面,包括在线新闻媒体的语言学视角[17],新冠肺炎全球媒体框架内容分析[18],新冠肺炎新闻报道的政治化和两极化[19],以及在大流行背景下媒体报道的数量[2].与信息监视相关的研究大多集中在发现主题[20.21]、情绪分析[2223],或假新闻侦测[2425].

大多数研究采用不同的NLP技术来捕捉在线发布的COVID-19内容的特定方面。为了发现公众对特定covid -19相关主题的看法、观点和态度,研究人员通常将主题建模和情绪分析结合起来[2126-28],偶尔也会与命名实体识别(NER)结合使用[29].

尽管对与covid -19相关的媒体报道进行了广泛研究,但信息监测任务的某些方面仍有待改进。例如,现有的研究很大程度上只关注文本的内容,而不是出版文本的数量。只有少数例外的情况下,出版的动态被分析过[220.].此外,所分析的大部分数据集由大流行开始时发表的文本组成,这些文本仅涵盖3至4个月的短时间跨度。鉴于缺乏在更大时间跨度(即COVID-19大流行的第一年)应用纵向数据监测的研究,我们的研究可能值得关注。

在本研究中,我们采用了如上所述的类似方法。然而,为了更具体地解决上述差距,我们建议对这些方法进行扩展,为信息监视任务提供理论框架。首先,我们结合统计方法和NLP技术,同时跟踪新闻文章的数量和新闻文章的内容。其次,在提出的方法中,我们应用Jaccard相似系数来衡量与covid -19相关的在线新闻文章中最常见的术语和实体的相似度。

本研究的目的

在之前的工作中,我们开发了一种基于NLP和统计方法相结合的信息监视任务方法,重点关注在线新闻媒体的内容。

通过分析网络媒体对大流行的反应,我们旨在为信息监测学科做出贡献,特别是更好地理解:(1)在COVID-19危机期间,基于互联网的来源在传播中发挥的作用;(2)潜在的信息大流行。我们的目标是实现基于nlp的克罗地亚在线新闻空间报道动态变化的纵向跟踪。注意到克罗地亚媒体据报缺乏信任[30.进一步促使我们探索媒体是如何处理这个国家公民日常生活中最具挑战性的情况之一的。

这项研究解决了以下与大流行前13个月有关的研究问题:(1)与COVID-19相关的新闻文章的数量是多少,这个数量与COVID-19新病例的数量是否相关?(2)网络新闻媒体关注的主要关键词、最频繁出现的大流行相关术语、最频繁出现的实体是什么?(3)疫情前13个月,网络新闻中与新冠肺炎相关的内容(出现频率最高的词语、出现频率最高的词语、涉及疫情的主要主体)发生了怎样的变化?

为了回答这些问题,我们进行了以下分析。首先,我们对网络媒体进行了探索性统计分析,以概述大流行第一年发表的与covid -19相关文章的趋势。接下来,我们开发了一套基于统计和nlp的方法,用于在线新闻媒体上发布的内容的信息监视任务。更具体地说,我们应用NER自动提取在大流行期间发挥关键作用的实体。接下来,我们构建了一个简单的可视化监控器,能够纵向跟踪大流行第一波和第二波之间大流行相关术语的变化。最后,我们使用Jaccard相似系数对13个月来最常见的术语和实体的变化进行了量化和可视化。


数据收集

在这项纵向研究中,收集的数据涵盖了一年多的时间,具体来说是2020年1月1日至2021年1月15日,从而涵盖了克罗地亚共和国前两次大流行浪潮对应的时间段(见表1).我们将2020年1月和2月的部分时间纳入研究期,尽管这是克罗地亚报告的第一例COVID-19病例之前的时间。由于包括大流行爆发前的这段短时间,数据集包含了与种子大流行相关的术语的出现。此外,捕获的前一时期作为对照,与官方大流行时期进行比较。关于流行(大流行)波持续时间的更多详细信息,见《世界卫生组织》第a1节多媒体附件1

这些数据是从8个主流在线新闻媒体来源的出版物中选择的,分布范围涵盖克罗地亚共和国的地理和媒体空间。这些文章以每天为单位进行收集,共收集到270,359篇文章,其中与covid -19相关的新闻文章有121,095篇。所收集的文章代表了在规定时期内在这八个门户网站上发表的所有文章的完整样本。我们将与covid -19相关的文章的数据集称为“Cro-CoV-texts2020”(参见多媒体附件1链接到从所有新闻来源中提取的按月分组的公开词汇频率列表)。croo - cov -texts2020数据集中包括的这八个门户网站并没有覆盖克罗地亚的整个在线新闻媒体空间。尽管如此,他们形成了我们纵向研究的代表性样本。的第a0节详细介绍了它们的选择标准多媒体附件1

表1。克罗地亚大流行波的持续时间。
开始日期 结束日期
第一波大流行 2020年1月1日,2月25日一个 2020年5月22日
大流行消退 2020年5月23日 2020年6月14日
第二次大流行 2020年6月15日 2021年1月15日

一个克罗地亚出现首例COVID-19病例。

用于确定文章与COVID-19类的从属关系的过滤器是标题、副标题或正文中出现冠状病毒词库中的关键词。冠状病毒同义词典包含了描述SARS-CoV-2病毒流行的大约20个最重要的单词,以及所有的屈折变化(见第a2节)多媒体附件1).除了一般性词汇(与COVID-19大流行相关的通用关键词)外,该清单还增加了克罗地亚特有的词汇,包括公共行政当局的姓名(例如,卫生部部长、一位主要的国家流行病学家、国家民防总部主任)。

对收集到的文章进行预处理:(1)只保留新闻的文本部分(丢弃相关图像和视频);(2)对文本的标题、字幕和正文进行lem化,减少词语的屈折变化,这是标准的NLP预处理程序。

与COVID-19有关的流行病学数据(即新感染人数)来自政府官方门户网站。数据见多媒体附件12020年2月26日(克罗地亚第一例冠状病毒感染确诊病例)至2021年1月15日期间的每一天。

网络媒体内容量的统计分析

根据定义的冠状病毒术语词库对收集的内容进行过滤后,我们首先确定了与covid -19相关的出版物与剩余出版物的比例。然后,我们对与covid -19相关的在线出版物进行了探索性统计分析。

具体而言,将2019冠状病毒病每日病例的时间序列与2020年1月1日至2021年1月15日期间每日发表的COVID-19相关文章进行了比较。两个时间序列具有相同的时间分辨率和长度,第一波为110天,第二波为215天。对于不服从高斯分布的时间序列数据,使用非参数检验。标准斯皮尔曼相关系数(ρ)和肯德尔系数(τ)被用来衡量两个变量之间的关联强度和方向:案例数量和文章数量。

此外,应用交叉相关函数(CCF)来量化潜在的关联,以及两个时间序列之间的时间滞后(见中- a3节中的方程1)多媒体附件1).CCF的解释表明,在时间滞后时,交叉相关的绝对值越大,表明两个时间序列之间的关联越强。当绝对值大于第a3节中公式3定义的阈值时,认为相关性显著多媒体附件1

实验的另一种方式将每日数据汇总到两个时间序列的1周窗口中,导致第一波大流行的分辨率为15周,第二波大流行的分辨率为32周(共46周),这也适用于计算CCF。

自相关函数(ACF)用于计算时间序列观测值与之前时间步长的观测值之间的关系强度,称为“滞后”。由于时间序列观测值的相关性是用之前同一序列的值计算的,因此这被称为序列相关分析。滞后时间序列的自相关图通常称为ACF、相关图或自相关图。

自回归积分移动平均残差的ACF图中包括表示显著性极限的直线,由的a3节中的公式4计算多媒体附件1.超出显著性限制的值被认为在大约为具有统计显著性α=。05,提供自相关不等于零的证据[31].

对2020年2月26日至2021年1月15日期间新冠肺炎病例数与新冠肺炎相关文章发表数之间的互信息(MI)进行量化,进一步评估两个时间序列之间的相互依赖关系。MI计算为两个时间序列的逐点MI的期望值。的- a3节中,式5、式6、式7分别定义了逐点MI、MI和归一化MI的计算多媒体附件1

正如Safarnejad等人所建议的[16, CCF提供了一段时间内真实COVID-19病例数与已发表的COVID-19相关文章之间关系的概述。在我们的案例中(325个观测值和28个滞后),CCF高于0.116将表明两个时间序列之间存在强关联。然而,MI补充了CCF,并被用于用精确的数值进一步量化这种关联。

识别最常见的术语和变化动态

下一步,我们分析了与COVID-19相关的最常见术语,以及词汇趋势如何随时间变化。具体来说,我们计算了列元化数据集中所有项的频率。我们在两个不同的时间跨度上进行了相同的分析:每月水平(共13个月)和两次大流行浪潮。在按月分析中,时间单位(天)的数量取决于日历天的总数。在第二种情况下,大流行波的持续时间总共为281天,第一波较短,为166天,第二波持续了剩余的215天。粗略地说,第一波和第二波分别持续了大约6个月和7个月。

考虑到其他国家可能与大流行波的识别和区分无关,收集到的数据证明克罗地亚的分块是合理的。每月水平的分析当然适合与其他国家作进一步比较。在对冠状病毒相关概念的分析中,我们通过量化表明两个不同时期术语重叠的杰卡德相似性,比较了最常用术语在13个月期间以及在两个不同的大流行浪潮中的变化趋势。有许多提取关键词的方法[32];但是,我们决定应用一种基于词频的简单方法。

尼珥提取

NER是一种NLP任务,旨在提取命名实体,如人员、位置、组织和数字表达式(即时间、金钱、日期)。NER提取可以建模为文本序列注释问题。在这种情况下,训练条件随机场(CRF)作为非有向图形模型以最大化日志似然,从输出标签序列的条件概率除以输入序列和CRF状态的特征计算。克罗地亚国家战略的执行情况以前曾有报告[33基于三个命名实体类(组织、人员、地点)的实验,得出了89.8%的F1分数。在这项工作中,我们使用了为相关斯拉夫语言斯洛文尼亚语、克罗地亚语和塞尔维亚语训练的NER系统[3334]以自动从大型covid -19相关数据集中提取实体。实现的NER对基于crf的reldi-tagger进行了轻微修改,添加了Brown聚类信息,能够识别人、人的衍生品(源自人的名字的形容词)、位置、组织和其他实体。


网络报纸空间的描述性分析

在我们之前的工作中,我们分析了较短时间内以克罗地亚语发布的独立在线和社交媒体内容[35-38].在这项研究中,我们通过在较长时间内(从2020年1月1日到2021年1月15日)审查他们的出版物,重点关注了在线新闻媒体的八大代表。根据冠状病毒词汇量量化了与covid -19相关文章的百分比。

在观察到的8个在线新闻媒体来源中,与covid -19相关的文章的百分比都没有低于44% (图1A)在所有在线新闻媒体来源中,新冠肺炎相关出版物的平均比例占据了总媒体空间的一半以上(约57%)。

图1。在克罗地亚大流行期间(2020年2月25日至2021年1月15日),8个在线新闻媒体来源中每个来源总结的与covid -19相关文章的百分比(A),以及大流行期间不同时期在8个在线新闻媒体来源中总结的与covid -19相关文章占文章总数的百分比(B)。
查看此图

图1B显示了与covid -19相关的文章占发表文章总数的百分比,汇总了所有8个在线新闻媒体来源在不同时间段(即,两次大流行浪潮,大流行消退期间为下降期,以及整个13个月期间)的情况。为了了解2020年的全球情况,还分析了2020年1月1日至2月25日的数据,尽管克罗地亚当时没有COVID-19病例。如果分析不包括克罗地亚没有感染病例的天数(从年初到2020年2月26日),第一波中与covid -19相关的物品的百分比将会高得多,并将升至57%。令人惊讶的是,在两次大流行浪潮之间,当感染病例数降至零时(减少期),与COVID-19相关的出版物数量仍保持在43%的高位,尽管人们预期媒体对COVID-19的报道将大幅减少。

COVID-19大流行与新闻媒体写作动态之间的关联

许多因素可能会影响媒体对COVID-19相关问题的兴趣增加,包括因病情恶化而需要机械通气的患者人数、自我隔离的人数、因COVID-19死亡的每日或总人数,以及因大流行而不得不停止正常业务的公司和企业家的数量。由于没有可靠的数据,所有这些说法的检验都受到了阻碍。尽管如此,我们研究了一个可能影响与covid -19相关出版物的孤立变量,并从中获得可靠数据。因此,我们的目的是确定新感染SARS-CoV-2的每日病例数与发表的与COVID-19主题相关的新闻文章数量之间是否存在相关性。

时间序列图图2显示每天新增COVID-19病例的数量(红线)和发表的COVID-19相关文章的数量(蓝线)。在整个观察期内,无论流行波如何,蓝线都具有相同的波浪重复模式,而红线具有拉长的左尾,然后在第二个流行波中出现高脊。此外,沿时间轴(天)可以看到轻微的重复波状振荡。数据分布用两个观测时间序列的频率直方图显示在第a4节的图a1 -1中多媒体附件1

接下来,我们使用斯皮尔曼等级相关系数检验了每天新发COVID-19病例的数量和每天与COVID-19相关的新闻文章的发表数量之间是否存在线性关系。原假设是,COVID-19病例数量与发表的COVID-19相关文章数量之间没有相关性(α=.05),由于相关性较弱但有统计学意义(n=325;ρ= 0.253,P<措施);肯德尔也证实了这一点τ= 0.173 (P<措施)。更详细的结果,包括双尾检验的95% ci,报告在多媒体附件1

尽管有统计学意义,但相关性极弱。为了获得对结果的直接解释,我们使用了肯德尔τ用概率表示的系数,用于观察相容(和谐)和不相容(不和谐)对的概率。和谐对与不和谐对的出现比例为1:1.4(即1+τ/ 1 -τ),这意味着和谐对出现的概率比不和谐对出现的概率高1.4倍。

现实地说,可以预期的是,关于COVID-19主题的出版物数量不会随着COVID-19病例数量的增加(或减少)而同一天增加,但媒体将随后(即第二天或几天后)对此进行报道。因此,我们接下来研究了如果我们观察与COVID-19相关文章的发表时间延迟与每日COVID-19病例数相比,相关性是否会更强。

图2。时间序列图比较了2020年2月25日至2021年1月15日期间每天发表的与COVID-19相关的文章数量(蓝色)和新发COVID-19病例数量(红色)。
查看此图

考虑到周期可以在时间序列数据中看到,这些数据以正弦波的形式有规律地随时间重复(参见图2),这可能代表季节变化。然而,时间序列中的周期结构可能是季节性的,也可能不是。章节a4中的相关图多媒体附件1左图显示新发COVID-19病例时间序列数据的ACF图,右图显示已发表的COVID-19相关文章的滞后图。这种自相关度量时间序列的滞后值之间的线性关系。与COVID-19相关的文章和COVID-19新病例的ACF在7天的滞后后出现了几个显著的峰值。这决定了时间序列数据中的循环行为,其中周期每7天重复一次。这是因为在非工作日(即周六和周日),撰写和发布的新闻较少,因此达到了最小的周期值。相比之下,工作日(通常在一周的中间),发布的新闻文章数量较多(即达到最大周期值)。重要的是要强调,在周期中没有完全的规律性(即,在7天的基础上没有季节性)。原因是新闻报道的最多数量并不总是发生在一周的同一天。高峰可以在周二、周三或周四之间变化。COVID-19新确诊病例数量也是如此。 On weekends, a smaller number of people are tested (corresponding to the same days when less news is published), whereas more people are tested on work days, so that the number of confirmed infections is higher. The peak is reached again in the middle of the week, but not always on the same day, so the regularity in the form of seasonality cannot be credibly confirmed for the entire epidemic year. The results could suggest the presence of a weekly seasonal component for certain shorter periods of the year. Finally, for the entire year, we observed with certainty a cyclical behavior on a weekly or 7-day basis.

根据这些见解,我们按周(7天)汇总时间序列上的数据,并在1周的时间窗口中观察它们。Kolmogorov-Smirnov正态性检验表明数据不服从高斯分布(检验细节可参阅多媒体附件1).同样,零假设是相关性不存在(α= . 05)。级别的Spearman相关显示存在轻微的正相关(n=47;ρ=0.277),略高于先前以每日为单位分析的个案所得,但无统计学意义(P= 0。06)。此外,肯德尔也证实了这一点τ的0.202 (P= . 05);95% ci报告在的a4部分多媒体附件1

由于存在或不存在至少弱正相关的模糊图像,我们对每日测量的时间序列数据进行了额外的互相关检验。在克罗地亚观察到,发表的与COVID-19相关的文章数量与每天确诊的COVID-19病例数量之间存在显著的交叉相关性(图3).CCF大大高于统计学意义的阈值,最强的正相关出现在滞后=2时。这表明这两个变量不是同时相关的。然而,滞后+2时的正相关关系表明,2天后,COVID-19病例数量越多,与COVID-19主题相关的文章发表数量也越多。在观察到的滞后范围内未检测到负相关。

交叉相关测试表明,在克罗地亚共和国的在线新闻空间中,发布与covid -19相关的新闻文章并没有完全与实际的疾病大流行脱钩。这表明了COVID-19大流行对关于COVID-19的写作的潜在影响。最后,通过MI和归一化MI测度(详见中- a4节)进一步量化和确认两个时间序列之间的强依赖性多媒体附件1).

接下来,考虑到每天发布的与covid -19相关的文章数量,我们询问八大在线新闻媒体来源之间是否存在线性关系。对于所有28个可能的病例,相关性具有统计学意义。在斯皮尔曼系数方面,所有相关均为正,只有两种情况不存在相关。此外,在12例中,正相关较弱,在接下来的12例中,正相关显著,在另外2例中,正相关较强。相关性得到Kendall的证实τ为更为保守的系数(见多媒体附件1).

图3。每天发表的与COVID-19相关的文章数与每天确诊病例数之间的交叉相关函数。
查看此图

大流行相关术语分析

在大流行波的粒度上对最常见的术语进行了分析。根据与新冠肺炎相关的媒体报道的频率,在第一波和第二波疫情中出现频率最高的8个词是相同的。这表明,在整个大流行年,无论疫情如何,记者最常提到的术语是:人、冠状病毒、克罗地亚、年、度量、日、高/大和新。这表明词汇表极其狭窄,只有三个词汇始终指克罗地亚的流行年份,还有五个词汇每天在新闻中用于描述每天新感染人数高的情况。

将监测列表扩大到第一波和第二波流行期间最频繁出现的前250个术语,显示平均Jaccard相似系数为0.72(见图4(左)。这表明两次大流行浪潮之间最频繁的术语有大量重叠,因此在线媒体中与大流行相关的文章内容一致。表a1 -1多媒体附件1分别列出新闻出版物中关于第一波和第二波流行病最常用的50个术语。

图4。第一波和第二波之间(左)以及克罗地亚COVID-19大流行13个月之间(右)最常见单词(术语)的Jaccard相似系数。
查看此图

第二步,以月份为粒度进行术语分析。每两个月计算250个最频繁的词汇的Jaccard相似系数。的热点图图4在1月和2月出现了显著的偏差(黄色方框),其次是Jaccard相似性方面的一些高度重叠(红色方框)。热图上的绿色三角形表示重叠度最高的时期(即,在这些月份中使用最多的术语是最相似的)。绿色三角形的所有角的值都为0.75,从而划定了疫情消退和人们生活中受感染压力较小的月份。在“绿色三角”期间,媒体几乎围绕着同样最常见的流行病术语进行报道,其原因与即将到来的两个事件有关:议会选举和旅游季节。此外,正在参加选举的总理宣布,旅游业的收入对克罗地亚的国内生产总值一直很重要,在大流行期间将至关重要。

在第一次和第二次流行浪潮中,对大流行术语的流行程度进行了量化和可视化图5.蓝色对角线下面的术语是在第一次浪潮中在媒体中更频繁出现的术语,线上面的术语是在第二次浪潮中更频繁出现的术语。

图5。第一波(右下)和第二波(左上)流行病学词汇之间的关系。
查看此图

根据结果,第一波中更常见的症状是咳嗽、喉咙痛和呼吸道症状,而第二波中更关注肺部和呼吸、味觉、嗅觉和干咳。值得注意的是,所有这些项之间的频率差异很小,而且它们在两个波中几乎以相同的速率被写出来。以嗅觉丧失、年龄丧失和腮腺炎症状出现频率最高。

在第一波疫情中,主要提到的是保持卫生和防止感染传播的必需品,包括消毒剂、手套、肥皂、护目镜,甚至还有经营这类用品的药店。下一组重要的术语与药物有关。阿奇霉素(Sumamed)、扑热息痛和羟氯喹在第一波中被提及较多。在第二波中,一旦我们对疾病有了更多的了解,瑞德西韦就被更频繁地提及,伴随着疫苗相关术语的兴起(如CureVac、Pfizer、AstraZeneca和Sputnik V)。此外,“维生素”一词也被频繁识别,“氧气”也因第二波大流行爆发的加剧而被频繁识别。

政治舞台上的人物,如内政部长(博基尼诺维奇)或卫生部长(贝罗什科)、公共卫生研究所所长(卡帕克)和克罗地亚最大的传染病诊所主任(马尔科蒂奇),在第二波中被提及的次数更多。科学家(如Lauc和Đikić)在第二波中更频繁地被提及,因为他们在当时出现在媒体上的次数更多。然而,政治家比科学家更常被提及。

在第一波传播中,人们更加关注疾病的传播途径和感染预防。因此,“扩散(感染或疾病)”、“隔离”、“检疫”、“感染”、“消毒”等词语在此次风波中被提及较多。有趣的是,“自我隔离”、“新感染”、“感染”、“传播”、“治疗”、“样本”、“阳性检测”、“检测”、“流行病学家”、“社会距离”、“死亡”、“患者”和“机械通气(呼吸器)”在第二波中发病率明显更高。这可能是由于第二波疫情的感染人数明显高于第一波,其幅度高于第一波。

在涉及疾病的词汇中,“鼠疫”和“非典”在第一波中占主导地位,而“流感”、“SARS- cov -2”和“COVID-19”在第二波中占主导地位。

用于描述COVID-19感染和疾病的一般词语,如“病毒”、“冠状病毒”、“感染”、“医院和卫生保健”、“大流行”、“流行病”、“生命”、“患者”等,都立即靠近分波边界。由于它们的普遍性,它们的频率比描述或命名症状、药物、公众人物、医疗机构等类似术语的频率要高很多。

我们特别关注大流行期间最常提及的药物和疫苗。所观察到的命名药物和疫苗的词语组的详细信息见表a2 -2多媒体附件1.语料库中组的表示以百分比表示。

将药物和疫苗术语分别作为第一波和第二波的标准化值报告结果。与毒品相关的词汇在第一波语料库中占0.38%,在第二波语料库中占0.61%。在第一波和第二波中,疫苗相关词组分别占语料库的0.24%和4.63%。在第二波流行浪潮中,两组词汇的出现都有所增加:第二波流行浪潮中提及药物的词汇比第一波流行浪潮中多0.23%,第二波流行浪潮中提及疫苗的词汇多4.02%。在第一波中,报道了可以帮助治疗COVID-19的现有药物,但随着一些新药(如瑞德西韦)的出现,它们在第二波中的提及被降级为背景。由于疫苗生产主要是在第二波期间宣布的,与疫苗有关的报告变得更加详尽。

大流行的主要主题

NER分析了大流行文章中唯一实体与实体总数的比例。结果表明,对焦点实体的纵向跟踪可以作为信息监视的一个方面,提供对公共利益趋势的洞察。图6揭示了人员和组织的数量明显高于地点和一般(杂项)实体的数量。结合从图6(右),如果在人员、组织和地点类别中检测到的实体总数相当相等,而杂项类别很少,则有可能在大流行期间对公共利益进行一致跟踪。左边部分图6为大流行期间媒体报道中个别主题的表现提供了数字见解。在第一个大流行年,在四个被研究的实体组中,人(蓝色图表区域)是冠状病毒相关新闻中最常见的主题。除个人姓名外,国籍也属于统称为“人”的一组实体。个人姓名主要是指政治舞台上的主要人物、国家和政府总统、民防总部负责人、部长、科学家、医院院长和传染病专家。

图6。所有观察到的在线新闻媒体在与covid -19相关的媒体发布摘要中,独特实体(左图)和被识别实体总数(右图)的比例。单位:人;ORG:组织;LOC:位置;杂项(一般)。
查看此图

第二常见的组是组织(绿色)。在大流行年,大多数记者报道了医院、公共卫生学校、检测中心、民防总部、世界卫生组织(世卫组织)、欧洲药品管理局、疫苗公司,令人惊讶的是,还有最受欢迎的社交网络,如Facebook和Twitter;这些资料偶尔提到足球或体育俱乐部组织,而最常提到的是政治组织和政党。

地点是第三组实体(红色),包括州、市和县。被捕获的位置实体涉及疫情的重灾区或发生重大流行病相关事件的地区,包括第一批疫苗可用的地区、反询问者抗议活动、临床治疗用完氧气的地区、感染进入疗养院、州边界关闭、旅游季节边境开放、学校关闭、总统选举、以及2020年与大流行浪潮同时发生的两次大地震(第一波地震发生在克罗地亚首都萨格勒布,第二波地震发生在萨格勒布附近的西萨克和佩特里贾镇)。在大流行期间,新闻文章只提到了一组有限和一致的地点,因为不允许太多的旅行和移民。因此,地点的数量一直低于人员和组织的数量。

最后一排是一般或杂项实体组(紫色)。这一类别包括事件名称、商业产品和品牌、文件、电视频道、病毒和疾病等。它们的发生高度依赖于每年或每月某个事件、比赛、音乐会或促销活动发生的时间。

最后,两个图都进去了图6显示在大流行的第一波和第二波高峰期间达到了最大值。

在观察到的大流行期间,以月为单位量化前100个实体的相似性图7揭示了更高的相似性(Jaccard)值在人群和地点集合之间比在组织和其他实体集合之间。鲜红色表示更强的重叠,而深蓝色表示观察到的实体之间的分离(即没有重叠)。黄色表示只有一般的重叠。

图7。每四个传统类别(人(A)、地点(B)、组织(C)和其他一般实体(杂项)(D))中100个最常见实体的13个月间Jaccard相似系数。
查看此图

地点重叠程度最高,而个人和其他实体重叠程度最低。这表明,在日常事件中,新闻被分散在许多人身上。相比之下,在大流行期间,由于地点总数较少,地点相当稳定。这些结果表明,重点集中在克罗地亚、邻国、欧盟以及武汉和伦巴第等国际地点的狭窄区域。这反映了各国关闭边界的事实,大多数事件发生在国内。这就是为什么克罗地亚城市和地区在整个研究期间是主要的地理实体。对各组织也提出了类似的意见。主要的重点组织是世界卫生组织、地方传染病诊所和医院。除医疗机构外,重点是国家总部、各部委、克罗地亚议会和政党等政府实体。在第二波中,重点关注的实体与疫苗接种有关。 The names of the most popular social networks (ie, Facebook and Twitter) were also always present because news articles were reporting COVID-19–related discussions on Facebook and Twitter. A difference can be noticed (图7) 2020年1月和2月(当时克罗地亚尚未宣布疫情)。这些区域用蓝色表示,这表明在疫情爆发之前,网络新闻媒体报道的是不同的组织。之后(从2020年3月起),颜色变成黄色和微红色。在整个大流行期间,网络新闻媒体主要报道的是同一组组织,即使在两次大流行之间有间歇的6月也是如此。

此外,我们在两次大流行浪潮之间进行了实体分析。在本例中,我们重点关注每种实体类型(人员、位置、组织和杂项)的250个最频繁的实体,并观察它们在两个流行波之间的重叠。Jaccard相似系数显示,地点实体类型的重叠系数最大(0.5337),组织的重叠系数(0.4793)略低于人的重叠系数(0.4045),杂项类别的重叠系数最低(0.333)。对结果的解释与上述按月分析的结果相同。


主要结果

在这项工作中,我们通过检查与COVID-19相关的新闻文章的数量和内容,来描述克罗地亚在线媒体对COVID-19大流行的反应。由于大多数关于媒体对以往世界流行病反应的研究都没有使用自然语言处理进行信息监测(例如,[12-16]),我们的研究不能完全与之前的工作相比较。针对与COVID-19媒体报道相关的其他信息监测研究[20.-23262729],本研究提供了方法上的扩展。具体而言,我们提出了一种基于NLP方法与Jaccard相似系数相结合的综合信息监测方法,用于纵向跟踪大流行前13个月的动态变化。

我们的结果显示,与covid -19相关的文章数量相对较高,平均约占新闻文章总数的40%。这一特性在两次大流行期间都保持不变。这些结果与Pearman等人所描述的结果不同[2),他指出,在危机开始时的最初高度关注之后,媒体对COVID-19的报道有所减少。克罗地亚的在线新闻媒体似乎在这两波疫情期间以及第一波疫情之后的一段时间(在接下来的3周内,这是第二波疫情之前的一个间歇)都倾向于高度关注这一流行病。

与大流行有关的文章数量多是媒体报道戏剧化的三个指标之一[15],这可能预示着一场信息大流行。然而,仅凭这一点还不足以成为确认信息大流行的充分条件。显然,在第一波疫情期间,有必要向公众通报COVID-19大流行。网络媒体在向公众提供信息方面发挥着重要作用,也许这就是尽管在第一波疫情期间COVID-19病例数量相对较低,但相关文章数量却很高的主要原因。因此,我们的研究结果表明,与COVID-19相关的新闻文章数量与COVID-19新病例数量之间没有很强的相关性。这一发现与之前的一项研究一致[26表明与寨卡病毒相关的推文动态与潜在的寨卡病毒流行没有显著相关。此外,我们发现文章数量和新冠肺炎病例数量在1周的时间窗口内循环重复。有一个恒定的模式:周末文章数量较少,周日和周一报告的COVID-19新病例较少。

通过捕捉这13个月里最频繁的术语的变化动态,发现2020年5月至9月的相似性最高。这是COVID-19病例数量较低的时期,新闻报道可能信息量较少,主题相似。对大流行相关术语之间相似性的进一步检查表明,所有一般术语(如冠状病毒、感染、大流行和医院)在两波中都同样出现。大流行相关术语从第一波中用于预防或治疗COVID-19的一些可能的疗法和药物(如消毒剂、扑热息痛、Sumamed、阿奇霉素、羟氯喹)转移到第二波中的疫苗接种过程(辉瑞、阿斯利康、Sputnik V、疫苗接种)。这可以解释为网络媒体报道充足的迹象,因为网络媒体提供了可用的信息。

NER调查结果表明,网络新闻媒体主要集中在国家行政人员;即使是被描绘的科学家也经常作为不同国家机构的成员参与其中。哈特等人也报告了类似的模式[19),表明政治家比科学家更频繁地出现在媒体报道中。在线新闻媒体在地点方面的动态变化较低,而人、组织和其他实体在监测的几个月里经常发生变化。

将NER纳入信息监视方法,通过引入焦点实体的见解,丰富了对变化动态的纵向跟踪。然而,这种方法并不能取代主题建模,主题建模也被用作信息监视方法的一部分[3940].事实上,由于NER的某些优势,它可以作为信息源内容表征的一种补充方法。与主题建模相反,主题建模依赖于注释者的观点,因此在检测和命名主题时产生了潜在的歧义,并挑战了注释者之间的一致性或一致性[32], NER支持明确的监视,因为不需要对注释进行额外的解释,这显然支持NER作为主题建模的补充方法。

据我们所知,这项纵向研究是第一次使用NLP技术结合Jaccard相似性来跟踪最常见受试者的变化。此外,由于这项研究是针对克罗地亚在线新闻媒体在大流行第一年的反应,它可以为进一步比较从其他国家收集的数据提供有用的数据。

限制

这项研究有几个局限性。首先,我们通过仅考虑克罗地亚在线新闻媒体来描述与COVID-19大流行相关的媒体内容。然而,社交媒体中存在大量的信息,尤其是本研究中没有包括的社交网络。此外,个人还通过传统渠道接触到与covid -19相关的信息。因此,为了更现实地了解与大流行病有关的媒体内容,最好将分析扩大到涵盖所有来源。因此,在未来的工作中,我们计划通过集成异构数据源,如在线社交网络和类似的社交媒体平台,在线论坛,以及社交媒体中的所有其他文本数据来源,如在线新闻媒体的用户评论,来扩展这项研究。第二,这项研究只关注克罗地亚语;然而,同样的纵向方法可以应用于任何其他语言和/或国家,整个方法是可转移的,只依赖于可用的数据源和每种选定语言的NLP方法的成熟度。

此外,报告的研究还有许多可能的延伸。例如,在推理统计分析中,我们只使用了一个变量(新冠肺炎病例数),但也有一些其他变量(如死亡人数、住院人数、重症监护病房或呼吸机患者人数)可以作为与发表文章数量潜在相关的变量进行研究。此外,一些NLP方法可以应用于信息监视(例如,主题建模结合评论中的情绪或态度的极性)。我们未来研究的另一个重要方向是开发一套完整的基于nlp的方法,专注于信息疫情的纵向监测、信息监测、健康危机沟通和信息疫情管理。

结论

该方法通过量化与COVID-19相关文章的份额,实现了对网络媒体应对COVID-19大流行的信息监测。具体而言,在本研究中,我们解决了三个开放性研究问题,我们的主要发现如下。

新冠肺炎相关文章数量与新增病例之间的低相关性表明,媒体内容的数量并不仅仅由新冠肺炎病例数量驱动,而是由外部过程驱动。在第一波疫情中,大量的新闻文章是必要的,以告知公众有关新疾病和大流行的爆发。在第二波浪潮中,大量的新闻文章对于传播疫苗和其他流行病学措施等发现非常重要。

通过分析媒体内容可以获得更深入的见解。Jaccard相似系数所捕捉到的动态变化的量化表明,关键术语、地点和制度都有缓慢的变化。在所有观测月份(2020年1月除外)中,最常见术语之间的相似性高于50%,而在2020年5月至9月期间,相似性高于70%。这可能表明网络媒体在某些时期的报道焦点很窄。然而,对两波大流行相关术语的频率进行的进一步分析表明,从第一波中已知的最初医学术语转向了第二波中的新医学方法和疫苗。

总而言之,在大流行的头13个月期间,网络媒体在数量(文章数量)方面对大流行做出了迅速反应。尽管与新冠肺炎相关的文章数量很多,但关键术语和实体的变化缓慢。然而,基于追踪大流行相关术语变化动态的结果表明,媒体报道了大流行期间的重要变化(例如,受感染人数、预防措施、疫苗生产)。

总体而言,本文提出的基于自然语言处理(NLP)的信息监测方法可以对变化动态进行纵向跟踪,从而更深入地了解在线新闻媒体对疫情的反应。因此,这项研究有助于更好地理解克罗地亚在线新闻媒体中与COVID-19有关的已发表内容,并可进一步用于改善危机传播。

致谢

这项工作得到了克罗地亚科学基金会IP-CORONA-04-2061项目“COVID-19危机期间社交媒体中信息传播特征的多层框架”(InfoCoV)和里耶卡大学uniri-drustv-sp-20-58项目的部分支持。

利益冲突

没有宣布。

多媒体附件1

数据补充信息,用于文章过滤的covid -19相关术语列表,流行病学数据和使用的数据集,实验中使用的数学公式,推理统计分析的结果细节(附加表格和图表),以及获得的冠状病毒相关概念表。

DOCX文件,721 KB

  1. Glik直流。突发公共卫生事件风险沟通。年度修订公共卫生2007年4月1日;28(1):33-54。[CrossRef] [Medline
  2. 潘文杰,李志强,李志强,等。尽管危机加剧,媒体对新冠肺炎的报道却在减少。柳叶刀地球健康2021年1月;5(1):e6-e7 [免费全文] [CrossRef] [Medline
  3. 刘勇,崔杰。媒体报道对传染病动态的影响。中华生物医学杂志2012 1月25日;01(01):65-74。[CrossRef
  4. 王勇,曹军,金志,张宏,孙刚。复杂网络中媒体报道对疫情传播的影响。物理学报,2013年12月1日;26 (3):553 - 553 [免费全文] [CrossRef] [Medline
  5. 夏超,王震,郑超,郭强,石勇,Dehmer M,等。多路网络中疾病意识与大众媒介耦合传播模型。科学通报2019年1月;471:185-200。[CrossRef
  6. 信息流行病学:(错误)信息的流行病学。中华医学杂志2002年12月2日,第9期:763-765。[CrossRef
  7. 信息流行病学和信息监测:一套新兴的公共卫生信息学方法的框架,用于分析互联网上的搜索、传播和发布行为。J Med Internet Res 2009年3月27日;11(1):e11 [免费全文] [CrossRef] [Medline
  8. 如何对抗信息大流行:信息大流行管理的四大支柱。J Med Internet Res 2020 Jun 29;22(6):e21820 [免费全文] [CrossRef] [Medline
  9. 唐charoensathien V, Calleja N, Nguyen T, Purnat T, D'Agostino M, Garcia-Saiso S,等。COVID-19信息大流行管理框架:世卫组织在线众包技术咨询的方法和结果。J Med Internet Res 2020年6月26日;22(6):e19659 [免费全文] [CrossRef] [Medline
  10. 世卫组织管理COVID-19信息大流行的特设技术磋商:行动呼吁,2020年4月7日至8日。世界卫生组织,2020年4月,网址:https://apps.who.int/iris/handle/10665/334287[2021-08-01]访问
  11. Chowdhary KR.自然语言处理。见:人工智能基础知识。新德里:施普林格;2020:603 - 649。
  12. 杜多·AD,达尔斯特罗姆·MF,布罗萨德·d报告潜在大流行。科学通报2016 Aug 18;28(4):429-454。[CrossRef
  13. 贝里TR,沃夫-希金斯J,内勒P. SARS战争:在新闻媒体卫生信息的数量和建设的考察。卫生通讯2007年4月10日;21(1):35-44。[CrossRef] [Medline
  14. Choi D, Yoo W, Noh G, Park K.社交媒体对韩国MERS疫情期间风险认知的影响。Comput Human behaviour 2017 july;72:422-431 [免费全文] [CrossRef] [Medline
  15. 克莱姆C,达斯E,哈特曼T.猪流感和炒作:媒体戏剧化的H1N1流感大流行的系统回顾。J Risk Res 2014 Jun 20;19(1):1-20。[CrossRef
  16. Safarnejad L,徐强,葛勇,Bagavathi A, Krishnan S,陈森。识别社交媒体上新兴健康问题讨论动态的影响因素:计算研究。JMIR公共卫生监测2020年7月28日;6(3):e17175 [免费全文] [CrossRef] [Medline
  17. Almazán-Ruiz E, Orrequia-Barea a .英国媒体对冠状病毒威胁的报道:基于语料库语言学的比较分析。Çankaya大学学报人类社会科学2020;14(1):1-22。
  18. 王志强,王志强,王志强,王志强,王志强,王志强,等。传播健康危机:对COVID-19全球媒体框架的内容分析。健康促进展望2020年7月12日;10(3):257-269 [免费全文] [CrossRef] [Medline
  19. Hart PS, Chinn S, Soroka S. COVID-19新闻报道中的政治化和两极分化。科学通报2020年8月25日;42(5):679-697。[CrossRef
  20. 张h, Rempel E, Roth D, Carenini G, Janjua新西兰。追踪北美推特上的COVID-19话语:使用主题建模和基于方面的情感分析的信息流行病学研究。J Med Internet Res 2021 Feb 10;23(2):e25431 [免费全文] [CrossRef] [Medline
  21. Satu MS, Khan MI, Mahmud M, Uddin S, Summers MA, Quinn JM,等。TClustVID:一种新的机器学习分类模型,用于调查COVID-19推文中的主题和情绪。基于知识的系统2021年8月17日;226:107126 [免费全文] [CrossRef] [Medline
  22. 莫文文,吕杰,谢登卡,李志强,李志强,等。推特上围绕COVID-19大流行的全球情绪:推特趋势分析JMIR公共卫生监测2020年5月22日;6(2):e19447 [免费全文] [CrossRef] [Medline
  23. Rustam F, Khalid M, Aslam W, Rupapara V, Mehmood A, Choi GS。监督机器学习模型用于Covid-19推文情感分析的性能比较。PLoS One 2021 Feb 25;16(2):e0245909 [免费全文] [CrossRef] [Medline
  24. Paka WS, Bansal R, Kaushik A, Sengupta S, Chakraborty T. Cross-SEAN:基于十字绣半监督神经注意模型的新冠肺炎假新闻检测。应用软计算2021年8月;107:107393。[CrossRef
  25. Gundapu S, Mamidi R.基于Transformer的COVID-19假新闻自动检测系统。出来了。URL:https://arxiv.org/abs/2101.00180[2021-08-01]访问
  26. Jelodar H,王勇,Orji R,黄森。新型冠状病毒或COVID-19在线讨论的深度情感分类和话题发现:使用LSTM递归神经网络方法的NLP。IEEE生物医学健康通报2020年10月24日(10):2733-2742。[CrossRef
  27. Chandrasekaran R, Mehta V, Valkunde T, Moustakas E.关于COVID-19大流行的推文的主题、趋势和情绪:时间信息监测研究。J Med Internet Res 2020年10月23日;22(10):e22624 [免费全文] [CrossRef] [Medline
  28. babich K, petroviic M, Beliga S, martinivi - ipovic S, mateich M, meotroviic A.克罗地亚语中与covid -19相关推文的特征描述:基于croo - cov - csebert模型的框架应用科学2021年11月06日;11(21):10442。[CrossRef
  29. de Melo T, Figueiredo CMS。比较关于巴西COVID-19的新闻文章和推文:情感分析和主题建模方法。JMIR公共卫生监测2021年2月10日;7(2):e24585 [免费全文] [CrossRef] [Medline
  30. 通信总局(欧洲委员会)。欧洲联盟的媒体使用。适用:标准欧洲晴雨表92 (EB92)。比利时:欧盟;2019年11月。
  31. 自相关的方法和公式。一款统计软件18。URL:https://support.minitab.com/en-us/minitab/18/help-and-how-to/modeling-statistics/time-series/how-to/autocorrelation/methods-and-formulas/methods-and-formulas/[2021-06-15]访问
  32. Beliga S, mestroviic A, martiniidi - ipovic S.基于图的关键字提取方法和方法综述。中华器官科学杂志,2015;39(1):1-20。
  33. 柳别希奇N,斯图帕尔M,尤里奇T,阿基奇Ž。结合可用的数据集,建立克罗地亚语和斯洛文尼亚语的命名实体识别模型。斯洛文尼亚2.0 2013;1(2):35-57 [免费全文
  34. fiser D, ljubeiich N, Erjavec T. Janes项目:斯洛文尼亚用户生成内容的语言资源和工具。Lang Res Eval 2018年9月26日;54(1):223-246。[CrossRef
  35. babich K, petroviic M, Beliga S, martinivi - ipovic S, pranjiic M, meotroviic A. 2019冠状病毒病相关信息在推特上传播的预测。2021年5月发表于:第44届信息、通信和电子技术国际大会(MIPRO 2021);2021年5月;克罗地亚奥帕提亚,第395-399页。[CrossRef
  36. 巴比奇K,彼得罗维奇M,贝利加S,马蒂尼季奇-伊普维奇S,贾利诺夫斯基A,梅特洛维奇A.推特上与covid -19相关的交流:克罗地亚和波兰态度分析2021年9月10日出席:第六届信息与通信技术国际大会(ICICT 2021);2021年2月25日至26日;伦敦,英国。[CrossRef
  37. bogoviic PK, meotroviic A, Beliga S, martinivi - ipivic S.新冠肺炎大流行期间克罗地亚新闻的主题建模。出席:第44届信息、通信和电子技术国际大会(MIPRO 2021);2021年9月27日至10月1日;克罗地亚Opatija, 1044-1051页。[CrossRef
  38. Beliga S, martinidii - ipovic S, mateich M, meotrovivic A.自然语言处理和统计:克罗地亚COVID-19疫情的前六个月。在:Kopecka-Piech K, Łódzki B,编辑。Covid-19大流行是媒体和传播研究的挑战。伦敦:劳特利奇-泰勒&弗朗西斯集团;2022.
  39. 麦基TK,李J公司V, Purushothaman Nali M, N,国王Bardier C, et al。大数据、自然语言处理和深度学习用于检测和描述非法COVID-19产品销售:在Twitter和Instagram上进行信息监测研究。JMIR公共卫生监测2020年8月25日;6(3):e20794 [免费全文] [CrossRef] [Medline
  40. Gozzi N, Tizzani M, Starnini M, Ciulla F, Paolotti D, Panisson A,等。Reddit和维基百科上对COVID-19大流行媒体报道的集体回应:混合方法分析J Med Internet Res 2020年10月12日;22(10):e21597 [免费全文] [CrossRef] [Medline


ACF:自相关函数
CCF:互相关函数
CRF:条件随机场
即:中东呼吸综合征
小姐:互信息
尼珥:名称实体识别
NLP:自然语言处理
“非典”:严重急性呼吸系统综合症
人:世界卫生组织


G·艾森巴赫(G Eysenbach)编辑;提交24.06.21;同行评审:A Jarynowski, Q Xu, L Safarnejad;对作者19.07.21的评论;订正版本收到08.08.21;接受05.11.21;发表24.12.21

版权

©Slobodan Beliga, Sanda martinijii - ipovic, Mihaela mateovic, Irena petrijevanin vuksanoviic, Ana mesttrovic。原载于JMIR公共卫生与监测(https://publichealth.www.mybigtv.com), 2021年12月24日。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,https://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map