医学互联网研究杂志-通过使用Dempster-Shafer理论的变形金刚组合对与失眠相关的推文进行情感分析:covid -19大流行前和前后的回顾性研究

原始论文

¹美国德克萨斯州休斯顿贝勒医学院医学系

²德克萨斯大学公共卫生学院管理、政策和社区卫生系，德克萨斯大学休斯顿健康科学中心，美国德克萨斯州休斯顿

^3.德克萨斯大学休斯顿健康科学中心生物医学信息学学院，美国德克萨斯州休斯顿

通讯作者:

Javad Razjouyan博士

医学系

贝勒医学院

贝勒广场1号

休斯顿，德克萨斯州，77030

美国

电话:1 713 798 4951

电子邮件:javad.razjouyan@bcm.edu

背景:COVID-19大流行对人口健康造成了额外压力，可能导致睡眠行为的改变。

摘要目的:在这项研究中，我们假设使用自然语言处理来探索社交媒体将有助于评估COVID-19爆发后失眠患者的心理健康状况。

方法:我们设计了一项回顾性研究，使用了Twitter上的公共社交媒体内容。我们根据时间对与失眠相关的推文进行了分类，使用了以下两个区间:大流行前(2019年1月1日至2020年1月1日)和大流行周(2020年1月1日至2021年1月1日)区间。我们使用预训练的变压器结合Dempster-Shafer理论(DST)进行了情绪分析，将情绪的极性分为积极的，负,中性．我们在300条带注释的推文中验证了提议的管道。此外，我们使用逻辑回归进行了时间分析，以检查时间对Twitter用户失眠体验的影响。

结果:我们提取了包含这个词的305321条推文失眠(大流行前的推文:n=139,561;大流行期间的推文:n=165,760)。预训练变压器的最佳组合(通过DST组合)的准确率为84%。通过使用这个管道，我们发现发布负面推文的几率(比值比[OR] 1.39, 95% CI 1.37-1.41;P<.001)在大流行期间的死亡率高于大流行前期间的死亡率。午夜后发布负面推文的可能性比午夜前高21% (OR 1.21, 95% CI 1.19-1.23;P<措施)。在大流行前，午夜后发布负面推文的几率比午夜前高出2% (OR 1.02, 95% CI 1.00-1.07;P(OR 1.43, 95% CI 1.40-1.46;P<.001)。

结论:提出的新颖的情感分析管道，通过DST结合预先训练的变压器，能够对与失眠相关的推文的情绪和情绪进行分类。在大流行期间，Twitter用户分享的关于失眠的负面推文多于大流行前。未来使用自然语言处理框架的研究可以评估关于其他类型的心理困扰、习惯改变、不活动导致的体重增加以及病毒感染对睡眠的影响的推文。

中国医学杂志，2018;24(12):e41517

doi: 10.2196/41517

关键字

新型冠状病毒肺炎；冠状病毒；睡眠；推特；自然语言处理；情绪分析；变形金刚； Dempster-Shafer理论；睡觉；社交媒体；流感大流行；效果；病毒感染

COVID-19大流行给世界人口带来了过度压力[1，2]由于金融不稳定、失业、社会孤立和缺乏社会活动[3.]。之前的研究证实了这种压力和睡眠障碍之间的联系[4-6]。此外，由于大流行，社交距离等限制措施导致某些数字行为增加，包括远程学习、网络会议、网络购物和社交媒体使用[7-9]。Twitter等社交媒体平台使用率的上升，为研究人员筛选公众行为提供了新的数据来源。

多项研究报告了COVID-19大流行对睡眠质量和心理健康的影响[10-17]。然而，这些研究仅限于小型数据库，通过问卷调查收集的数据，或两者兼而有之，而且缺乏对照组。例如，一项研究使用推特，根据192条推文报告了COVID-19大流行对孕妇睡眠质量的影响[18]。社交媒体内容的情感分析是一项具有挑战性的任务，因为这些文本是非结构化的、简短的、非正式的和随意的;在听写和语法方面容易犯错误;并且是嘈杂的(表情符号，标签，url等);它们包含了歧义，比如一词多义[19]。因此，使用人工智能和机器学习工具和技术可能有助于应对这些挑战。这些工具中有先进的分析自然语言处理(NLP)算法变形金刚［19-26]。它们是对深度人工神经网络(循环神经网络)以前版本的语言建模和语言编码新提出的工具和扩展。

我们假设，使用NLP探索社交媒体可以帮助评估COVID-19大流行爆发后失眠患者的心理健康状况。心理健康是通过对推特公开数据使用NLP算法测量负面情绪来定义的。我们设计了一个基于预训练变压器架构的情感分析管道。利用Dempster-Shafer理论(DST;信念理论)，以达到更高的准确性在认识的情绪。通过使用手动标注的数据集验证了该模型的准确性。随后，使用这一管道，我们分析并比较了在COVID-19大流行爆发前1年内(大流行前)和大流行期间1年内(大流行周)发布的与失眠相关的推文所固有的情绪。我们还从推文的发布时间方面比较了推文的情绪分析结果(即时间分析;午夜前和午夜后)。

研究设计和数据收集

这项回顾性试点研究检查了在2019日历年(大流行前间隔)和2020日历年(大流行前后间隔)发布的推文。我们通过使用Twitter应用程序编程接口来收集公开的英语推文，该接口允许我们通过匹配关键字(例如，失眠）.这些推文根据发布日期和时间被分为两组:大流行前(2019年1月1日至2020年1月1日)和大流行周(2020年1月1日至2021年1月1日)。推文的入选标准是它们必须包含这个词失眠而且要用英语。因此，所有的非英语推文和没有关键词的英语推文失眠被排除在外(图1）.从包含的推文中提取的数据用于情绪分析和情绪注释。

抽样策略与注释

为了确定NLP算法性能测量所需的最小样本量，我们使用了精确功率计算方法[27]。我们假设效应量为0.3，α为0.05，幂为80,5df，需要143张纸币。然而，我们的注释团队随机选择了300个注释。

为了验证模型在预测推文情绪方面的性能，我们从提取的数据中随机选择了300条推文(根据研究设计和数据收集部分)，并手动将它们注释为积极、消极和中性类别。两名母语非英语、国际英语语言测试系统得分≥7分的人在推特上做了注释。第三位资深非英语母语人士担任最终法官，裁决分歧。我们用Cohen κ [28参数来衡量注释器之间的信度。

为推文开发情感分析管道

情感分析管道概述

我们设计了一个算法，它有以下三个步骤:预处理、处理和后处理。在预处理步骤中，我们通过删除特殊字符、url和标签来为处理步骤准备推文。该工艺步骤由2个单元组成。第一个单元使用多个模型进行情绪分类(即，积极、消极和中性)。第二个单元使用DST来组合几个模型的输出(即前一步的输出)，以提供更准确的预测。最后，在后处理步骤中，我们量化了不同模型的情感分析性能。这些步骤将在以下部分和中进行更详细的讨论图2．

图2。机器学习自然语言处理算法流水线。(A)我们分别计算每个变压器的性能。(B)结合变压器的输出，使用Dempster-Shafer理论做出最终决定。BERT:变压器的双向编码器表示;来自变压器预训练方法的稳健优化双向编码器表示。

预处理

从Twitter上抓取的原始数据包含不相关的属性(例如，用户名、url、转发、表情符号等)。预处理的目的是过滤不需要的文本内容，获得推文的相关部分。

过程

该过程步骤包括以下两个单元:基于nlp的情感分析分类器和用于组合分类器输出的DST。

第一单元:变形金刚

为了对推文进行情感分析，我们利用了变压器，这是新一代的深度人工神经网络(也称为循环神经网络)，用以进行机器翻译[29]并且由变压器单元相互堆叠而成。它们包括两个主要部分——编码器和解码器。编码器用于分类和推理，解码器主要用于语言建模;完整的架构用于机器翻译[30.]。中显示了变压器的典型编码器图3（多媒体附件1提供了变压器的简要理论)。

总共使用了5种不同的预训练的基于变压器的推文情感分析模型。拥抱脸AI社区提供的五个预训练模型如下:

从变压器提取双向编码器表示(BERT) [31]，在斯坦福情感树库v2数据库上进行了微调[32]。知识蒸馏[33，34]用于将BERT模型的大小减少40%，同时保留其97%的语言理解能力，并使其速度提高60%。
稳健优化BERT预训练方法[35用来进行情绪分析，该算法对大约5800万条推文进行了训练。基于BERT结构的RoBERTa模型;然而，它不仅在BERT训练过的数据上进行了预训练(BookCorpus [34，36]和英文维基百科;约33亿字)，还有新闻数据和故事数据库[37]。为了进行情绪分析，RoBERTa对5800万条推文进行了微调。
BERTweet [38]，基于RoBERTa预训练程序进行训练，并对8.5亿条英语推文进行预训练。
基于bert的多语言模型，用于以下六种语言(英语、荷兰语、德语、法语、西班牙语和意大利语)的产品评论的情感分析。它通过使用星级(1星到5星之间)来预测评论的情绪;3颗星为中性，<3颗星为阴性，≥4颗星为阳性。
罗伯塔[35模型对来自不同文本来源的15个数据集进行了微调，以增强不同类型文本(评论、推文等)的泛化。

秒单位:DST

提高变压器模型的性能第一单元:变形金刚section，我们使用夏令时[39，40)，该系统能够综合不同专家的证据。我们让Θ= {θ₁，θ₂、……θ_l}是可能假设的有限集。这个集合被称为辨别框架，其功率集为2^Θ．我们定义了一个函数，米()。，称为基本信念分配，它映射每个子集η的值，取值范围为0 ~ 1，且满足以下条件:

米(ϕ)= 0(1)

和

一个子集ζ米（η)>0是a吗焦点元素．我们定义了另一个函数信念函数，贝尔(。)，它为Θ的每个非空子集ζ赋一个从0到1的值，定义如下:

给定上述函数，我们定义组合规则。我们假设了两个基本信念赋值，米₁(.)和米₂(.)，表示信念函数贝尔₁(.)和贝尔₂(.),让η_j和ζ_k成为重点元素贝尔₁和贝尔₂,分别。米₁(.)和米₂(.)然后结合起来，以获得大众所信奉的信仰ϑ⊆Θ，按以下组合(即正交和公式):

分母对于归一化很重要。

后处理:模型评估

对本文中所讨论的模型进行性能评价第一单元:变形金刚部分，评估指标-灵敏度、精度、准确性和F₁本研究使用了从混淆矩阵中提取的分数，并使用以下公式计算[41]：

统计分析

在进行情绪分析并将数据分为负面、正面和中性类别后，使用卡方检验和比值比(or)分析这些推文的类别特征(负面、正面和中性推文的数量)。P显著性水平为<。05, 95% ci，和z-统计报告。使用Python 3.8进行数据管理[42]，使用SPSS version 27 (IBM Corporation)进行分析。

时序分析

我们还调查了与失眠相关的推文的年表，通过检查推文的总小时数。我们提取了带有负面情绪的推文的发布次数。每天的小时数被分为以下两个时间段:午夜前(下午1点到午夜)和午夜后(凌晨1点到中午)。我们计算了每个区间内负面推文的百分比，并使用逻辑回归分析来比较午夜前后发布负面推文的几率。

推文的特点

我们检索到305321条包含这个词的推文失眠并在大流行前和大流行前后发布。其中，139,561人在大流行前期间发布，165,760人(增加18.7%)在大流行周期间发布。在这两个时间段内，推文的长度(字数)大致相同(大流行前:平均26.3字，标准差为13.7字;周流行:平均29.3，标准差13.7字)。推文互动的数量，定义为点赞、转发和回复数量的总和，没有显著差异(P(大流行前:平均6.2，标准差171.8相互作用;大流行前后:平均5.4，标准差100.6相互作用)。

注释

在这两名评论者注释的300条推文中，167条(55.7%)被归为负面，102条(34%)被归为中性，31条(10.3%)被归为正面。评分者间信度达到0.55 (95% CI 0.44 ~ 0.69)。

情感分析管道性能

在表1，我们报告了在300条注释推文中预训练的五个模型的准确性。模型1蒸馏bert -效果最好(80.3%)。在使用DST方法组合模型后，我们观察到组合模型1、2、3和5可以获得最高的性能(84%;表1）.

由于蒸馏BERT(模型1)显示了单模型分类的最佳性能，并且为了更好地理解DST如何提高管道的性能，我们分析了该模型的评估指标以及模型的最佳组合(即在表1)，在所有三项情绪指标(表2）.

表1。用于分析300条注释推文的模型的性能比较。

模型			精度(%)
单独的模型
	模型1(蒸馏BERT^一个) [31]	80.3
	模型2(罗伯塔^b) [35]	52.7
	Model 3 (BERTweet^c) [38]	53
	模型四(bert -多语种)[35]	49.3
	模型5(微调RoBERTa) [35]	45.3
基于Dempster-Shafer理论的组合模型[39，40]
	模型1+模型2+模型3	81
	模型1+模型2+模型3+模型5	84
	模型1+模型5	77.2
	模型1+模型2+模型3+模型4+模型5	81.7

^一个BERT:来自变压器的双向编码器表示[31]。

^b来自变压器预训练方法的鲁棒优化双向编码器表示[35]。

^cBERTweet是一种来自Transformers预训练方法模型的稳健优化的双向编码器表示，该模型经过8.5亿条英语推文的训练[38]。

表2。比较单个模型(从变压器提取的双向编码器表示)和基于Dempster-Shafer理论的组合模型在识别每个情感类别(积极、中性和消极)方面的性能。

情绪	灵敏度(%)			精度(%)			F₁分数			精度(%)
	单独的模型^一个	组合模型^b	单独的模型		组合模型	单独的模型		组合模型	单独的模型		组合模型
负	92.8	93.4	77.9		81.7	84.7		87.1	81.3		84.6
中性	72.5	77.5	98.7		98.8	83.6		86.8	90.3		91.3
积极的	38.7	54.8	46.2		58.6	42.1		56.6	89		92

^一个单个模型是从变压器中提取的双向编码器表示[31]。

^b组合模型是由transformer (BERT)的蒸馏双向编码器表示[31]，稳健优化BERT预训练方法(RoBERTa) [35]， BERTweet [38]，并微调RoBERTa [35]。

情绪分析

应用于所有推文的情绪分析的最佳组合模型的结果显示在表3．我们发现，与大流行前时期(65,164/139,561,46.7%)相比，大流行周期发布负面推文的可能性更高(91,242/165,760,55%)。因此，我们发现在大流行期间发布正面推文的可能性(27,621/165,760,16.7%)低于大流行前期间(34,633/139,561,24.8%)。我们还观察到在大流行前后发布中立推文的可能性相同(图4）.我们报告，与大流行前的时间段相比，大流行期间发布负面推文的几率高出39% (OR, 1.39;95% ci, 1.37-1.41，P<措施;表3）.

表3。大流行前(2019日历年)推文和大流行前后(2020日历年)推文的消极和积极特征。

微博人气	推文总数(N=305,321)， N (%)	大流行前推文(n=139,561)， n (%)	大流行期间推文(n=165,760)， n (%)	大流行前vs大流行周
				P价值	z统计	优势比(95% CI)
消极的推文	156406 (51.3)	65164 (46.7)	91242 (55)	<措施	45.94	1.39 (1.37 - -1.41)
积极的推	62254 (20.4)	34633 (24.8)	27621 (16.7)	<措施	55.402	0.60 (0.59 - -0.61)
中性的推文	86661 (28.3)	39764 (28.5)	46897 (28.3)	口径。	1.22	0.99 (0.97 - -1.00)

时序分析

午夜后发布负面推文的可能性高于午夜前(OR 1.21, 95% CI 1.19-1.23;P<措施;图5A).从负面推文的小时分布来看，与午夜前相比，午夜后时段有增加的趋势(图5B)大流行期间午夜前发布负面推文的几率比大流行前时期高15% (OR 1.15, 95% CI 1.12-1.18;图5C)，而在大流行期间，午夜后发布负面推文的几率高出60% (OR 1.60;95% ci 1.57-1.63;P<措施;图5C).在大流行前时期，午夜后发布负面推文的几率比午夜前高出2% (OR 1.02, 95% CI 1.00-1.07;P= .008;图5D);然而，在大流行周期，它们要高出43% (OR 1.43, 95% CI 1.40-1.46;P<措施;图5D).对大流行前和大流行期间的推文情绪进行季度(3个月)分析的结果载于年的表S1和图S2多媒体附件2．

图5。推文的时间分析。(A)午夜前(下午1点至午夜)和午夜后(凌晨1点至中午)发布的负面推文的百分比。(B)负面推文的每小时分布。(C)大流行前和大流行周期间午夜前(下午1点至午夜)和午夜后(凌晨1点至中午)发布负面推文的可能性比较。(D)大流行前和大流行周期间午夜前(下午1点至午夜)和午夜后(凌晨1点至中午)发布负面推文的可能性的比较。

主要研究结果

在这项回顾性队列研究中，我们表明NLP工具可以通过使用公开平台(如Twitter)上表达的情绪来监测人口健康，作为公众意识和认知的替代措施。我们观察到，COVID-19大流行与失眠相关的自我报告推文的变化呈负相关。我们设计了一种用于情感分析的新型NLP管道，该管道基于预训练的变压器组合(通过DST组合;即信仰理论)。通过使用这一基础(在手动注释的推文上得到验证)，我们在大流行期间检测到的在推特上报告失眠的人的负面推文比大流行前检测到的负面推文更多。

首先，我们开发了一种新颖的基于机器学习的管道来分析情绪。为了验证模型的性能，我们手动注释了300条推文。κ分析表明，不同评分者的一致性为55%。这不是一个非常强烈的共识，这可能是由于情感分析任务固有的主观性造成的，在这种任务中，每个人都根据自己的观点为文本分配情感[43]。接下来，使用这个带注释的数据库，我们分别验证了每个模型的性能，并分析了所有模型的性能;蒸馏BERT(模型1)效果最好，准确度为80.3%。此外，联合模型产生了最好的结果(准确率为84%)。值得注意的是，加入RoBERTa(模型2)和BERTweet(模型3)并没有提高太多的精度，但加入微调RoBERTa(模型5)使得精度提高了4%。虽然微调RoBERTa(模型5)的整体性能低于蒸馏BERT(模型1)，但它在检测积极推文方面的准确率(71%)高于蒸馏BERT(模型1;精度:38.7%;混淆矩阵在图S1中找到多媒体附件2）.因此，与蒸馏BERT(模型1)相比，组合模型在检测正面推文方面具有更高的准确率(54.8%)表1，可以推断，在组合中保留RoBERTa(模型2)和BERTweet(模型3)是必要的，因为蒸馏BERT(模型1)和微调RoBERTa(模型5)的组合效果更差(77.2%)。这可以解释为，虽然经过微调的RoBERTa(模型5)在识别积极推文方面表现更好，但在识别中性和消极推文方面表现不太理想;因此，它降低了整体精度。这表明了DST在结合模型和利用每个模型的优势来提高整体情绪分类方面的效率。

在开发了一个可靠的情绪分析管道之后，我们分析了推文的情绪。在大流行期间，我们观察到带有该关键字的推文数量显著增加失眠（P< 001)。一种可能的解释是，社交互动从面对面的环境转移到了基于网络的环境，比如Twitter。推特的年度用户数量增长了33.8%，从2019年的1.38亿用户增长到2020年的1.86亿用户[44，45]。我们还观察到，在疫情开始后，与失眠相关的推文总数有所上升。考虑到这一点，结合情绪分析的结果，我们认为这一峰值可能与负面推文的增加有关(图4）.根据表3虽然与失眠相关的正面推文数量下降了8.1%，但这一数字被负面推文数量8.3%的飙升所掩盖;中立推文的数量没有显著变化(减少0.2%)。我们发现负面推文的数量显著增加(P<001)与以前发表的文献一致[46]。政治等[47通过分析新冠疫情爆发前后发布的推文，显示在某些日期负面情绪有所增加。

Nota和Coles之前的一项研究[48研究表明，睡眠中断的人控制负面情绪的自上而下抑制过程减弱，经常进行重复的负面思考(反刍)。我们在研究中发现了同样的趋势;失眠症患者在夜间清醒且不受干扰时更容易陷入沉思(图5B)，表明一种晚上睡眠不好后的沮丧状态。这与从图5A，这表明62.4%(190,521/305,321)的负面推文是在午夜之后产生的。

我们的研究表明，NLP工具可以用来监测人们对公共压力的态度，比如大流行造成的压力。决策者和公共卫生当局可受益于利用此类监测工具更好地为选民进行宣传[49]。我们的研究被归类为信息流行病学研究，它提供了一个实时分析公众情绪的机会[50]。NLP工具是分析和挖掘Twitter的强大工具，Twitter是软情报的来源。

限制

在本研究中，我们使用Twitter作为数据收集的来源。因此，我们可能已经排除了大量使用其他社交媒体平台(如Facebook)或论坛(如Reddit)来表达他们对失眠的看法的人群。未来的研究应该调查除了推特之外，其他社交媒体平台上的公开数据。此外，由于本研究基于推特，因此缺乏效度测量，没有使用问卷调查和自我报告测量。未来的一项研究可能会使用Twitter数据和个人、卫生专业人员、研究人员和非营利组织的自我报告措施，联合评估孕妇的需求，以及在COVID-19大流行期间可获得的支持和资源。

值得注意的是，在本作品中，只有关键词失眠是用来抓取推文的。尽管同义词如失眠我们只对临床术语感兴趣失眠．一项收集更广泛的睡眠领域(即失眠之外)数据的研究将有助于进一步了解大流行的全面影响。此外，一些可能的混淆因素，如用户位置，并不是所有用户都可用;这些因素可能会阻碍地理位置对失眠感知的影响。

结论

在这项研究中，我们提出了一种新的NLP管道，该管道基于使用DST的变压器组合来预测文本数据中固有的情感。我们手动注释了300条tweet，并通过DST组合了各种transformer架构。这种组合可以提高情绪分析的准确性。通过对与失眠相关的推文使用这一管道，我们的研究显示了COVID-19大流行对个人在推特上报告失眠的经历的负面影响。为了调查在COVID-19大流行背景下推特用户报告的睡眠行为的变化，我们分析了大流行之前和期间(2019年和2020年)发布的关于失眠的推文。这项研究的一个优势是使用NLP和DST来识别关于失眠的推文并分析他们的情绪。未来，我们将基于Twitter和其他社交媒体平台，评估大流行期间和之后心理健康状态其他方面(如无聊、恐惧、厌恶、惊讶等)和生活方式改变(如睡眠时间、睡眠时间表、物质使用、身体活动和睡眠药物使用)对失眠症状的影响。

致谢

这项工作得到了美国国立卫生研究院(NIH)、国家心肺和血液研究所K25基金的支持(赠款1K25HL152006-01;首席研究员:JR)和来自NIH国家护理研究所的研究经费(资助R01NR018342;主要研究员:SN)。本研究使用了质量、有效性和安全创新中心(批准号CIN 13-413)的设施和资源。本文仅代表作者个人观点，并不代表美国政府、退伍军人事务部或贝勒医学院。

利益冲突

HX和德克萨斯大学休斯顿健康科学中心在Melax技术公司拥有与研究相关的财务利益。

‎

多媒体附件1

变压器的简单理论。

DOCX文件，14kb

‎

多媒体附件2

补充表格和数字。

DOCX文件，180 KB

de Figueiredo CS, Sandre PC，葡萄牙LCL, Mázala-de-Oliveira T, da Silva Chagas L, Raony Í，等。COVID-19大流行对儿童和青少年心理健康的影响:生物、环境和社会因素Prog神经精神药理学生物学精神病学2021年3月02日;106:110171 [免费全文] [CrossRef] [Medline]
Lebrasseur A, Fortin-Bédard N, Lettre J, Raymond E, Bussières EL, Lapierre N，等。COVID-19大流行对老年人的影响:快速回顾JMIR老化2021年4月12日;4(2):e26474 [免费全文] [CrossRef] [Medline]
Elbogen EB, Lanier M, Blakey SM, Wagner HR, Tsai J. COVID-19大流行期间的自杀意念和自残思想:与COVID-19相关的压力、社会隔离和经济压力的作用。抑郁焦虑2021年5月05日;38(7):739-748 [免费全文] [CrossRef] [Medline]
Cellini N, Canale N, Mioni G, Costa S.意大利COVID-19封锁期间睡眠模式、时间感和数字媒体使用的变化。J Sleep Res 2020 Aug;29(4):e13074 [免费全文] [CrossRef] [Medline]
Partinen M, Bjorvatn B, Holzinger B, Chung F, Penzel T, Espie CA, icss协作组。2019冠状病毒病(COVID-19)大流行期间的睡眠和昼夜节律问题:国际COVID-19睡眠研究(ICOSS)J Sleep Res 2021 Feb;30(1):e13206 [免费全文] [CrossRef] [Medline]
流行病学:睡眠医学的原理和应用。在:Chokroverty S，编辑。睡眠障碍医学:基础科学，技术考虑和临床方面。纽约州纽约:施普林格;2017:485 - 521。
Goel A, Gupta L.在COVID-19时代的社交媒体。中华风湿病杂志2020 Sep;26(6):220-223 [免费全文] [CrossRef] [Medline]
TikTok的崛起:一个社交媒体平台在COVID-19期间的演变。在:Hovestadt C, Recker J, Richter J, Werder K，编辑。Covid-19的数字化应对:大流行爆发期间的数字创新、转型和创业。瑞士占姆:施普林格;2021:73 - 85。
Colley RC, Bushnik T, Langlois K.在COVID-19大流行期间的锻炼和屏幕时间。卫生代表2020年7月15日;31(6):3-11 [免费全文] [CrossRef] [Medline]
Beck F, Léger D, Fressard L, pereti - watel P, Verger P, Coconel Group。在人群水平上，Covid-19健康危机和封锁与大量睡眠投诉和催眠摄取有关。J Sleep Res 2021 Feb;30(1):e13119 [免费全文] [CrossRef] [Medline]
de Azevedo Barros MB, Lima MG, Malta DC, Szwarcwald CL, de Azevedo RCS, Romero D，等。报告COVID-19大流行期间巴西成年人的悲伤/抑郁、紧张/焦虑和睡眠问题。流行病Serv Saude 2020;29(4):e2020427 [免费全文] [CrossRef] [Medline]
周世杰，王丽丽，杨锐，杨新军，张乐革，郭志才，等。2019冠状病毒大流行期间中国青少年和年轻人的睡眠问题睡眠医学2020年10月;74:39-47 [免费全文] [CrossRef] [Medline]
Idrissi AJ, Lamkaddem A, Benouajjit A, El Bouaazzaoui MB, El Houari F, Alami M，等。摩洛哥COVID-19大流行和封锁期间的睡眠质量和心理健康睡眠医学2020年10月;74:248-253 [免费全文] [CrossRef] [Medline]
Passos L, Prazeres F, Teixeira A, Martins C. COVID-19大流行对心理健康的影响:葡萄牙和巴西的横断面研究。国际环境与公共卫生2020年9月17日;17(18):6794 [免费全文] [CrossRef] [Medline]
maautong H, Gallardo-Rumbea JA, Alvarado-Villa GE, Fernández-Cadena JC, Andrade-Molina D, Orellana-Román CE，等。评估因COVID-19疫情暴发而处于社会隔离期间厄瓜多尔普通人群的抑郁、焦虑和压力水平:一项横断面研究BMC精神病学2021年4月28日;21(1):212 [免费全文] [CrossRef] [Medline]
Gualano MR, Lo Moro G, Voglino G, Bert F, Siliquini R.意大利Covid-19封锁对心理健康和睡眠障碍的影响。国际环境与公共卫生杂志2020年7月02日;17(13):4779 [免费全文] [CrossRef] [Medline]
Alkhamees AA, Alrashed SA, Alzunaydi AA, Almohimeed AS, Aljohani MS. COVID-19大流行对沙特阿拉伯普通民众的心理影响。Compr Psychiatry 2020年10月;102:152192 [免费全文] [CrossRef] [Medline]
塔尔博特J, Charron V, Konkle AT。感觉空虚:推特数据分析显示，在COVID-19大流行期间，孕妇缺乏隔离支持和睡眠困难。国际环境与公共卫生杂志2021年1月06日;18(2):393 [免费全文] [CrossRef] [Medline]
乔杜里，贾维德，库尔苏姆，穆罕默德，汗兹，肖艾布，等。大选前后情绪分析:2020年美国大选推特数据。电子学(巴塞尔)2021年8月27日;10(17):2082 [免费全文] [CrossRef]
何军，麦山，胡华。基于时间挤压融合的单模态增强变压器多模态情感分析。IEEE信号处理通讯2021年5月07;28:992-996。［CrossRef]
Jalil Z, Abbasi A, Javed AR, Khan MB, Hasanat MHA, Malik KM，等。使用最先进的机器学习和深度学习技术进行COVID-19相关情绪分析。前方公共卫生2022年1月14日;9:812735 [免费全文] [CrossRef] [Medline]
蒋敏，吴娟，史霞，张敏。基于Transformer的记忆网络的网络评论情感分析。IEEE Access 2019 Dec 02;7:179942-179953 [免费全文] [CrossRef]
Naseem U, Razzak I, Khushi M, Eklund PW, Kim J. COVIDSenti:用于COVID-19情绪分析的大规模基准推特数据集。IEEE transcomput Soc Syst 2021年1月29日;8(4):1003-1015 [免费全文] [CrossRef] [Medline]
Naseem U, Razzak I, Musial K, Imran M. Transformer基于深度智能上下文嵌入的Twitter情绪分析。未来通用计算系统2020年12月;113:58-69 [免费全文] [CrossRef]
Sousa MG, Sakiyama K, de Souza Rodrigues L, Moraes PH, Fernandes ER, Matsubara ET. BERT股票市场情绪分析。2020年发表于:2019 IEEE第31届人工智能工具国际会议(ICTAI);2019年11月4日至6日;波特兰,或。［CrossRef]
王涛，陆坤，周鹏平，朱强。新冠肺炎感知:基于BERT模型的中国社交媒体负面情绪分析。IEEE Access 2020 7月28日;8:138162-138169 [免费全文] [CrossRef] [Medline]
Kang H.使用G* power软件进行样本量测定和功率分析。J教育评估卫生教授2021;18:17 [免费全文] [CrossRef] [Medline]
名义比额表的一致系数。教育心理学报，1960;20(1):37-46。［CrossRef]
张志刚，张志刚，张志刚，等。注意力就是你所需的一切2017年发表于:第31届神经信息处理系统国际会议;2017年12月4日至9日;加州长滩p. 6000-6010网址:https://dl.acm.org/doi/pdf/10.5555/3295222.3295349
刘国强，李国强，李国强。高效变压器研究综述。arXiv预印本于2020年9月14日在线发布。［免费全文]
Devlin J, Chang MW, Lee K, Toutanova K. Bert:基于深度双向转换器的语言理解预训练。arXiv预印本于2018年10月11日在线发布。［免费全文]
苏彻R, Perelygin A，吴杰，庄杰，曼宁CD，吴安，等。情感树库语义组合的递归深度模型。2013年发表于:2013年自然语言处理经验方法会议;2013年10月18-21日;西雅图，华盛顿州，1631-1642页https://aclanthology.org/D13-1170.pdf
Hinton G, Vinyals O, Dean J.在神经网络中提炼知识。arXiv预印本于2015年3月9日在线发布。［免费全文]
Buciluǎ C, Caruana R, Niculescu-Mizil A.模型压缩。2006年8月出席KDD06:第十二届ACM SIGKDD知识发现与数据挖掘国际会议;2006年8月20-23日;费城，宾夕法尼亚州535-541页。［CrossRef]
刘勇，Ott M, Goyal N，杜杰，Joshi M，陈东，等。RoBERTa:一种稳健优化的BERT预训练方法。arXiv预印本于2019年7月26日在线发布。［免费全文]
朱勇，基罗斯，泽梅尔，萨拉赫丁诺夫，乌尔塔松，托拉尔巴，等。对齐书籍和电影:通过观看电影和阅读书籍来实现故事式的视觉解释。2016年发表于:2015 IEEE计算机视觉国际会议(ICCV);2015年12月7-13日;圣地亚哥,智利。［CrossRef]
Trinh TH, Le QV。一种简单的常识推理方法。arXiv预印本于2018年6月7日在线发布。［免费全文]
阮德强，吴涛，阮亚平。BERTweet:一个预先训练的英语推文语言模型。arXiv预印本于2020年10月5日在线发布。［免费全文]
登普斯特AP。由多值映射引起的上、低概率。数学统计年鉴1967年4月;38(2):325-339。［CrossRef]
证据的数学理论。普林斯顿，新泽西州:普林斯顿大学出版社;1976.
张志刚，王志刚，王志刚，王志刚，等。使用电子健康记录的自然语言处理测量患者优先级一致护理的采用:模型的开发和验证。JMIR Med Inform 2021年2月19日;9(2):e18756 [免费全文] [CrossRef] [Medline]
Van Rossum G, Drake FL. Python/C Api手册- Python 3:(Python文档手册第4部分). Scotts Valley, CA: CreateSpace;2009.
Wearne T, Osborne-Crowley K, Rosenberg H, Dethier M, McDonald S.情绪识别依赖于主观情绪体验而不是面部表情:创伤性脑损伤的证据。脑注射2018年10月08日;33(1):12-22。［CrossRef] [Medline]
Iqbal M.推特收入和使用统计(2022年)。应用业务。URL:https://www.businessofapps.com/data/twitter-statistics/[2022-11-24]访问
哈曼·M.国家领导人在COVID-19大流行期间使用Twitter及其对公众的影响。Heliyon 2020 11月19日;6(11):e05540 [免费全文] [CrossRef] [Medline]
Chandrasekaran R, Mehta V, Valkunde T, Moustakas E.关于COVID-19大流行的推文主题、趋势和情绪:时间信息监测研究。J Med Internet Res 2020年10月23日;22(10):e22624 [免费全文] [CrossRef] [Medline]
Politis I, Georgiadis G, Kopsacheilis A, Nikolaidou A, Papaioannou P.捕捉covid -19大流行前和中期的推特消极情绪:LDA在伦敦公共交通系统上的应用。可持续发展2021年12月02日;13(23):13356 [免费全文] [CrossRef]
Nota JA, Coles ME。较短的睡眠时间和较长的睡眠开始潜伏期与难以将注意力从消极情绪图像中分离有关。《行为学实验精神病学》2018年3月;58:114-122。［CrossRef] [Medline]
分析推特数据，评估人们对COVID-19时代公共卫生政策和事件的态度。国际环境与公共卫生杂志2021年6月10日;18(12):6272 [免费全文] [CrossRef] [Medline]
Marshall C, Lanyi K, Green R, Wilkins GC, Pearson F, Craig D.使用自然语言处理探索COVID-19大流行期间英国推文中的心理健康见解:信息流行病学研究。JMIR信息病学2022年3月31日;2(1):e32449 [免费全文] [CrossRef] [Medline]

‎

伯特:来自变压器的双向编码器表示

DST:Dempster-Shafer理论

NLP:自然语言处理

或者:优势比

洛蓓塔:基于变压器预训练方法的稳健优化双向编码器表示

G·艾森巴赫(G Eysenbach)编辑;提交28.07.22;同行评议:K Chow, N Bragazzi;对作者27.09.22的评论;修订本收到日期为20.10.22;接受15.11.22;发表27.12.22

©Arash Maghsoudi, Sara Nowakowski, Ritwick Agrawal, Amir Sharafkhaneh, Mark E Kunik, Aanand D Naik, Hua Xu, Javad Razjouyan。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2022年12月27日。

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

基于Dempster-Shafer理论的变形金刚组合对失眠相关推文的情感分析:covid -19大流行前和前后的回顾性研究

基于Dempster-Shafer理论的变形金刚组合对失眠相关推文的情感分析:covid -19大流行前和前后的回顾性研究

原始论文

通讯作者:

摘要

关键字

介绍

方法

研究设计和数据收集

抽样策略与注释

为推文开发情感分析管道

情感分析管道概述

预处理

过程

第一单元:变形金刚

秒单位:DST

后处理:模型评估

统计分析

时序分析

结果

推文的特点

注释

情感分析管道性能

情绪分析

时序分析

讨论

主要研究结果

限制

结论

致谢

利益冲突

参考文献

缩写