JMIR医学信息学-基于情绪的注意力网络在Reddit上的抑郁检测:算法开发和验证gydF4y2Ba

原始论文gydF4y2Ba

陆任gydF4y2Ba^1gydF4y2Ba博士gydF4y2Ba ；gydF4y2Ba
红飞林gydF4y2Ba^1gydF4y2Ba博士gydF4y2Ba ；gydF4y2Ba
波许gydF4y2Ba^{1，gydF4y2Ba}^2gydF4y2Ba博士gydF4y2Ba ；gydF4y2Ba
邵武张gydF4y2Ba^1gydF4y2Ba博士gydF4y2Ba ；gydF4y2Ba
梁杨gydF4y2Ba^1gydF4y2Ba博士gydF4y2Ba ；gydF4y2Ba
石长太阳gydF4y2Ba^3.gydF4y2Ba博士gydF4y2Ba

^1gydF4y2Ba大连理工大学，中国大连gydF4y2Ba

^2gydF4y2Ba南京大学新型软件技术国家重点实验室，南京gydF4y2Ba

^3.gydF4y2Ba大连民族大学，大连，中国gydF4y2Ba

通讯作者:gydF4y2Ba

梁阳博士gydF4y2Ba

大连理工大学gydF4y2Ba

灵工路2号gydF4y2Ba

大连,gydF4y2Ba

中国gydF4y2Ba

电话:86 041184706009gydF4y2Ba

电子邮件:gydF4y2Baliang@dlut.edu.cngydF4y2Ba

背景:gydF4y2Ba抑郁症作为一种常见的精神疾病，严重影响着人们的身心健康。根据世界卫生组织的统计，抑郁症是世界上自杀和自残事件的主要原因之一。因此，加强抑郁症检测可以有效减少自杀或自残事件的发生，从而拯救更多的人和家庭。随着计算机技术的发展，一些研究人员正在尝试应用自然语言处理技术来自动检测抑郁症患者。现有的许多抑郁症特征工程检测方法都是基于情绪特征的，但这些方法没有考虑高层次的情感语义信息。目前的深度学习抑郁症检测方法无法准确提取有效的情感语义信息。gydF4y2Ba

摘要目的:gydF4y2Ba本文提出了一种基于情绪的注意网络，包括语义理解网络和情绪理解网络，该网络可以有效地捕获高层次的情绪语义信息，从而改善抑郁检测任务。gydF4y2Ba

方法:gydF4y2Ba语义理解网络模块用于获取上下文语义信息。情感理解网络模块用于捕获情感语义信息。情绪理解网络模块有两个单元，包括积极情绪理解单元和消极情绪理解单元，分别用于捕获积极情绪信息和消极情绪信息。我们进一步在情绪理解网络模块中提出了积极情绪信息和消极情绪信息的动态融合策略。gydF4y2Ba

结果:gydF4y2Ba我们在Reddit数据集上评估了我们的方法。实验结果表明，基于情绪的注意网络模型的正确率、精密度、查全率和F-measure分别为91.30%、91.91%、96.15%和93.98%，与现有方法相当。gydF4y2Ba

结论:gydF4y2Ba实验结果表明，该模型具有较强的竞争力。语义理解网络模块、情感理解网络模块和动态融合策略是抑郁症检测的有效模块。此外，实验结果验证了情绪语义信息在抑郁检测中的有效性。gydF4y2Ba

中国生物医学工程学报;2011;39 (7):888 - 888gydF4y2Ba

doi: 10.2196/28754gydF4y2Ba

关键字gydF4y2Ba

抑郁症检测gydF4y2Ba；gydF4y2Ba 关注网络gydF4y2Ba；gydF4y2Ba 情感语义信息gydF4y2Ba；gydF4y2Ba 动态融合策略gydF4y2Ba；gydF4y2Ba 自然语言处理gydF4y2Ba；gydF4y2Ba 社交媒体gydF4y2Ba；gydF4y2Ba 情感gydF4y2Ba；gydF4y2Ba 心理健康gydF4y2Ba；gydF4y2Ba 算法gydF4y2Ba；gydF4y2Ba 深度学习gydF4y2Ba

背景gydF4y2Ba

根据免费词典的定义，抑郁指的是抑郁的行为或抑郁的状态。抑郁症通常被认为是一种情绪障碍;抑郁症的主要临床特征是显著且持续的心境抑郁。抑郁症患者的情绪可以从沮丧到悲伤，自卑，甚至悲观，这可能导致自杀企图或行为[gydF4y2Ba1gydF4y2Ba]。世界精神病学协会于1992年将10月10日定为世界精神卫生日，以加强公众对精神障碍的认识。世界卫生组织(世卫组织)发表的最新报告指出[gydF4y2Ba2gydF4y2Ba世界上大约有3.22亿抑郁症患者，患病率约为4.4%。抑郁症患者的数量逐年增长。从2005年到2015年，全球抑郁症患者人数增加了18.4%。根据世界卫生组织的统计[gydF4y2Ba2gydF4y2Ba)，抑郁症是世界上导致自杀的20个主要原因之一，约占自杀人数的1.5%。它也是全球疾病中致残比例最高的疾病，也是全球非致命性健康损失的主要因素。gydF4y2Ba

随着互联网在人们日常生活中的发展，人们开始在社交媒体上分享自己的感受和问题[gydF4y2Ba3.gydF4y2Ba，gydF4y2Ba4gydF4y2Ba]，比如Reddit和Twitter。Park等人[gydF4y2Ba5gydF4y2Ba研究表明，抑郁症患者倾向于在社交媒体上发布有关抑郁症甚至治疗的信息。因此，我们可以从社交媒体中获得很多有价值的信息。如果我们可以根据互联网上的信息判断一个人是否患有抑郁症，这可以帮助医生及早干预，避免自残或自杀的发生。许多来自不同学科的研究者，如计算机科学和心理学，都非常关注这个话题。此外，还提出了一些改进的凹陷检测方法。但是，检测精度还有待提高。gydF4y2Ba

抑郁检测的目标是将一个人或一篇文章分类为抑郁或不抑郁。社交媒体上抑郁症检测的表现有助于抑郁症的临床治疗。这个问题需要解决。抑郁症患者的帖子通常包含强烈的情绪。我们给出了Reddit上留下的三个文本帖子的例子，包括两个指示抑郁的帖子和一个标准帖子，如下所示。gydF4y2Ba

例1:“今天，我感觉糟透了，真想去死。我在工作中出丑，会后又觉得自己很蠢，所以我就请假了，告诉老板我病了。”剩下的一下午都躺在床上。”标签:抑郁gydF4y2Ba
例2:“当你讨厌自己这个人，但又无法让自己改变的感觉，因为过去几年你已经习惯了这样的状态。我变成了一个卑鄙的人。在这一点上，改变对我来说似乎是不可能的。”标签:抑郁gydF4y2Ba
例子3:“寻找酷炫的方式告诉父母我妻子怀孕了。”标签:nondepressiongydF4y2Ba

例1和例2包含了抑郁症患者强烈的情绪信息。例1中，单词包括gydF4y2Ba可怕的gydF4y2Ba，gydF4y2Ba死gydF4y2Ba,gydF4y2Ba愚蠢的gydF4y2Ba，表达了作者强烈的负面情绪。这句话gydF4y2Ba讨厌gydF4y2Ba和gydF4y2Ba较差的gydF4y2Ba例2也表达了作者强烈的负面情绪。例3显示了一个普通用户的帖子。它不包含强烈的负面情绪。如前所述，情绪语义信息通常为我们提供抑郁症检测的有用线索。gydF4y2Ba

我们还统计了Reddit数据集的抑郁指示性帖子和标准帖子中出现的积极词汇和消极词汇的比例[gydF4y2Ba6gydF4y2Ba),分别。统计结果见gydF4y2Ba表1gydF4y2Ba。表中积极情绪词的百分比由gydF4y2Ba。消极情绪词汇的比例相似。此外，我们还计算了抑郁指示帖子和标准帖子中情绪词的百分比。抑郁用户比非抑郁用户使用更多的负面词汇。与此同时，他们在帖子中使用的积极词汇比非抑郁用户少。从统计结果可以看出，情绪语义信息可能在抑郁检测任务中发挥了有效的作用。gydF4y2Ba

表1。情感词在帖子中的百分比。gydF4y2Ba

类别gydF4y2Ba	萧条指示职位(%)gydF4y2Ba	标准职位(%)gydF4y2Ba
积极情绪词汇gydF4y2Ba	8.62gydF4y2Ba	9.41gydF4y2Ba
消极情绪词汇gydF4y2Ba	6.70gydF4y2Ba	4.85gydF4y2Ba

自动检测抑郁症已经取得了一些进展。现有的许多模型都是基于特征工程来检测抑郁的，如词袋[gydF4y2Ba7gydF4y2Ba，gydF4y2Ba8gydF4y2Ba]、潜在狄利克雷分配(LDA) [gydF4y2Ba9gydF4y2Ba，gydF4y2Ba10gydF4y2Ba]， N-gram [gydF4y2Ba11gydF4y2Ba]、语言探究与字数统计(LIWC)字典[gydF4y2Ba12gydF4y2Ba]，或它们的组合[gydF4y2Ba4gydF4y2Ba，gydF4y2Ba13gydF4y2Ba，gydF4y2Ba14gydF4y2Ba]。词袋、LDA和N-gram在自然语言处理(NLP)中被广泛应用于特征提取，并取得了很大进展。LIWC可以对文本内容的词类(尤其是心理词)进行定量分析，包括情感、情感等。LIWC提取的情绪在抑郁检测任务中经常被用到。随着深度学习在自然语言处理领域的发展，越来越多的研究将深度学习模型用于抑郁症检测。Orabi等[gydF4y2Ba15gydF4y2Ba提出了一种基于深度学习(卷积神经网络[CNN]和递归神经网络[RNN])的抑郁症检测方法。Gui等[gydF4y2Ba16gydF4y2Ba提出了一种基于RNN的强化学习方法用于抑郁症检测。虽然这些基于深度学习的高级模型可以提取更高层次的语义信息，并取得了很大进展，但它们仍然缺乏对情感语义信息的有效提取。这可能会限制他们的模型的能力，因为情绪信息可能会为抑郁检测带来有效的线索，如例子1和2所示。gydF4y2Ba

在介绍我们的模型之前，为了更方便地理解我们的论文，我们给出了几个概念的定义，包括高级情感语义信息、语义理解网络(SUN)、情感理解网络(EUN)和动态融合策略。gydF4y2Ba

高级情感语义信息是指深度学习所捕获的情感语义信息。gydF4y2Ba
SUN是一种深度学习方法，用于捕获文本中的上下文语义信息以进行抑郁检测。gydF4y2Ba
EUN是一种深度学习方法，用于捕获文本中的情感语义信息，用于抑郁症检测。gydF4y2Ba
动态融合策略是指一种能够动态融合积极情绪信息和消极情绪信息的融合策略。gydF4y2Ba

为了有效地提取情绪信息，我们提出了一种基于情绪的注意力网络(EAN)用于抑郁检测。我们的EAN模型主要包括SUN和EUN两个模块。SUN模块用于获取上下文语义信息，在自然语言处理中得到了广泛的应用。我们使用EUN模块来捕捉情绪信息，因为如前所述，情绪信息对于抑郁症的检测起着重要的作用。如图所示gydF4y2Ba表1gydF4y2Ba抑郁指示性帖子中消极词汇较多，积极词汇较少;标准帖子中消极词汇较少，积极词汇较多。因此，我们设计了EUN模块。EUN模块包含两个单元，积极情绪理解单元和消极情绪理解单元，分别用于提取积极情绪信息和消极情绪信息。此外，我们还在EUN模块中提出了积极情绪信息与消极情绪信息的动态融合策略。gydF4y2Ba

本文的主要贡献可以概括为以下几点:gydF4y2Ba

我们提出了一种新的深度学习框架用于抑郁症检测。我们还设计了一个专门的模块来显式提取抑郁症检测的高级情绪信息。gydF4y2Ba
我们同时考虑了积极情绪信息和消极情绪信息。同时，采用动态融合策略将积极情绪信息与消极情绪信息进行融合。gydF4y2Ba
我们在Reddit数据集上进行抑郁症检测实验。实验表明，我们的模型可以达到最先进或相当的性能。烧蚀实验也验证了模型中所提出组件的有效性。gydF4y2Ba

数据集gydF4y2Ba

作为一种新兴的社交媒体，Reddit已经成为一个广受欢迎的网络讨论论坛。Reddit用户可以在这个基于网络的平台上匿名讨论各种话题。在这个平台上讨论的话题可以被安排在100多万个讨论组中。由于Reddit上有大量的讨论文本，吸引了很多研究者利用Reddit平台上的数据进行研究。Pirina和Çöltekin [gydF4y2Ba6gydF4y2Ba]建立了一个基于Reddit的抑郁症检测数据集，并将其命名为Reddit数据集。Reddit数据集中的样本[gydF4y2Ba6gydF4y2Ba都是从Reddit平台收集的。Reddit数据集[gydF4y2Ba6gydF4y2Ba]包括洼地指示岗位1293个，标准岗位549个。gydF4y2Ba

我们对Reddit数据集进行预处理，例如删除停止词。然后，我们统计了萧条指示帖子和标准帖子中每个单词的出现次数。我们根据统计数据对单词进行排序，并显示单词列表的顶部gydF4y2Ba图1gydF4y2Ba。统计抑郁指示性岗位和标准岗位的积极情绪词和消极情绪词的出现次数。在所有词中，出现频率较高的积极情绪词和消极情绪词也显示在gydF4y2Ba文本框1gydF4y2Ba。gydF4y2Ba

如图所示gydF4y2Ba文本框1gydF4y2Ba，从抑郁用户最常用的词汇中，我们可以看到许多负面词汇也包含在最常用的词汇中，如抑郁或他妈的。非抑郁症患者最常用的词汇是日常生活中常用的词汇。从抑郁症用户使用频率高的负面词汇列表中可以看出，抑郁症用户使用的负面词汇比非抑郁症用户帖子中出现的负面词汇更为强烈，如suicide、die、kill、hate。gydF4y2Ba

图1所示。基于情绪的注意网络模型的结构。我们的模型有两个部分，包括SUN和EUN。双向长短期记忆。gydF4y2Ba

数据分析。gydF4y2Ba

Depression-indicative帖子gydF4y2Ba

所有文字:我，像，感觉，想要，得到，知道，甚至，真的，人，生活，我，一个，时间，想，不会，永远，抑郁，我，不能，去，去，事情，不要，很多，朋友，做，好，它，仍然，可以，回来，任何人，年，任何东西，总是，每，得到，某人，操，帮助，一天，看到，某件事，工作，曾经，需要，感觉，一切，谈话，年gydF4y2Ba
积极的:朋友，好，工作，帮助，更好，快乐，工作，爱，努力，朋友，家庭，关心，想要，最好，睡眠，确定，自我，思想，理解，新的，精神的，希望，社会，金钱，高，记住，工作，原因，好，亲密，真实，在一起，伟大，正常，交易，相信，改变，享受，生日，诚实，好，动机，建议，爱，治疗师，幸福，乐趣，男朋友，说，大gydF4y2Ba
消极的:抑郁，抑郁，坏的，他妈的，什么都没有，孤独，讨厌，狗屎，停止，失去，更糟，焦虑，他妈的，疲倦，悲伤，死亡，自杀，杀死，关系，错误，痛苦，自杀，问题，老，抱歉，哭泣，孤独，治疗，伤害，愚蠢，不断，问题，生病，哭泣，问题，害怕，奇怪，reddit，医院，最糟糕，悬挂，疾病，死亡，害怕，黑暗，破碎，糟糕，破产，悲惨，死亡gydF4y2Ba

标准的帖子gydF4y2Ba

所有文本:像，我，知道，朋友，会，感觉，真的，朋友，想要，时间，得到，一个，甚至，说，总是，从来，告诉，得到，家庭，去，事情，我，想，最好，做，妈妈，去，人，年，谈话，也，仍然，回来，一些，很多，看到，说，可以，我，爸爸，告诉，既然，不要，开始，我们，我，它，制造，帮助，父母gydF4y2Ba
积极的:朋友，朋友，家庭，最好的，姐妹，帮助，友谊，工作，兄弟，好，新的，确定，爱，想要，说，在一起，建议，父亲，亲密，钱，男朋友，孩子，关心，努力，更好，疯狂，理解，工作，基本，快乐，伟大，交易，孩子，高，感动，相信，乐趣，社交，思想，婴儿，谈话，最终，原因，结婚，大，改变，花费，真实，正常，美好gydF4y2Ba
消极的:坏的，错的，什么都没有，老的，挂，问题，停止，伤害，难过，难过，讨厌，问题，失去，孤独，切割，愤怒，讨厌，问题，更糟，抑郁，奇怪，生病，不断，焦虑，悲伤，疲倦，烦恼，破产，婊子，害怕，死亡，地狱，害怕，哭泣，癌症，有毒，忽视，怀孕，失去，困难，等待，错误，沮丧，可怕，尴尬，自私，回复，他妈的，困惑，redditgydF4y2Ba

文本框1。数据分析。gydF4y2Ba

EAN模型概述gydF4y2Ba

在本节中，我们简要介绍提出的抑郁症检测模型，称为EAN，如图所示gydF4y2Ba图1gydF4y2Ba。提出的EAN模型主要包括SUN和EUN两部分。SUN模块用于捕获抑郁指示帖子中的上下文语义信息。EUN模块用于捕捉抑郁指示岗位的情感语义信息。最后，我们将两部分捕获的特征连接起来，并通过抑郁检测器判断文本是否具有抑郁指示性。接下来我们将详细介绍SUN、EUN和损失函数。gydF4y2Ba

语义理解网络gydF4y2Ba

使用SUN捕获文本中的上下文语义信息进行抑郁检测。SUN模块有三层，包括词编码层、上下文编码层和注意机制(Att)层。我们将更详细地介绍这三层。gydF4y2Ba

字编码层gydF4y2Ba

我们将简要介绍SUN模块中的单词编码层。我们任务的输入是文本。文本可以表示为w = {gydF4y2BawgydF4y2Ba_1gydF4y2Ba，gydF4y2BawgydF4y2Ba_2gydF4y2Ba、……gydF4y2BawgydF4y2Ba_ngydF4y2Ba}，其中n表示文本的长度，和gydF4y2BawgydF4y2Ba_我gydF4y2Ba表示文本中的单词。在NLP任务中，单词通常被映射到单词向量的形式。受其启发，我们也将每个单词编码成d维单词向量。我们将预训练的全局向量用于单词表示(GloVe) [gydF4y2Ba31gydF4y2Ba]。然后我们可以得到文本表示S =gydF4y2BaRgydF4y2Ba^ngydF4y2Ba^×gydF4y2Ba^dgydF4y2Ba，其中n为文本长度，d为单词的维数。gydF4y2Ba

上下文编码层gydF4y2Ba

上下文编码层用于获取上下文信息。双向长短期记忆[gydF4y2Ba32gydF4y2Ba]在NLP任务中被广泛用于捕捉上下文信息。受此启发，我们在上下文编码层应用了Bi-LSTM。双LSTM包括正向LSTM和反向LSTM。输出gydF4y2BaBi-LSTM包括两个部分，其中一个是前向LSTM输出gydF4y2Ba和后向LSTM输出gydF4y2Ba。gydF4y2Ba

LSTM由Hochreiter和Schmidhuber提出[gydF4y2Ba33gydF4y2Ba]，用来捕捉文本中的转发信息。LSTM不能捕获反向信息;因此，提出了Bi-LSTM。LSTM有三个门和一个单元，包括一个输入门gydF4y2Ba我gydF4y2Ba_tgydF4y2Ba遗忘门gydF4y2BafgydF4y2Ba_tgydF4y2Ba，输出门gydF4y2BaogydF4y2Ba_tgydF4y2Ba，以及一个存储单元gydF4y2BacgydF4y2Ba_tgydF4y2Ba。LSTM的操作如下。gydF4y2Ba

在哪里gydF4y2BaxgydF4y2Ba_tgydF4y2Ba是当前输入的词向量，gydF4y2Ba表示元素乘法运算，和gydF4y2BaσgydF4y2Ba表示s型函数。gydF4y2BaWgydF4y2Ba_fgydF4y2Ba，gydF4y2BaWgydF4y2Ba_我gydF4y2Ba，gydF4y2BaWgydF4y2Ba_cgydF4y2Ba,gydF4y2BaWgydF4y2Ba_ogydF4y2Ba表示在训练过程中可以训练的参数。gydF4y2BahgydF4y2Ba_tgydF4y2Ba是隐藏状态向量。gydF4y2Ba为LSTM的输出。有关LSTM的更多详情，请参阅Hochreiter和Schmidhuber [gydF4y2Ba33gydF4y2Ba]， Bi-LSTM的输出为H = [gydF4y2BaHgydF4y2Ba_1gydF4y2Ba，gydF4y2BaHgydF4y2Ba2,…HgydF4y2Ba_ngydF4y2Ba]。gydF4y2Ba

注意机制层gydF4y2Ba

Att层的输入为H = [gydF4y2BaHgydF4y2Ba_1gydF4y2Ba，gydF4y2BaHgydF4y2Ba_2gydF4y2Ba、……gydF4y2BaHgydF4y2Ba_ngydF4y2Ba]。Att用于为重要单词分配更高的权重。在抑郁检测任务中，我们应用Att来捕获抑郁指示帖子中的重要词。Att的运算基于以下方程:gydF4y2Ba

在哪里gydF4y2BaHgydF4y2Ba_我gydF4y2Ba为Bi-LSTM的隐藏状态向量，gydF4y2BawgydF4y2Ba和gydF4y2Ba问gydF4y2Ba_我gydF4y2Ba是加权矩阵吗gydF4y2BahgydF4y2Ba_{丙氨酸gydF4y2Ba}是Att的输出。gydF4y2Ba

情绪理解网络gydF4y2Ba

许多研究论文[gydF4y2Ba19gydF4y2Ba-gydF4y2Ba21gydF4y2Ba他们的实验证明了情绪特征在抑郁检测任务中的有效性。受此启发，我们考虑了基于EUN的抑郁指示帖子中的高级情感语义信息。利用EUN捕获文本中的情感语义信息进行抑郁检测。EUN模块有三层，分别是输入层、情感编码层和情感融合层。我们将在下面几节中更详细地介绍这三层。gydF4y2Ba

输入层gydF4y2Ba

在本节中，我们将介绍EUN模块的输入。输入包括积极情绪部分和消极情绪部分。我们采用SenticNet应用程序编程接口，将原始文本划分为积极情感部分和消极情感部分。这两个情感部分也被映射到一个词向量矩阵中，就像在SUN模块的词编码层中一样gydF4y2BaRgydF4y2Ba_posgydF4y2Ba和gydF4y2BaRgydF4y2Ba_{负的gydF4y2Ba},分别。gydF4y2Ba

情绪编码层gydF4y2Ba

情绪编码层是对积极情绪信息和消极情绪信息进行编码。gydF4y2BaRgydF4y2Ba_posgydF4y2Ba和gydF4y2BaRgydF4y2Ba_{负的gydF4y2Ba}作为情感编码层的输入。情绪编码层有两个单元，包括积极情绪理解单元和消极情绪理解单元。这两个单元分别用来捕捉积极情绪信息和消极情绪信息。我们还应用Bi-LSTM来捕捉语境情感信息，并应用Att来捕捉两个单元文本中的重要情感。Bi-LSTM和Att的操作与EUN模块相同。我们可以得到gydF4y2BahgydF4y2Ba_posgydF4y2Ba从积极情绪理解单元和gydF4y2BahgydF4y2Ba_{负的gydF4y2Ba}从消极情绪理解单元。gydF4y2Ba

情感融合层gydF4y2Ba

情绪融合层的目的是融合积极情绪信息和消极情绪信息，用于抑郁检测。我们得到了积极的情感信息gydF4y2BahgydF4y2Ba_posgydF4y2Ba消极的情绪信息gydF4y2BahgydF4y2Ba_{负的gydF4y2Ba}从情感编码层，可以在训练处理中学习。考虑到每个文本的差异，我们设计了一种动态融合策略，可以动态融合积极情绪信息gydF4y2BahgydF4y2Ba_posgydF4y2Ba消极的情绪信息gydF4y2BahgydF4y2Ba_{负的gydF4y2Ba}。受Att的启发，我们设计了一个随机浮点数θ∈[0,1]。可以在培训过程中进行培训。我们可以得到输出gydF4y2BahgydF4y2Ba_{情绪摇滚gydF4y2Ba}EUN模块的计算公式如下:gydF4y2Ba

hgydF4y2Ba_{情绪摇滚gydF4y2Ba}= θ *gydF4y2BahgydF4y2Ba_posgydF4y2Ba+ (1 - θ) *gydF4y2BahgydF4y2Ba_{负的gydF4y2Ba} （10）gydF4y2Ba

损失函数gydF4y2Ba

如前所述，我们获得上下文语义信息gydF4y2BahgydF4y2Ba_{丙氨酸gydF4y2Ba}从SUN模块和情感语义信息gydF4y2BahgydF4y2Ba_{情绪摇滚gydF4y2Ba}从EUN模块。在本节中，我们应用了一个连接操作来融合上下文语义信息gydF4y2BahgydF4y2Ba_{丙氨酸gydF4y2Ba}情感语义信息gydF4y2BahgydF4y2Ba_{情绪摇滚gydF4y2Ba}作为最终的表现gydF4y2BafgydF4y2Ba_{最后gydF4y2Ba}：gydF4y2Ba

fgydF4y2Ba_{最后gydF4y2Ba}=连接(gydF4y2BahgydF4y2Ba_{丙氨酸gydF4y2Ba}；gydF4y2BahgydF4y2Ba_{情绪摇滚gydF4y2Ba}]gydF4y2Ba（11）gydF4y2Ba

因此，抑郁症检测的最终分类决策由softmax函数表示:gydF4y2Ba

y = softmax(W∙gydF4y2BafgydF4y2Ba_{最后gydF4y2Ba}+ b)gydF4y2Ba（12）gydF4y2Ba

在我们的模型中，交叉熵损失用于抑郁检测。训练的目标是尽量减少损失。gydF4y2Ba

实现细节和度量标准gydF4y2Ba

我们实验中Bi-LSTM的单位大小为64。我们在词编码层应用了预训练的300维词嵌入(GloVe)。此外，优化函数为Adam，批大小为128。继Tadesse等人[gydF4y2Ba4gydF4y2Ba]，我们还在实验中应用了10倍交叉验证;数据集中90%的帖子被用作我们的训练集，另外10%的帖子被用作测试集。gydF4y2Ba

我们采用标准指标，包括准确性、精密度、召回率和f1评分，来评估我们的抑郁症检测模型的有效性。F1定义如下:gydF4y2Ba

与现有方法的比较gydF4y2Ba

我们将模型的结果与Reddit数据集上许多最先进的方法进行了比较。我们将其与基线进行比较，包括LIWC、LDA、unigram、bigram、LIWC + LDA + unigram、LIWC + LDA + bigram [gydF4y2Ba4gydF4y2Ba]、LSTM、Bi-LSTM和Bi-LSTM + Att。gydF4y2Ba

LIWC: Tadesse等[gydF4y2Ba4gydF4y2Ba]基于LIWC提取语言特征和心理特征[gydF4y2Ba34gydF4y2Ba进行抑郁检测。gydF4y2Ba
LDA: Tadesse等[gydF4y2Ba4gydF4y2Ba]基于LDA提取主题的70维特征。它可以帮助发现其潜在的主题结构，以进行抑郁症检测。gydF4y2Ba
图:Tadesse等[gydF4y2Ba4gydF4y2Ba]基于项频率-逆文档频率(TF-IDF)的一元图提取3000维特征用于凹陷检测。gydF4y2Ba
图表:Tadesse等[gydF4y2Ba4gydF4y2Ba]在TF-IDF中基于二元图提取2736维特征用于抑郁症检测。gydF4y2Ba
LIWC + LDA + unigram:该模型基于上述特征，包括LIWC、LDA和unigram，进行抑郁检测。gydF4y2Ba
LIWC + LDA + bigram:该模型基于上述特征，包括LIWC、LDA和bigram，进行抑郁检测。gydF4y2Ba
LSTM: LSTM由Hochreiter和Schmidhuber提出[gydF4y2Ba33gydF4y2Ba]。我们在本文中使用了相同的词嵌入，单位大小为128。gydF4y2Ba
Bi-LSTM: Bi-LSTM由Graves等人提出[gydF4y2Ba32gydF4y2Ba]。我们在本文中采用了相同的设置和相同的词嵌入。gydF4y2Ba
Bi-LSTM + Att:基于Bi-LSTM和Att的模型。gydF4y2Ba
EAN:本文提出了基于深度学习的情感语义信息模型。gydF4y2Ba

如图所示gydF4y2Ba表2gydF4y2Ba，基于深度学习的结果通常高于基于特征工程方法的结果。这是因为深度学习可以捕获文本的高级语义信息。此外，我们还可以得到以下结论。gydF4y2Ba

基于双图(bigram和LIWC + LDA + bigram)的结果高于单图(ungram和LIWC + LDA + ungram)。可以得出结论，上下文信息可以改善模型的结果。基于Bi-LSTM的结果高于LSTM。由此可见，考虑双向语境语义信息是必要的。基于Bi-LSTM + Att的结果高于Bi-LSTM;结果表明，该方法对抑郁检测任务是有效的。EAN模型由于同时考虑了上下文语义信息和情感语义信息，得到了较高的结果。gydF4y2Ba

表2。结果与现有模型进行了比较。gydF4y2Ba

模型gydF4y2Ba	精度(%)gydF4y2Ba	精度(%)gydF4y2Ba	回忆(%)gydF4y2Ba	F1 (%)gydF4y2Ba
LIWCgydF4y2Ba^{a、bgydF4y2Ba}	70gydF4y2Ba	74gydF4y2Ba	71gydF4y2Ba	72gydF4y2Ba
乔治。gydF4y2Ba^{b, cgydF4y2Ba}	75gydF4y2Ba	75gydF4y2Ba	72gydF4y2Ba	74gydF4y2Ba
UnigramgydF4y2Ba^bgydF4y2Ba	70gydF4y2Ba	71gydF4y2Ba	95gydF4y2Ba	81gydF4y2Ba
三元gydF4y2Ba^bgydF4y2Ba	79gydF4y2Ba	80gydF4y2Ba	76gydF4y2Ba	78gydF4y2Ba
LIWC + LDA + ungramgydF4y2Ba^bgydF4y2Ba	78gydF4y2Ba	84gydF4y2Ba	79gydF4y2Ba	81gydF4y2Ba
LIWC + LDA + bigramgydF4y2Ba^bgydF4y2Ba	91gydF4y2Ba	90gydF4y2Ba	92gydF4y2Ba	91gydF4y2Ba
LSTMgydF4y2Ba^dgydF4y2Ba	87.03gydF4y2Ba	90.30gydF4y2Ba	91.67gydF4y2Ba	90.98gydF4y2Ba
Bi-LSTMgydF4y2Ba^egydF4y2Ba	86.46gydF4y2Ba	88.08gydF4y2Ba	95gydF4y2Ba	91.41gydF4y2Ba
Bi-LSTM + AttgydF4y2Ba^fgydF4y2Ba	88.59gydF4y2Ba	90.41gydF4y2Ba	94.96gydF4y2Ba	92.63gydF4y2Ba
EANgydF4y2Ba^ggydF4y2Ba(我们的模型)gydF4y2Ba	91.3gydF4y2Ba	91.91gydF4y2Ba	96.15gydF4y2Ba	93.98gydF4y2Ba

^{一个gydF4y2Ba}语言探究与字数统计。gydF4y2Ba

^bgydF4y2Ba表示结果已在文献[gydF4y2Ba4gydF4y2Ba]。gydF4y2Ba

^cgydF4y2BaLDA:潜在狄利克雷分配。gydF4y2Ba

^dgydF4y2BaLSTM:长短期记忆。gydF4y2Ba

^egydF4y2BaBi-LSTM:双向长短期记忆。gydF4y2Ba

^fgydF4y2Ba注意机制。gydF4y2Ba

^ggydF4y2BaEAN:基于情感的注意网络。gydF4y2Ba

详细分析gydF4y2Ba

在本节中，我们分析了两个模块(SUN和EUN)的有效性，不同情感语义信息的有效性以及动态融合策略的有效性。gydF4y2Ba

SUN和EUN的有效性gydF4y2Ba

为了验证SUN和EUN的有效性，我们设计了一系列的实验。SUN是指不含EUN模块的EAN模型。EUN是指没有SUN模块的EAN模型。如图所示gydF4y2Ba图2gydF4y2Ba， EUN模块的结果最差。这是因为该模型只考虑了情感语义信息，没有考虑完整的语义信息。验证了所设计的SUN模块的有效性。EAN模型的计算结果高于SUN模型，进一步验证了我们的EUN模型的有效性。gydF4y2Ba

图2。SUN和un的有效性。EAN:基于情绪的注意网络;EUN:情感理解网络;SUN:语义理解网络。gydF4y2Ba

不同情绪语义信息的有效性gydF4y2Ba

为了验证不同情绪语义信息的有效性，我们设计了一系列实验，包括无情绪(SUN)、无积极情绪(SUN +消极)和无消极情绪(SUN +积极)。如图所示gydF4y2Ba图3gydF4y2Ba， SUN +阳性模型和SUN模块的结果相似。这表明积极情绪对模型的影响较小。EAN模型虽然没有得到最好的召回值，但得到了最好的召回值gydF4y2BaPgydF4y2Ba值、ACC值和F1值。实验结果表明，本文提出的EAN模型与上述三种基线模型相比效果最好。并验证了框架中每个模块的有效性。gydF4y2Ba

图3。不同情感语义信息的有效性。Acc:精度;EAN:基于情绪的注意网络;P:精度;R:召回;SUN:语义理解网络。gydF4y2Ba

动态融合策略的有效性gydF4y2Ba

为了验证动态融合策略的有效性，我们设计了一系列实验，包括串联融合策略的EAN模型、固定融合策略的EAN模型和动态融合策略的EAN模型。EAN (concatenate fusion)模型将连接操作应用于情感融合策略。EAN(固定融合)模型将固定融合操作应用于情感融合层。方程10中的θ固定为0.5。EAN(动态融合)模型是本文提出的模型。如图所示gydF4y2Ba图4gydF4y2Ba动态融合的效果最好。gydF4y2Ba

在本节中，我们设计了一系列实验来验证EAN模型的有效性，包括EAN模型中的两个模块，不同的情感语义信息，以及动态融合方法。gydF4y2Ba

一些θ的可视化结果直观地说明了所提出的动态融合策略的有效性gydF4y2Ba图5gydF4y2Ba。如图所示gydF4y2Ba图5gydF4y2Ba，这两个例子都是预示萧条的职位。饼状图表示动态融合策略中θ的值。从结果可以看出，在抑郁指示性岗位中，负面情绪信息可以得到更多的关注。gydF4y2Ba

图4。动态融合策略的有效性。Acc:精度;EAN:基于情绪的注意网络;P:精度;接待员:召回。gydF4y2Ba

结论gydF4y2Ba

抑郁症越来越受到人们和组织的关注。随着计算机技术的发展，一些研究人员正在尝试使用计算机自动识别抑郁症患者。在本文中，我们提出了一个EAN模型来明确地提取抑郁检测任务的高级情绪信息。提出的EAN模型由SUN和EUN组成。在该模型中，我们同时考虑了积极情绪信息和消极情绪信息。同时，采用动态融合策略对积极情绪信息和消极情绪信息进行融合。实验结果验证了情绪语义信息在抑郁症检测中的有效性。gydF4y2Ba

未来的工作gydF4y2Ba

根据世界卫生组织的统计，抑郁症是世界上自杀的主要原因之一。我们将集中讨论抑郁症和自杀之间的关系。我们将在未来的工作中尝试将自杀检测与抑郁检测结合起来，通过多任务学习来提高这两个任务的表现。此外，今后的工作将结合自我报告的抑郁症状或临床诊断。希望我们的研究能为医疗卫生领域提供一定的技术支持。gydF4y2Ba

致谢gydF4y2Ba

国家自然科学基金(No. 62076046, 61632011, 62006034, 61876031)、教育部人文社会科学项目(No. 19YJCZH199)、新型软件技术国家重点实验室(南京大学;不。KFKT2021B07)，中央高校基本科研业务费专项资助项目(No.;DUT21RC(3) 015)。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

参考文献gydF4y2Ba

抑郁症是全世界致残的主要原因。中国医学杂志2017年4月18日;317(15):1517。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
抑郁症和其他常见精神障碍:全球卫生估计。世界卫生组织，2017。URL:gydF4y2Bahttps://apps.who.int/iris/bitstream/handle/10665/254610/WHO-MSD-MER-2017.2-eng.pdfgydF4y2Ba[2021-06-28]访问gydF4y2Ba
Hussain J, Satti FA, Afzal M, Khan WA, Bilal HSM, Ansaar MZ，等。探索社交媒体对抑郁症检测的主导特征。中国生物医学工程学报，2019,31(6):739-759。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
李建平，林宏，徐斌，杨玲。社交媒体论坛Reddit中抑郁相关帖子的检测。IEEE Access 2019;7:44883-44893。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
Park M, Cha C, Cha M.推特上用户的抑郁情绪。2012年发表于:ACM SIGKDD医疗信息研讨会(HI-KDD);2012年8月12日至16日;北京,中国。gydF4y2Ba
Pirina I， Çöltekin Ç。在reddit上识别抑郁症:训练数据的影响。2018 EMNLP研讨会SMM4H:第三届健康应用社交媒体挖掘研讨会&共享任务;2018年10月;布鲁塞尔，比利时，第9-12页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
纳迪姆·m在推特上识别抑郁症。出来了。2016年7月25日在线预印本[gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
Paul S, Kalyani JS, Basu T.使用有效的机器学习框架在社交媒体上早期发现厌食症和抑郁症的迹象。2018年出席:CLEF 2018;2018年9月10日至14日;阿维尼翁，法国第1-9页。gydF4y2Ba
maupomerod, Meurs MJ。利用社交媒体内容的话题提取进行抑郁症的早期发现。2018年出席:CLEF 2018;2018年9月10日至14日;阿维尼翁，法国，2125页。gydF4y2Ba
张建军，张建军，张建军，张建军。基于微博的微博抑郁相关语言监督话题建模研究。2015，中文信息学报(自然科学版);2015年6月5日;科罗拉多州丹佛市体育中心[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
潘丽娟，李丽娟。基于社交媒体文本的心理健康多任务学习研究。出来了。2017年12月10日在线预印本[gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
郭晓明，王晓明，王晓明，等。从注意力缺陷多动障碍到情感障碍:通过自我诊断分析推特上的心理健康语言。2015年出席:第二届计算语言学与临床心理学研讨会:从语言信号到临床现实;2015年6月5日;科罗拉多州丹佛，第1-10页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
Wolohan JT, Hiraga M, Mukherjee A, Sayyed ZA。主题限制文本中抑郁的语言痕迹检测:用NLP处理自我污名化抑郁。2018年发表于:第一届语言认知与计算模型国际研讨会;2018年8月20日;圣达菲，新墨西哥，第11-21页。gydF4y2Ba
Tyshchenko Y.基于博客文章数据的抑郁和焦虑检测。核心。2018.URL:gydF4y2Bahttps://core.ac.uk/download/pdf/237085027.pdfgydF4y2Ba[2021-06-28]访问gydF4y2Ba
Orabi AH, Buddhitha P, Orabi MH, Inkpen D.基于深度学习的Twitter用户抑郁检测。第五届计算语言学与临床心理学研讨会:从键盘到临床;2018年6月;新奥尔良，洛杉矶，第88-97页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
桂婷，张强，朱磊，周霞，彭明，黄霞。基于强化学习的社交媒体抑郁检测。编辑:孙明，黄旭，季宏，刘志，刘勇。中文计算语言学第十八届全国学术会议，CCL 2019，中国昆明，2019年10月18-20日，论文集。可汗:施普林格;2019.gydF4y2Ba
De Choudhury M, Gamon M, Counts S, Horvitz E.社交媒体对抑郁症的预测。2013年发表于:第七届国际AAAI博客和社交媒体会议;2013年7月8-11日;剑桥，麻萨诸塞州第1-10页。gydF4y2Ba
张建军，张建军，张建军，等。推特用户的认知差异研究。2013，第七届AAAI网络日志与社交媒体学术会议;2013年7月8-11日;马萨诸塞州,剑桥。gydF4y2Ba
姜坤，尹成，金英英。使用多模态分析识别twitter中的抑郁用户。2016年演讲:大数据与智能计算国际会议(BigComp);2016年1月18-20日;中国香港，第231-238页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
Borth D, Ji R, Chen T, Breuel T, Chang SF。基于形容词名词对的大规模视觉情感本体和检测器。第21届ACM国际多媒体会议论文集。2013，发表于:MM '13;2013年10月21-25日;西班牙巴塞罗那。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
沈刚，贾军，聂磊，冯峰，张超，胡涛，等。通过收集社交媒体来检测抑郁症:一个多模态字典学习解决方案。第26届国际人工智能联合会议论文集。2017提交于:IJCAI-17;2017年8月19日至25日;澳大利亚墨尔本3838-3844页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
平贺M.预测日本博客文本的抑郁。发表于:ACL 2017，学生研究研讨会;2017年7月;加拿大温哥华，第107-113页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
Shneidman ES。自杀是一种精神病。中华神经病学杂志1993;18(3):145-147。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
De Choudhury M, Kiciman E, Dredze M, Coppersmith G, Kumar M.社交媒体中心理健康内容对自杀意念的影响。参见:2016年CHI计算系统中人因会议论文集。2016年发表于:CHI '16;2016年5月7-12日;圣何塞，CA p. 2098-2110。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
刘建军，刘建军。网络论坛中抑郁与自残风险评估。出来了。2017年9月6日在线预印本[gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
李建军，张建军，张建军，等。中国互联网风险预测研究进展[j]。In: Jones GJF, Lawless S, Gonzalo J, Kelly L, Goeuriot L, Mandl T，等，编辑。实验IR满足多语言、多模态和互动第八届CLEF协会国际会议，CLEF 2017，爱尔兰都柏林，2017年9月11-14日，论文集。可汗:施普林格;2017.gydF4y2Ba
Trotzek M, Koitka S, Friedrich CM。利用神经网络和语言元数据在文本序列中早期检测抑郁迹象。IEEE Trans Knowledge Data engineering 2020, vol . 1;32(3):588-601。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
张建军，张建军，张建军，等。基于风险预测的互联网风险预测研究综述。1 . Crestani F, Braschler M, Savoy J, Rauber A, m ller H, Losada DE，等，编辑。实验IR满足多语言，多模态和互动:第10届CLEF协会国际会议，CLEF 2019，瑞士卢加诺，2019年9月9-12日，会议录。可汗:施普林格;2019.gydF4y2Ba
宋海，游杰，钟建伟，朴成杰。特征注意网络:来自社交媒体的可解释抑郁检测。2018年发表于:第32届亚太语言、信息和计算会议;2018年12月1日至3日;中国香港。gydF4y2Ba
张建军，张建军，李建军，等。基于文本、音频和视频的多层次注意力网络对抑郁症的预测。第9届国际视听情感挑战与研讨会论文集，2019年，AVEC '19;2019年10月21日;法国尼斯，第81-88页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
彭宁顿J, Socher R, Manning C. GloVe:基于全局向量的词表示。参见:2014年自然语言处理经验方法会议论文集。2014年发表于:EMNLP '14;2014年10月;卡塔尔多哈1532-1543页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
李建军，李建军，李建军，等。基于深度双向LSTM的混合语音识别。2013年IEEE自动语音识别与理解研讨会;2013年12月8-12日;捷克共和国奥洛穆茨第273-278页。［gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
张建军，张建军，张建军，等。神经网络计算1997;11月15日;9(8):1735-1780。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
Pennebaker JW, Booth RJ, Boyd RL, Francis ME。语言探究与字数统计:LIWC2015。Pennebaker集团，2001。URL:gydF4y2Bahttp://downloads.liwc.net.s3.amazonaws.com/LIWC2015_OperatorManual.pdfgydF4y2Ba[2021-06-28]访问gydF4y2Ba

‎gydF4y2Ba

丙氨酸:gydF4y2Ba注意机制gydF4y2Ba

Bi-LSTM:gydF4y2Ba双向长短期记忆gydF4y2Ba

谱号eRISK:gydF4y2Ba早期风险预测评估论坛会议与实验室gydF4y2Ba

有线电视新闻网:gydF4y2Ba卷积神经网络gydF4y2Ba

EAN:gydF4y2Ba基于情绪的注意网络gydF4y2Ba

恩:gydF4y2Ba情绪理解网络gydF4y2Ba

手套:gydF4y2Ba单词表示的全局向量gydF4y2Ba

LDA:gydF4y2Ba潜在狄利克雷分配gydF4y2Ba

LIWC:gydF4y2Ba语言探究与字数统计gydF4y2Ba

LSTM:gydF4y2Ba长短期记忆gydF4y2Ba

NLP:gydF4y2Ba自然语言处理gydF4y2Ba

RNN:gydF4y2Ba循环神经网络gydF4y2Ba

太阳:gydF4y2Ba语义理解网络gydF4y2Ba

TF-IDF:gydF4y2Ba术语频率-逆文档频率gydF4y2Ba

人:gydF4y2Ba世界卫生组织gydF4y2Ba

编辑:郝涛、黄志、唐斌;提交13.03.21;钱涛、韩杰同行评议;对作者05.05.21的评论;收到订正版本11.05.21;接受19.05.21;发表16.07.21gydF4y2Ba

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息，到https://medinform.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。gydF4y2Ba

本文内容如下gydF4y2Bae-collection /主题问题:gydF4y2Ba

基于情绪的注意力网络在Reddit上的抑郁检测:算法开发和验证gydF4y2Ba