这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到https://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2B一个
事件提取是自然语言处理的基础。在生物医学领域,嵌套事件现象(事件A作为事件B的参与角色)使得提取该事件比提取单个事件更加困难。因此,嵌套生物医学事件的表现总是不尽如人意。此外,以往的工作依赖于管道来构建事件提取模型,忽略了触发器识别和事件参数检测任务之间的依赖关系,产生了严重的级联误差。gydF4y2B一个
本研究旨在设计一个统一的框架,联合训练生物医学事件触发器和参数,提高嵌套生物医学事件提取的性能。gydF4y2B一个
提出了一种考虑触发器概率分布的端到端联合提取模型,以减轻级联误差。此外,我们将句法结构集成到基于注意力的门图卷积网络中,以捕获触发器和相关实体之间的潜在相互关系,从而提高了提取嵌套生物医学事件的性能。gydF4y2B一个
实验结果表明,本文提出的方法在多层次事件提取生物医学事件提取语料库上取得了最好的F1分数,在生物医学自然语言处理共享任务2011 Genia事件语料库上取得了良好的性能。gydF4y2B一个
由于联合抽取机制和语法图结构,我们的条件概率联合抽取模型能够很好地提取嵌套生物医学事件。此外,由于我们的模型不依赖于外部知识和特定的特征工程,因此具有特殊的泛化性能。gydF4y2B一个
近年来,事件提取研究受到了广泛关注,特别是生物医学事件提取,它对于理解科学语料库中描述的生物分子相互作用至关重要。事件是信息抽取领域中的重要概念。然而,基于不同的研究目的和研究视角,研究者对事件的定义不尽相同。在一般领域中,事件是描述涉及不同参与者的状态变化的特定事物,例如自动内容提取的评估,其中在层次结构中定义了事件的8个类别和33个子类别,每种类型的事件包含不同的语义角色。在生物医学领域,McDonald等[gydF4y2B一个
为了清晰地描述生物医学事件提取的进展,我们定义了生物医学事件的4个概念,如下所示gydF4y2B一个
生物医学事件提取的基本进展,其中黄框表示实体类型,蓝框表示触发类型。主题和原因表示参与者和事件之间的关系,即论点检测。IL-8:白细胞介素8;tnf - α:肿瘤坏死因子。gydF4y2B一个
不同事件的语义类型gydF4y2B一个
一个完整的句子或从句,在文章中具体描述至少一个事件gydF4y2B一个
事件描述中表示事件发生的单词或短语;通常指gydF4y2B一个
事件参与者描述了事件中不同的语义角色,其类型代表了事件与相关参与者之间的关系;在生物医学事件系统中,有6种不同的语义角色,其中“主题”和“原因”是核心论点。gydF4y2B一个
事件提取任务包括3个子任务:命名实体识别、触发器识别和事件参数检测。以前的研究依赖于管道方法[gydF4y2B一个
由于句法依赖树丰富了特征表示,以往的研究倾向于利用句法关系来提高事件提取的性能。例如,Kilicoglu等[gydF4y2B一个
在本研究中,我们主要使用多层事件提取(MLEE)语料库[gydF4y2B一个
多层事件提取语料库中的主要事件类型和参数角色(N=6827)。gydF4y2B一个
事件和子事件类型gydF4y2B一个 | 核心参数gydF4y2B一个 | 值,n (%)gydF4y2B一个 | |||
|
|||||
|
细胞增殖gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 133 (2.42)gydF4y2B一个 | ||
|
发展gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 316 (4.81)gydF4y2B一个 | ||
|
血管发育gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 855 (12.91)gydF4y2B一个 | ||
|
增长gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 469 (2.65)gydF4y2B一个 | ||
|
死亡gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 97 (1.53)gydF4y2B一个 | ||
|
分解gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 69 (1.1)gydF4y2B一个 | ||
|
重构gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 33 (0.45)gydF4y2B一个 | ||
|
|||||
|
合成gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 17 (0.3)gydF4y2B一个 | ||
|
基因表达gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 435 (6.66)gydF4y2B一个 | ||
|
转录gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 37 (0.61)gydF4y2B一个 | ||
|
分解代谢gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 26日(0.39)gydF4y2B一个 | ||
|
磷酸化gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 33 (0.5)gydF4y2B一个 | ||
|
去磷酸化gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 6 (0.09)gydF4y2B一个 | ||
|
|||||
|
本地化gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 450 (6.87)gydF4y2B一个 | ||
|
绑定gydF4y2B一个 | 主题(实体)gydF4y2B一个 | 187 (2.92)gydF4y2B一个 | ||
|
监管gydF4y2B一个 | 主题(实体或事件)和原因(实体或事件)gydF4y2B一个 | 773 (11.81)gydF4y2B一个 | ||
|
积极的监管gydF4y2B一个 | 主题(实体或事件)和原因(实体或事件)gydF4y2B一个 | 1327 (20.33)gydF4y2B一个 | ||
|
消极的监管gydF4y2B一个 | 主题(实体或事件)和原因(实体或事件)gydF4y2B一个 | 921 (14.08)gydF4y2B一个 | ||
|
|||||
|
计划过程gydF4y2B一个 | 主题(实体或事件)gydF4y2B一个 | 643 (9.9)gydF4y2B一个 |
为了减少级联错误的影响,我们提出了一种端到端的条件概率联合提取(CPJE)方法,该方法可以有效地将触发器分布信息传递给事件参数检测任务。为了捕获触发器和相关实体之间的相互关系,提高生物医学事件嵌套提取的性能,我们将句法依赖树集成到一个基于注意力的门图卷积网络(GCN)中,该网络可以捕获关键信息的流向。本研究的贡献如下:gydF4y2B一个
我们提出了一个端到端的CPJE框架,CPJE,它有效地利用触发器分布信息来提高事件参数检测的性能,并削弱整个事件提取过程中的级联错误。gydF4y2B一个
我们使用句法依赖树来捕获触发器和相关实体之间的相互关系,并将该树集成到基于注意力的门GCN中以提取嵌套的生物医学事件。gydF4y2B一个
我们在MLEE和BioNLP-ST 2011 GE语料库上获得了最先进的性能,用于提取嵌套的生物医学事件。gydF4y2B一个
我们总结了事件提取任务的当前框架gydF4y2B一个
生物医学事件提取问题类似于一般领域事件提取和实体关系提取;因此,我们有许多理论基础和实验方法可供借鉴。gydF4y2B一个
生物医学事件可以看作是复杂的关系提取任务,关系提取方法在各个领域都取得了优异的效果。因此,我们研究了一些关系提取方法,以帮助构思事件提取模型的构建。随着深度学习的发展,越来越多的研究人员使用深度学习算法来实现实体关系的联合提取[gydF4y2B一个
总的来说,新闻事件提取是一个研究热点。一些方法通过研究特征工程提高了事件提取的性能。句子级特征提取包括触发器和事件参数的组合特征[gydF4y2B一个
提取生物医学事件是BioNLP-STs中的一项[gydF4y2B一个
与这些方法相比,我们的方法联合提取具有概率分布的生物医学事件,减轻了流水线方法带来的级联误差。此外,考虑到触发器和相关实体之间的潜在相互关系,我们的方法将句法结构集成到基于注意力的门GCN中,以捕获关键信息的流向,从而大大提高了嵌套生物医学事件的提取性能。值得一提的是,我们的方法不需要任何外部资源来协助生物医学事件提取任务。gydF4y2B一个
本节说明建议的CPJE模型。让gydF4y2B一个
如图所示gydF4y2B一个
条件概率联合抽取框架的架构,其中数字0 ~ 9代表句子中的每个单词,蓝色条代表BioBERT嵌入,黄色条代表POS-tagging嵌入,绿色条代表实体嵌入。BERT:来自变压器的双向编码器表示BioBERT:来自变形金刚的生物医学双向编码器表示B-BVD: b血管发育;LSTM:长短期记忆;词性:词性。gydF4y2B一个
由于输入层太肤浅(仅将文本转换为数字序列),因此没有详细解释这一点。信息提取层的每个模块将在以下几节中介绍。gydF4y2B一个
在单词表示模块中,提高对每个单词初始特征的表示能力gydF4y2B一个
我们使用了生物医学双向编码器表示(BioBERT)预训练模型[gydF4y2B一个
我们使用随机初始化的pos标注嵌入表来获得每个pos标注向量。我们定义gydF4y2B一个
与pos标签嵌入相似,我们使用BIO标签方案对句子中提到的实体进行标注,并通过查阅嵌入表将实体类型标签转换为实值向量。我们定义gydF4y2B一个
令牌的转换gydF4y2B一个
为了获取输入文本的上下文信息,避免长文本带来的梯度爆炸问题,我们选择经典的双向LSTM (BiLSTM)结构来提取单词表示的上下文特征。gydF4y2B一个
我们输入单词表示序列gydF4y2B一个
最后,我们将这两个矩阵连接起来以获得上下文表示gydF4y2B一个
为了获得句子的句法依赖性,我们参考Liu等人提出的方法[gydF4y2B一个
为节点gydF4y2B一个
在哪里gydF4y2B一个
在这里,gydF4y2B一个
如图所示gydF4y2B一个
在这里,gydF4y2B一个
我们计算了得分矩阵gydF4y2B一个
该标注器由单向LSTM(以BiLSTM给出的上下文表示作为输入)和注意力GCN模块生成的语法依赖表示(语法依赖表示)组成,用于解析前一层的信息。让gydF4y2B一个
大多数联合抽取模型同时将相同的源信息输入到不同的子任务分类器中,实现信息共享,如式10所示,其中gydF4y2B一个
然而,当同一数据集中2个子任务的出现频率相差较大时,模型容易关注高频子任务而忽略低频子任务。与生物医学事件提取任务类似,对于触发器识别和事件参数检测子任务,每个事件触发器(即生物医学事件)可以包含0、1或2个参与元素,并且参与元素也可以是另一个事件;因此,触发器识别任务的贡献将大于事件参数检测任务。为了缓解上述问题,减少这两个子任务之间的级联误差,我们将触发识别后的softmax输出与源信息相结合,提取触发向量gydF4y2B一个
在这里,gydF4y2B一个
对比方程10和方程11,我们发现它只使用方程10实现了触发器和事件参数的联合提取;因此,它需要后处理来找出事件元组。然而,由于触发器分布信息的聚合,我们可以发现哪些事件参数属于步骤的触发器gydF4y2B一个
由于生物医学事件语料库数据稀疏,正反例不平衡,交叉熵或负对数似然损失函数导致准确率和召回率之间存在较大差异。为了缓解这个问题,我们提出使用一个联合权值自调整的Dice损失函数[gydF4y2B一个
在这里,gydF4y2B一个
CPJE模型采用多个epoch进行训练。在每个epoch中,我们将训练集分成几个批次,每个批次包含一个句子列表,每个句子包含一组可变长度的标记。一个批次在一个时间步骤中进行。gydF4y2B一个
对于每个批处理,我们首先运行信息提取层来生成上下文表示gydF4y2B一个
记号序列{gydF4y2B一个
边集{gydF4y2B一个
所有参数在条件概率联合抽取模型中gydF4y2B一个
对于每一个时代gydF4y2B一个
对于每一个时代gydF4y2B一个
生成gydF4y2B一个
连接gydF4y2B一个
生成源信息gydF4y2B一个
计算触发分数gydF4y2B一个
保险丝gydF4y2B一个
计算事件得分gydF4y2B一个
通过反向传播算法更新参数gydF4y2B一个
结束了gydF4y2B一个
结束了gydF4y2B一个
我们的实验主要在MLEE语料库上进行[gydF4y2B一个
多级事件提取统计信息。gydF4y2B一个
项gydF4y2B一个 | 培训,n (%)gydF4y2B一个 | 发展,n (%)gydF4y2B一个 | 测试,n (%)gydF4y2B一个 | 总NgydF4y2B一个 | |||||
文档gydF4y2B一个 | 131 (50)gydF4y2B一个 | 44 (16.8)gydF4y2B一个 | 87 (33.2)gydF4y2B一个 | 262gydF4y2B一个 | |||||
句子gydF4y2B一个 | 1271 (48.73)gydF4y2B一个 | 457 (17.52)gydF4y2B一个 | 880 (33.74)gydF4y2B一个 | 2608gydF4y2B一个 | |||||
词gydF4y2B一个 | 27875 (49.26)gydF4y2B一个 | 9610 (16.98)gydF4y2B一个 | 19103 (33.76)gydF4y2B一个 | 56588年gydF4y2B一个 | |||||
实体gydF4y2B一个 | 4147 (50.02)gydF4y2B一个 | 1431 (17.26)gydF4y2B一个 | 2713 (32.72)gydF4y2B一个 | 8291gydF4y2B一个 | |||||
|
3296 (49.36)gydF4y2B一个 | 1175 (17.6)gydF4y2B一个 | 2206 (33.04)gydF4y2B一个 | 6677gydF4y2B一个 | |||||
|
解剖gydF4y2B一个 | 810 (48.36)gydF4y2B一个 | 269 (16.06)gydF4y2B一个 | 596 (35.58)gydF4y2B一个 | 1675gydF4y2B一个 | ||||
|
分子gydF4y2B一个 | 340 (48.2)gydF4y2B一个 | 125 (17.7)gydF4y2B一个 | 240 (34.0)gydF4y2B一个 | 705gydF4y2B一个 | ||||
|
一般gydF4y2B一个 | 1851 (50.66)gydF4y2B一个 | 627 (17.16)gydF4y2B一个 | 1176 (32.18)gydF4y2B一个 | 3654gydF4y2B一个 | ||||
|
计划gydF4y2B一个 | 295 (45.9)gydF4y2B一个 | 154 (24.0)gydF4y2B一个 | 194 (30.2)gydF4y2B一个 | 643gydF4y2B一个 |
此外,我们使用BioNLP-ST 2011 GE语料库验证了我们的实验[gydF4y2B一个
BioNLP-STa 2011 GEb语料库中的主要事件类型和核心论点角色以及GE语料库的重要统计信息。gydF4y2B一个
事件类型和BioNLP-ST 2011 GE项目gydF4y2B一个 | 核心参数gydF4y2B一个 | N值,gydF4y2B一个 | |
|
|||
|
基因表达gydF4y2B一个 | 主题(蛋白质)gydF4y2B一个 | N/AgydF4y2B一个cgydF4y2B一个 |
|
转录gydF4y2B一个 | 主题(蛋白质)gydF4y2B一个 | N/AgydF4y2B一个 |
|
蛋白质分解代谢gydF4y2B一个 | 主题(蛋白质)gydF4y2B一个 | N/AgydF4y2B一个 |
|
磷酸化gydF4y2B一个 | 主题(蛋白质)gydF4y2B一个 | N/AgydF4y2B一个 |
|
本地化gydF4y2B一个 | 主题(蛋白质)gydF4y2B一个 | N/AgydF4y2B一个 |
|
绑定gydF4y2B一个 | 主题(蛋白质)gydF4y2B一个dgydF4y2B一个 | N/AgydF4y2B一个 |
|
监管gydF4y2B一个 | 主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个 | N/AgydF4y2B一个 |
|
积极的监管gydF4y2B一个 | 主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个 | N/AgydF4y2B一个 |
|
消极的监管gydF4y2B一个 | 主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个 | N/AgydF4y2B一个 |
|
|||
|
文档gydF4y2B一个 | N/AgydF4y2B一个 | 1224gydF4y2B一个 |
|
词gydF4y2B一个 | N/AgydF4y2B一个 | 348908年gydF4y2B一个 |
|
实体gydF4y2B一个 | N/AgydF4y2B一个 | 21616年gydF4y2B一个 |
|
事件gydF4y2B一个 | N/AgydF4y2B一个 | 24967年gydF4y2B一个 |
一个gydF4y2B一个BioNLP- st: BioNLP共享任务。gydF4y2B一个
bgydF4y2B一个GE: Genia事件。gydF4y2B一个
cgydF4y2B一个-不适用。gydF4y2B一个
dgydF4y2B一个表示参数>1的个数。gydF4y2B一个
对于我们实验的超参数设置,我们为BioBERT嵌入设置了768个维度,为pos标记和实体标签嵌入设置了64个维度。我们应用了一个包含128个隐藏单元的1层BiLSTM,并对我们的模型使用了一个2层GCN和2头自注意。辍学率为0.3,学习率为0.01,优化函数为随机梯度下降(SGD)。CPJE模型的训练基于Ubuntu 20.04操作系统,使用PyTorch(1.9.0版本)和Python(3.8.8版本)。图形处理单元是NVIDIA TITAN Xp,内存为12gb。gydF4y2B一个
我们将我们的性能与中所示的基线进行比较gydF4y2B一个
Pyysalo等[gydF4y2B一个
这是Zhou等人提出的半监督学习框架[gydF4y2B一个
Wang等[gydF4y2B一个
他等人[gydF4y2B一个
Zhao等[gydF4y2B一个
Trieu等[gydF4y2B一个
Zhao等[gydF4y2B一个
多层事件提取的总体性能与具有金标准实体的最先进方法的比较。gydF4y2B一个
方法gydF4y2B一个 | 触发识别(%)gydF4y2B一个 | 事件提取(%)gydF4y2B一个 | |||||
|
精度gydF4y2B一个 | 回忆gydF4y2B一个 | FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个 | 精度gydF4y2B一个 | 回忆gydF4y2B一个 | FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个 | |
EventMinegydF4y2B一个一个gydF4y2B一个 | 70.79gydF4y2B一个 | 81.69gydF4y2B一个 | 75.84gydF4y2B一个 | 62.28gydF4y2B一个 | 49.56gydF4y2B一个 | 55.20gydF4y2B一个 | |
SSLgydF4y2B一个a、bgydF4y2B一个 | 72.17gydF4y2B一个 | 82.26gydF4y2B一个 | 76.89gydF4y2B一个 | 55.76gydF4y2B一个 | 59.16gydF4y2B一个 | 57.41gydF4y2B一个 | |
美国有线电视新闻网gydF4y2B一个a、cgydF4y2B一个 | 80.92gydF4y2B一个 | 75.23gydF4y2B一个 | 77.97gydF4y2B一个 | 60.56gydF4y2B一个 | 56.23gydF4y2B一个 | 58.31gydF4y2B一个 | |
mdBLSTMgydF4y2B一个,维gydF4y2B一个 | 82.79gydF4y2B一个 | 76.56gydF4y2B一个 | 79.55gydF4y2B一个 | 90.24gydF4y2B一个 | 44.50gydF4y2B一个 | 59.61gydF4y2B一个 | |
RLgydF4y2B一个egydF4y2B一个+ KBsgydF4y2B一个一个fgydF4y2B一个 | N/AgydF4y2B一个ggydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | 63.78gydF4y2B一个 | 56.81gydF4y2B一个 | 60.09gydF4y2B一个 | |
DeepEventMinegydF4y2B一个hgydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | 69.91gydF4y2B一个 | 55.49gydF4y2B一个 | 61.87gydF4y2B一个 | |
损害gydF4y2B一个h,我gydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | 63.91gydF4y2B一个 | 56.08gydF4y2B一个 | 59.74gydF4y2B一个 | |
我们的模型gydF4y2B一个hgydF4y2B一个 | 82.20gydF4y2B一个 | 78.25gydF4y2B一个 | 80.18gydF4y2B一个 | 72.26gydF4y2B一个 | 55.23gydF4y2B一个 | 62.80gydF4y2B一个jgydF4y2B一个 |
一个gydF4y2B一个管道模型。gydF4y2B一个
bgydF4y2B一个SSL:半监督学习。gydF4y2B一个
cgydF4y2B一个CNN:卷积神经网络。gydF4y2B一个
dgydF4y2B一个具有多层次注意机制和基于依赖的词嵌入的双向长短期记忆gydF4y2B一个
egydF4y2B一个强化学习。gydF4y2B一个
fgydF4y2B一个知识库:知识库gydF4y2B一个
ggydF4y2B一个-不适用。gydF4y2B一个
hgydF4y2B一个联合模型。gydF4y2B一个
我gydF4y2B一个层次人工神经网络。gydF4y2B一个
jgydF4y2B一个与基线比较的最佳值。gydF4y2B一个
为了评估我们的模型在改进嵌套生物医学事件提取方面的有效性,我们将测试集分为2部分(gydF4y2B一个
F1对简单事件、嵌套事件和多层事件提取语料库上的所有事件的性能进行评分。gydF4y2B一个
子任务和模型gydF4y2B一个 | 简单(%)gydF4y2B一个 | 嵌套(%)gydF4y2B一个 | 所有(%)gydF4y2B一个 | ||||
|
|||||||
|
美国有线电视新闻网gydF4y2B一个一个gydF4y2B一个 | 79.52gydF4y2B一个 | 78.80gydF4y2B一个 | 78.52gydF4y2B一个 | |||
|
RLgydF4y2B一个bgydF4y2B一个+ KBsgydF4y2B一个cgydF4y2B一个 | N/AgydF4y2B一个dgydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | |||
|
DeepEventMinegydF4y2B一个 | N/AgydF4y2B一个 | 79.12gydF4y2B一个 | N/AgydF4y2B一个 | |||
|
损害gydF4y2B一个egydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | N/AgydF4y2B一个 | |||
|
我们的模型gydF4y2B一个 | 79.96gydF4y2B一个fgydF4y2B一个 | 80.05gydF4y2B一个fgydF4y2B一个 | 80.18gydF4y2B一个fgydF4y2B一个 | |||
|
|||||||
|
美国有线电视新闻网gydF4y2B一个 | 61.33gydF4y2B一个 | 54.29gydF4y2B一个 | 58.87gydF4y2B一个 | |||
|
RL + KBsgydF4y2B一个 | N/AgydF4y2B一个 | 58.69gydF4y2B一个 | 60.09gydF4y2B一个 | |||
|
DeepEventMinegydF4y2B一个 | N/AgydF4y2B一个 | 51.73gydF4y2B一个 | 61.87gydF4y2B一个 | |||
|
损害gydF4y2B一个 | 77.08gydF4y2B一个fgydF4y2B一个 | 45.46gydF4y2B一个 | 59.74gydF4y2B一个 | |||
|
我们的模型gydF4y2B一个 | 64.85gydF4y2B一个 | 61.26gydF4y2B一个fgydF4y2B一个 | 62.80gydF4y2B一个fgydF4y2B一个 |
一个gydF4y2B一个CNN:卷积神经网络。gydF4y2B一个
bgydF4y2B一个强化学习。gydF4y2B一个
cgydF4y2B一个知识库。gydF4y2B一个
dgydF4y2B一个-不适用。gydF4y2B一个
egydF4y2B一个层次人工神经网络。gydF4y2B一个
fgydF4y2B一个与其他机型相比性价比最佳。gydF4y2B一个
为了更详细地说明我们的框架对不同事件的影响,gydF4y2B一个
多层事件提取语料库中不同事件的提取性能。gydF4y2B一个
事件gydF4y2B一个 | 精度(%)gydF4y2B一个 | 回忆(%)gydF4y2B一个 | FgydF4y2B一个1gydF4y2B一个分数(%)gydF4y2B一个 |
细胞增殖gydF4y2B一个 | 62.50gydF4y2B一个 | 58.57gydF4y2B一个 | 60.47gydF4y2B一个 |
发展gydF4y2B一个 | 51.82gydF4y2B一个 | 66.43gydF4y2B一个 | 58.22gydF4y2B一个 |
血管发育gydF4y2B一个 | 90.42gydF4y2B一个 | 72.66gydF4y2B一个 | 80.57gydF4y2B一个 |
增长gydF4y2B一个 | 78.02gydF4y2B一个 | 50.58gydF4y2B一个 | 61.37gydF4y2B一个 |
死亡gydF4y2B一个 | 79.12gydF4y2B一个 | 44.32gydF4y2B一个 | 56.81gydF4y2B一个 |
分解gydF4y2B一个 | 71.30gydF4y2B一个 | 48.30gydF4y2B一个 | 57.59gydF4y2B一个 |
重构gydF4y2B一个 | 85.71gydF4y2B一个 | 58.32gydF4y2B一个 | 69.41gydF4y2B一个 |
合成gydF4y2B一个 | 48.00gydF4y2B一个 | 20.30gydF4y2B一个 | 28.53gydF4y2B一个 |
基因表达gydF4y2B一个 | 74.72gydF4y2B一个 | 82.42gydF4y2B一个 | 78.38gydF4y2B一个 |
转录gydF4y2B一个 | 16.67gydF4y2B一个 | 33.33gydF4y2B一个 | 22.22gydF4y2B一个 |
分解代谢gydF4y2B一个 | 100.00gydF4y2B一个 | 50.00gydF4y2B一个 | 66.67gydF4y2B一个 |
磷酸化gydF4y2B一个 | 90.00gydF4y2B一个 | 100.00gydF4y2B一个 | 94.74gydF4y2B一个 |
去磷酸化gydF4y2B一个 | 100.00gydF4y2B一个 | 100.00gydF4y2B一个 | 100.00gydF4y2B一个 |
本地化gydF4y2B一个 | 76.86gydF4y2B一个 | 49.98gydF4y2B一个 | 60.57gydF4y2B一个 |
绑定gydF4y2B一个 | 74.52gydF4y2B一个 | 51.23gydF4y2B一个 | 60.71gydF4y2B一个 |
监管gydF4y2B一个 | 63.82gydF4y2B一个 | 51.49gydF4y2B一个 | 56.99gydF4y2B一个 |
积极的监管gydF4y2B一个 | 78.28gydF4y2B一个 | 50.66gydF4y2B一个 | 61.51gydF4y2B一个 |
消极的监管gydF4y2B一个 | 64.35gydF4y2B一个 | 54.69gydF4y2B一个 | 59.13gydF4y2B一个 |
计划过程gydF4y2B一个 | 69.57gydF4y2B一个 | 51.86gydF4y2B一个 | 59.42gydF4y2B一个 |
所有gydF4y2B一个 | 64.85gydF4y2B一个 | 61.26gydF4y2B一个 | 62.80gydF4y2B一个 |
为了提高说服力,我们将实验扩展到BioNLP-ST 2011 GE语料库。我们将我们的事件提取结果与使用相同语料库的以前系统的事件提取结果进行了比较,如下所示gydF4y2B一个
生物医学事件提取在BioNLP共享任务2011 Genia事件语料库上的性能。gydF4y2B一个
方法和事件类型gydF4y2B一个 | 精度(%)gydF4y2B一个 | 回忆(%)gydF4y2B一个 | FgydF4y2B一个1gydF4y2B一个分数(%)gydF4y2B一个 | |
|
||||
|
事件总gydF4y2B一个cgydF4y2B一个 | 57.65gydF4y2B一个 | 49.56gydF4y2B一个 | 53.30gydF4y2B一个 |
|
||||
|
事件总gydF4y2B一个 | 63.48gydF4y2B一个 | 53.35gydF4y2B一个 | 57.98gydF4y2B一个 |
|
||||
|
事件总gydF4y2B一个 | 66.46gydF4y2B一个 | 48.96gydF4y2B一个 | 56.38gydF4y2B一个 |
|
||||
|
事件总gydF4y2B一个 | 69.45gydF4y2B一个 | 49.94gydF4y2B一个 | 58.07gydF4y2B一个 |
|
||||
|
事件总gydF4y2B一个 | 71.73gydF4y2B一个 | 53.21gydF4y2B一个 | 61.10gydF4y2B一个 |
|
||||
|
简单的总gydF4y2B一个我gydF4y2B一个 | 85.95gydF4y2B一个 | 72.62gydF4y2B一个 | 78.73gydF4y2B一个 |
|
绑定gydF4y2B一个 | 53.16gydF4y2B一个 | 37.68gydF4y2B一个 | 44.10gydF4y2B一个 |
|
监管总gydF4y2B一个jgydF4y2B一个 | 55.73gydF4y2B一个 | 41.73gydF4y2B一个 | 47.72gydF4y2B一个 |
|
事件总gydF4y2B一个 | 67.10gydF4y2B一个 | 52.14gydF4y2B一个 | 58.65gydF4y2B一个 |
|
||||
|
监管总gydF4y2B一个 | 55.21gydF4y2B一个 | 47.23gydF4y2B一个 | 50.91gydF4y2B一个 |
|
事件总gydF4y2B一个 | 64.61gydF4y2B一个 | 56.11gydF4y2B一个 | 60.06gydF4y2B一个 |
|
||||
|
监管总gydF4y2B一个 | 62.36gydF4y2B一个 | 51.88gydF4y2B一个 | 56.64gydF4y2B一个lgydF4y2B一个 |
|
事件总gydF4y2B一个 | 76.28gydF4y2B一个 | 55.06gydF4y2B一个 | 63.96gydF4y2B一个lgydF4y2B一个 |
|
||||
|
简单的总gydF4y2B一个 | 82.23gydF4y2B一个 | 78.88gydF4y2B一个 | 80.52gydF4y2B一个 |
|
绑定gydF4y2B一个 | 55.12gydF4y2B一个 | 37.48gydF4y2B一个 | 44.62gydF4y2B一个 |
|
监管总gydF4y2B一个 | 57.82gydF4y2B一个 | 46.39gydF4y2B一个 | 51.48gydF4y2B一个 |
|
事件总gydF4y2B一个 | 72.62gydF4y2B一个 | 53.33gydF4y2B一个 | 61.50gydF4y2B一个 |
一个gydF4y2B一个管道模型。gydF4y2B一个
bgydF4y2B一个图尔库事件提取系统。gydF4y2B一个
cgydF4y2B一个表示测试集上的整体性能。gydF4y2B一个
dgydF4y2B一个CNN:卷积神经网络。gydF4y2B一个
egydF4y2B一个联合模型。gydF4y2B一个
fgydF4y2B一个层次人工神经网络。gydF4y2B一个
ggydF4y2B一个知识库。gydF4y2B一个
hgydF4y2B一个LSTM:长短期记忆。gydF4y2B一个
我gydF4y2B一个表示测试集中简单事件的总体性能。gydF4y2B一个
jgydF4y2B一个表示测试集中嵌套事件的总体性能(包括规则、积极规则和消极规则子事件)。gydF4y2B一个
kgydF4y2B一个基于科学BERT的边缘条件注意网络图。gydF4y2B一个
lgydF4y2B一个与其他机型相比性价比最佳。gydF4y2B一个
KB驱动的树LSTM和GEANet-SciBERT都利用KB来增强单词的语义表示,以提高嵌套(规则)事件的提取性能。然而,KB驱动的树状LSTM仅利用传统的静态词嵌入,不能深度集成知识库中的信息;因此,它在嵌套事件上的性能不能令人满意。gydF4y2B一个
与KB驱动的树状LSTM方法不同,GEANet-SciBERT模型利用专门的医学KB和科学信息丰富了变形器双向编码器表示(BERT)的动态语义表示,并通过新颖的GNN增强了对嵌套事件的推断能力。因此,FgydF4y2B一个1gydF4y2B一个嵌套事件提取的得分显著提高。gydF4y2B一个
有趣的是,DeepEventMine在提取BioNLP-ST 2011 GE上的嵌套生物医学事件方面表现出色,但在MLEE上表现被动。这一事实有三个原因。首先,DeepEventMine模型共同学习4个生物医学信息任务(实体检测、触发检测、角色检测、事件检测),可以在模型训练时共享更多的生物医学特征和知识。其次,DeepEventMine模型使用更复杂的图结构(多个重叠的有向无环图)来获得丰富的语法信息。(最后,BioNLP-ST 2011 GE数据集的规模大于MLEE数据集;因此,DeepEventMine模型可以在大型语料库上进行充分训练,并提高提取嵌套事件的性能。gydF4y2B一个
在本节中,我们将研究和讨论使用MLEE语料库的CPJE模型的性能。gydF4y2B一个
虽然BioBERT的输出包含了丰富的语义信息,但将POS嵌入、实体嵌入和BioBERT嵌入串联起来后,会对语义信息产生一定的噪声影响。另外,BioBERT输出的维数为768,拼接后的总尺寸比较广泛,容易造成特征空间的组合爆炸现象。因此,我们考虑使用BiLSTM,它降低了总维数,并将其他信息与BioBERT信息集成在一起,以获得更丰富的语义表示。gydF4y2B一个
如果去除BiLSTM层,触发识别精度从82.20%下降到75.64%,触发识别FgydF4y2B一个1gydF4y2B一个分数从80.18%下降到76.39%,进一步影响了事件提取性能(事件提取FgydF4y2B一个1gydF4y2B一个得分从62.80%降至58.02%)。gydF4y2B一个
为了评估触发预测后的softmax概率分布对事件提取任务的贡献,我们使用传统的联合提取方法(如式10所示),该方法在提取候选触发向量和事件参数向量时仅使用源信息。gydF4y2B一个
如果仅使用源信息(软触发器)进行联合提取,则事件提取任务缺乏触发器识别后的概率分布信息,导致模型的召回率下降,进一步影响FgydF4y2B一个1gydF4y2B一个分数(事件提取gydF4y2B一个1gydF4y2B一个分数从62.80%降至60.09%)。但总体结果仍略高于管道基线,这也反映了联合提取可以消除级联误差。gydF4y2B一个
我们去掉了语法结构来评估GCN网络的重要性;因此,GCN模块在我们的模型中是无用的。如果模型缺少GCN组件,则触发识别的性能会略有下降(触发识别FgydF4y2B一个1gydF4y2B一个分数从80.18%下降到78.78%),事件提取结果明显差于所提模型(事件提取FgydF4y2B一个1gydF4y2B一个分数从62.80%降至58.40%)。gydF4y2B一个
由于句法结构可以为事件提取提供重要的潜在信息,GCN模型可以感知句法结构中的信息流方向,并有效地捕获这些特征。因此,GCN模型对于事件提取至关重要。gydF4y2B一个
面对生物医学语料库的不平衡,我们使用了Dice损失函数。为了验证Dice损失函数对事件提取的效果更好,我们使用交叉熵损失函数进行比较。gydF4y2B一个
数据集中大量的反例表明易反例是广泛的。大量直观的例子淹没了训练,使得模型无法区分正面和硬反面的例子。由于交叉熵损失以精度为导向,并且每个实例对损失函数的贡献相等,因此模型的精度提高了(事件提取精度从72.26%提高到89.26%),但FgydF4y2B一个1gydF4y2B一个得分不增加(事件提取FgydF4y2B一个1gydF4y2B一个分数从62.60%下降到60.30%)。骰子损失是F的弱化版本gydF4y2B一个1gydF4y2B一个分数-准确率和召回率的调和平均值。当数据集中的正样例和负样例不平衡时,Dice loss会减少对易负样例的关注,增加对正负样例和难负样例的关注,从而平衡精度和召回值,增加FgydF4y2B一个1gydF4y2B一个分数。gydF4y2B一个
对于注意门GCN的有效性,我们引用了文献中的“螺内酯对大鼠同种异体角膜移植存活的影响”gydF4y2B一个
一个基于注意的门图神经网络有效性的例子。(A)逐行堆映射,其中每一行是由多头注意机制获得的2个头的平均分数的数组。颜色越深,分数越高,相互作用越强。(B)斯坦福CoreNLP产生的依赖解析结果和事件触发器与参数之间的黄金关系,其中黄框表示实体类型,蓝框表示事件类型。gydF4y2B一个
我们可以看到gydF4y2B一个
我们的框架在BioNLP-ST 2011 GE语料库中还没有达到最先进的结果。然而,提取嵌套生物医学事件的性能令人满意,特别是在MLEE语料库中。为了更直观地展示我们的模型在提取嵌套生物医学事件方面的性能,我们分析了从MLEE测试集中选择的3个嵌套事件示例,研究我们的模型与CNN相比的优缺点[gydF4y2B一个
如图所示gydF4y2B一个
多层事件提取语料库上一个简单嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个
案例2是一个一般的嵌套事件,其句子组件是完整的,事件参数的角色类型是gydF4y2B一个
多层事件提取语料库中常见嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个
案例3是一个跨句子嵌套事件,如gydF4y2B一个
多层次事件抽取语料库中跨句嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个
本研究提出了一种基于多头注意图CNN的CPJE框架来实现生物医学事件提取任务。由于采用了联合提取框架,减少了两个子任务之间的级联误差。利用基于注意的门式GCN,可以有效地学习句法依赖信息以及触发器与相关实体之间的相互关系;从而提高了嵌套生物医学事件的提取性能。Dice损失取代了交叉熵损失,削弱了不平衡数据集的负面影响。总体而言,该模型获得了最佳的FgydF4y2B一个1gydF4y2B一个在MLEE生物医学事件提取语料库中得分,并在BioNLP-ST 2011 GE语料库上取得了良好的表现。未来,我们将考虑整合外部资源知识,让模型学习更丰富的信息,提高跨句嵌套事件的性能。gydF4y2B一个
从变压器双向编码器表示gydF4y2B一个
双向长短期记忆gydF4y2B一个
来自变形金刚的生物医学双向编码器表示gydF4y2B一个
生物医学自然语言处理gydF4y2B一个
生物医学自然语言处理共享任务gydF4y2B一个
卷积神经网络gydF4y2B一个
条件概率联合提取gydF4y2B一个
图卷积网络gydF4y2B一个
珍妮亚事件gydF4y2B一个
基于科学BERT的图边条件注意网络gydF4y2B一个
图神经网络gydF4y2B一个
分层人工神经网络gydF4y2B一个
知识库gydF4y2B一个
长短期记忆gydF4y2B一个
具有多层次注意机制的双向长短期记忆和基于依赖的词嵌入gydF4y2B一个
多级事件提取gydF4y2B一个
词性gydF4y2B一个
强化学习gydF4y2B一个
随机梯度下降gydF4y2B一个
图尔库事件提取系统gydF4y2B一个
本研究得到国家自然科学基金(no . 62072070)资助。gydF4y2B一个
YW提出生物医学事件提取的研究,实施并验证联合提取框架的有效性,并撰写初稿。JW对该草案的修改提出了建设性意见。陆先生读了定稿,并提出了一些有用的建议。林海阅读并批复了定稿。BX阅读并批准了最终的手稿。YZ帮助审查和修改了草案。SKB帮助修改了草案。gydF4y2Ba
没有宣布。gydF4y2B一个