卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIgydF4y2B一个

JMIR Med InformgydF4y2B一个

JMIR医学信息学gydF4y2B一个

2291 - 9694gydF4y2B一个

卡塔尔世界杯8强波胆分析

加拿大多伦多gydF4y2B一个

v10i6e37804gydF4y2B一个

35671070gydF4y2B一个

10.2196/37804gydF4y2B一个

原始论文gydF4y2B一个

嵌套生物医学事件的条件概率联合抽取:基于神经网络的统一抽取框架设计gydF4y2B一个

郝gydF4y2B一个

田勇gydF4y2B一个

张gydF4y2B一个

TongxuangydF4y2B一个

一个gydF4y2B一个

杨gydF4y2B一个

王gydF4y2B一个

杨ydF4y2B一个

博士学位gydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0003-1036-9365gydF4y2B一个

王gydF4y2B一个

姜ydF4y2B一个

博士学位gydF4y2B一个 1gydF4y2B一个

计算机科学与技术学院gydF4y2B一个大连理工大学gydF4y2B一个

灵工路2号gydF4y2B一个

大连116024gydF4y2B一个

中国gydF4y2B一个 86 13604119266gydF4y2B一个 wangjian@dlut.edu.cngydF4y2B一个

https://orcid.org/0000-0002-4656-7446gydF4y2B一个

陆gydF4y2B一个

HuiyigydF4y2B一个

博士学位gydF4y2B一个 2gydF4y2B一个

https://orcid.org/0000-0003-4384-4636gydF4y2B一个

徐gydF4y2B一个

必应gydF4y2B一个

博士学位gydF4y2B一个 2gydF4y2B一个

https://orcid.org/0000-0002-1217-4169gydF4y2B一个

张gydF4y2B一个

出gydF4y2B一个

博士学位gydF4y2B一个 3.gydF4y2B一个

https://orcid.org/0000-0002-5843-4675gydF4y2B一个

BanbhranigydF4y2B一个

Santosh KumargydF4y2B一个

博士学位gydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0003-2573-9162gydF4y2B一个

凌ydF4y2B一个

红飞gydF4y2B一个

博士学位gydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0003-0872-7688gydF4y2B一个

1gydF4y2B一个计算机科学与技术学院gydF4y2B一个大连理工大学gydF4y2B一个

大连gydF4y2B一个

中国gydF4y2B一个 2gydF4y2B一个药学系gydF4y2B一个大连医科大学第二附属医院gydF4y2B一个

大连gydF4y2B一个

中国gydF4y2B一个 3.gydF4y2B一个信息科学与技术学院gydF4y2B一个大连海事大学gydF4y2B一个

大连gydF4y2B一个

中国gydF4y2B一个

通讯作者:王健gydF4y2B一个 wangjian@dlut.edu.cngydF4y2B一个

6gydF4y2B一个 2022gydF4y2B一个

7gydF4y2B一个 6gydF4y2B一个 2022gydF4y2B一个

10gydF4y2B一个 6gydF4y2B一个

e37804gydF4y2B一个

8gydF4y2B一个 3.gydF4y2B一个 2022gydF4y2B一个 6gydF4y2B一个 4gydF4y2B一个 2022gydF4y2B一个 15gydF4y2B一个 4gydF4y2B一个 2022gydF4y2B一个 19gydF4y2B一个 4gydF4y2B一个 2022gydF4y2B一个

©王燕，王健，卢慧毅，徐冰，张一嘉，Santosh Kumar Banbhrani，林鸿飞。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com)， 2022年6月7日。gydF4y2B一个

2022gydF4y2B一个

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息，到https://medinform.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。gydF4y2B一个

背景gydF4y2B一个

事件提取是自然语言处理的基础。在生物医学领域，嵌套事件现象(事件A作为事件B的参与角色)使得提取该事件比提取单个事件更加困难。因此，嵌套生物医学事件的表现总是不尽如人意。此外，以往的工作依赖于管道来构建事件提取模型，忽略了触发器识别和事件参数检测任务之间的依赖关系，产生了严重的级联误差。gydF4y2B一个

客观的gydF4y2B一个

本研究旨在设计一个统一的框架，联合训练生物医学事件触发器和参数，提高嵌套生物医学事件提取的性能。gydF4y2B一个

方法gydF4y2B一个

提出了一种考虑触发器概率分布的端到端联合提取模型，以减轻级联误差。此外，我们将句法结构集成到基于注意力的门图卷积网络中，以捕获触发器和相关实体之间的潜在相互关系，从而提高了提取嵌套生物医学事件的性能。gydF4y2B一个

结果gydF4y2B一个

实验结果表明，本文提出的方法在多层次事件提取生物医学事件提取语料库上取得了最好的F1分数，在生物医学自然语言处理共享任务2011 Genia事件语料库上取得了良好的性能。gydF4y2B一个

结论gydF4y2B一个

由于联合抽取机制和语法图结构，我们的条件概率联合抽取模型能够很好地提取嵌套生物医学事件。此外，由于我们的模型不依赖于外部知识和特定的特征工程，因此具有特殊的泛化性能。gydF4y2B一个

嵌套生物医学事件gydF4y2B一个联合提取gydF4y2B一个图卷积网络gydF4y2B一个政府通讯gydF4y2B一个骰子的损失gydF4y2B一个句法结构gydF4y2B一个

介绍gydF4y2B一个背景gydF4y2B一个

近年来，事件提取研究受到了广泛关注，特别是生物医学事件提取，它对于理解科学语料库中描述的生物分子相互作用至关重要。事件是信息抽取领域中的重要概念。然而，基于不同的研究目的和研究视角，研究者对事件的定义不尽相同。在一般领域中，事件是描述涉及不同参与者的状态变化的特定事物，例如自动内容提取的评估，其中在层次结构中定义了事件的8个类别和33个子类别，每种类型的事件包含不同的语义角色。在生物医学领域，McDonald等[gydF4y2B一个 1gydF4y2B一个]将事件提取定义为多关系提取，其目的是提取事件中不同实体之间的语义角色信息。例如，生物医学自然语言处理(BioNLP)评估任务定义了9种不同类别的生化事件。每个事件包括一个事件触发器和至少一个事件参数，不同的事件类型具有不同的语义角色。与自动内容提取中的事件不同，生物医学事件可能有嵌套的事件现象。gydF4y2B一个

为了清晰地描述生物医学事件提取的进展，我们定义了生物医学事件的4个概念，如下所示gydF4y2B一个图1gydF4y2B一个和gydF4y2B一个文本框1gydF4y2B一个。gydF4y2B一个

图1gydF4y2B一个

生物医学事件提取的基本进展，其中黄框表示实体类型，蓝框表示触发类型。主题和原因表示参与者和事件之间的关系，即论点检测。IL-8:白细胞介素8;tnf - α:肿瘤坏死因子。gydF4y2B一个

生物医学事件的概念。gydF4y2B一个

事件类型gydF4y2B一个

不同事件的语义类型gydF4y2B一个

事件描述gydF4y2B一个

一个完整的句子或从句，在文章中具体描述至少一个事件gydF4y2B一个

事件触发gydF4y2B一个

事件描述中表示事件发生的单词或短语;通常指gydF4y2B一个动词gydF4y2B一个或gydF4y2B一个 nonverbgydF4y2B一个性质，其范畴为事件型;应该注意的是，每个事件只有一个事件触发器。gydF4y2B一个

事件参数gydF4y2B一个

事件参与者描述了事件中不同的语义角色，其类型代表了事件与相关参与者之间的关系;在生物医学事件系统中，有6种不同的语义角色，其中“主题”和“原因”是核心论点。gydF4y2B一个

事件提取任务包括3个子任务:命名实体识别、触发器识别和事件参数检测。以前的研究依赖于管道方法[gydF4y2B一个 2gydF4y2B一个-gydF4y2B一个 5gydF4y2B一个提取生物医学事件。例如，给定事件描述(一个句子)，如gydF4y2B一个图1gydF4y2B一个，事件提取系统在命名实体识别步骤中可以找到该句子中的2个实体(“TNF-alpha”和“IL-8”)。在识别触发器后，它可以识别一个gydF4y2B一个积极的监管gydF4y2B一个(" Pos_Reg ")由单词触发的事件提及gydF4y2B一个激活剂gydF4y2B一个和一个gydF4y2B一个表达式gydF4y2B一个(“Exp”)由单词触发的事件提及gydF4y2B一个表达式gydF4y2B一个。在识别的实体和触发器的基础上，系统检测参数并将它们与相关的事件触发器关联起来。因此，实体“TNF-alpha”是一个参与者gydF4y2B一个积极的监管gydF4y2B一个事件，实体“IL-8”是该事件的参与者gydF4y2B一个表达式gydF4y2B一个事件。由于前一步的结果是后续步骤的输入，如果前一步的精度有偏差，管道方法可能会引入级联误差。gydF4y2B一个

由于句法依赖树丰富了特征表示，以往的研究倾向于利用句法关系来提高事件提取的性能。例如，Kilicoglu等[gydF4y2B一个 2gydF4y2B一个]利用外部工具来分割句子、注释词性(POS)和分析句法依赖性。然后，他们将这些特征结合起来，使用字典和规则提取生物医学事件。Björne等[gydF4y2B一个 4gydF4y2B一个]将句法关系转化为路径嵌入，然后与词嵌入、POS嵌入、实体嵌入、距离嵌入和相对位置嵌入结合，输入卷积神经网络(CNN)模型，提取生物医学事件。但是，以往的研究只采用句法关系作为外部特征，忽略了从句法依赖树中获得的触发器与相关实体之间的相互关系，提高了提取简单事件而非嵌套事件的性能。gydF4y2B一个

在本研究中，我们主要使用多层事件提取(MLEE)语料库[gydF4y2B一个 6gydF4y2B一个]和BioNLP共享任务(BioNLP- st) 2011 Genia事件(GE)语料库[gydF4y2B一个 7gydF4y2B一个来评估我们的方法。对于MLEE将事件提取方法扩展到生物医学信息领域，覆盖从分子到整个生物体的生物组织的各个层面，有一定的解释。MLEE标签方案与BioNLP事件系统相同，但具有更丰富的事件类型:4大类(解剖类、分子类、一般类和计划类)和19个子类。具体信息见gydF4y2B一个表1gydF4y2B一个。gydF4y2B一个

表1gydF4y2B一个

多层事件提取语料库中的主要事件类型和参数角色(N=6827)。gydF4y2B一个

事件和子事件类型gydF4y2B一个			核心参数gydF4y2B一个		值，n (%)gydF4y2B一个
解剖gydF4y2B一个
	细胞增殖gydF4y2B一个	主题(实体)gydF4y2B一个		133 (2.42)gydF4y2B一个
	发展gydF4y2B一个	主题(实体)gydF4y2B一个		316 (4.81)gydF4y2B一个
	血管发育gydF4y2B一个	主题(实体)gydF4y2B一个		855 (12.91)gydF4y2B一个
	增长gydF4y2B一个	主题(实体)gydF4y2B一个		469 (2.65)gydF4y2B一个
	死亡gydF4y2B一个	主题(实体)gydF4y2B一个		97 (1.53)gydF4y2B一个
	分解gydF4y2B一个	主题(实体)gydF4y2B一个		69 (1.1)gydF4y2B一个
	重构gydF4y2B一个	主题(实体)gydF4y2B一个		33 (0.45)gydF4y2B一个
分子gydF4y2B一个
	合成gydF4y2B一个	主题(实体)gydF4y2B一个		17 (0.3)gydF4y2B一个
	基因表达gydF4y2B一个	主题(实体)gydF4y2B一个		435 (6.66)gydF4y2B一个
	转录gydF4y2B一个	主题(实体)gydF4y2B一个		37 (0.61)gydF4y2B一个
	分解代谢gydF4y2B一个	主题(实体)gydF4y2B一个		26日(0.39)gydF4y2B一个
	磷酸化gydF4y2B一个	主题(实体)gydF4y2B一个		33 (0.5)gydF4y2B一个
	去磷酸化gydF4y2B一个	主题(实体)gydF4y2B一个		6 (0.09)gydF4y2B一个
一般gydF4y2B一个
	本地化gydF4y2B一个	主题(实体)gydF4y2B一个		450 (6.87)gydF4y2B一个
	绑定gydF4y2B一个	主题(实体)gydF4y2B一个		187 (2.92)gydF4y2B一个
	监管gydF4y2B一个	主题(实体或事件)和原因(实体或事件)gydF4y2B一个		773 (11.81)gydF4y2B一个
	积极的监管gydF4y2B一个	主题(实体或事件)和原因(实体或事件)gydF4y2B一个		1327 (20.33)gydF4y2B一个
	消极的监管gydF4y2B一个	主题(实体或事件)和原因(实体或事件)gydF4y2B一个		921 (14.08)gydF4y2B一个
计划gydF4y2B一个
	计划过程gydF4y2B一个	主题(实体或事件)gydF4y2B一个		643 (9.9)gydF4y2B一个

为了减少级联错误的影响，我们提出了一种端到端的条件概率联合提取(CPJE)方法，该方法可以有效地将触发器分布信息传递给事件参数检测任务。为了捕获触发器和相关实体之间的相互关系，提高生物医学事件嵌套提取的性能，我们将句法依赖树集成到一个基于注意力的门图卷积网络(GCN)中，该网络可以捕获关键信息的流向。本研究的贡献如下:gydF4y2B一个

我们提出了一个端到端的CPJE框架，CPJE，它有效地利用触发器分布信息来提高事件参数检测的性能，并削弱整个事件提取过程中的级联错误。gydF4y2B一个

我们使用句法依赖树来捕获触发器和相关实体之间的相互关系，并将该树集成到基于注意力的门GCN中以提取嵌套的生物医学事件。gydF4y2B一个

我们在MLEE和BioNLP-ST 2011 GE语料库上获得了最先进的性能，用于提取嵌套的生物医学事件。gydF4y2B一个

我们总结了事件提取任务的当前框架gydF4y2B一个相关的工作gydF4y2B一个部分。中介绍了我们的框架gydF4y2B一个方法gydF4y2B一个部分。中显示整体性能gydF4y2B一个结果gydF4y2B一个部分。我们介绍消融研究，可视化和案例研究gydF4y2B一个讨论gydF4y2B一个部分。本文对本文的工作进行了总结，并对今后的研究方向进行了讨论gydF4y2B一个结论gydF4y2B一个部分。gydF4y2B一个

相关的工作gydF4y2B一个

生物医学事件提取问题类似于一般领域事件提取和实体关系提取;因此，我们有许多理论基础和实验方法可供借鉴。gydF4y2B一个

实体关系提取gydF4y2B一个

生物医学事件可以看作是复杂的关系提取任务，关系提取方法在各个领域都取得了优异的效果。因此，我们研究了一些关系提取方法，以帮助构思事件提取模型的构建。随着深度学习的发展，越来越多的研究人员使用深度学习算法来实现实体关系的联合提取[gydF4y2B一个 8gydF4y2B一个]．为了解决标记样本数量稀疏的问题，将远程监督方法应用于关系提取任务[gydF4y2B一个 9gydF4y2B一个]．深度强化学习(RL)算法也被应用于关系提取任务，以解决有噪声的数据样本[gydF4y2B一个 10gydF4y2B一个]．此外，随着图神经网络(gnn)的广泛应用，gnn已被用于某些关系提取任务[gydF4y2B一个 11gydF4y2B一个，gydF4y2B一个 12gydF4y2B一个]．gydF4y2B一个

通用领域事件提取gydF4y2B一个

总的来说，新闻事件提取是一个研究热点。一些方法通过研究特征工程提高了事件提取的性能。句子级特征提取包括触发器和事件参数的组合特征[gydF4y2B一个 13gydF4y2B一个]或触发器和实体关系的组合特征[gydF4y2B一个 14gydF4y2B一个]．文档级特征提取包括从多个文档中提取公共信息事件[gydF4y2B一个 15gydF4y2B一个]和基于潜变量半马尔可夫条件随机场的联合事件参数提取[gydF4y2B一个 16gydF4y2B一个]．其他人也使用深度学习来减少特征工程，这提高了模型的泛化能力和提取性能;例如，使用循环神经网络学习上下文依赖信息[gydF4y2B一个 17gydF4y2B一个]，用非连续cnn检测事件[gydF4y2B一个 18gydF4y2B一个]，利用GCNs获取句法结构信息[gydF4y2B一个 19gydF4y2B一个]．这些方法为生物医学事件的提取奠定了较好的基础。gydF4y2B一个

生物医学事件提取gydF4y2B一个

提取生物医学事件是BioNLP-STs中的一项[gydF4y2B一个 7gydF4y2B一个，gydF4y2B一个 20.gydF4y2B一个，gydF4y2B一个 21gydF4y2B一个]．以往的研究主要是基于支持向量机模型探索人类工程特征[gydF4y2B一个 22gydF4y2B一个-gydF4y2B一个 25gydF4y2B一个]．由于管道方法中的误差传递，Riedel等[gydF4y2B一个 26gydF4y2B一个]开发了具有双重分解的联合模型，Venugopal等[gydF4y2B一个 27gydF4y2B一个利用马尔可夫逻辑网络进行联合推理。最近，大多数研究都观察到神经模型的显著益处。例如，一些人已经开始使用不同的神经模型添加POS标签和句法分析[gydF4y2B一个 28gydF4y2B一个]，利用半监督框架改进了生物医学事件提取模型[gydF4y2B一个 29gydF4y2B一个]，试图利用注意机制获取生物医学文本的语义关系[gydF4y2B一个 5gydF4y2B一个]，并使用分布式表示获得上下文嵌入[gydF4y2B一个 3.gydF4y2B一个，gydF4y2B一个 4gydF4y2B一个，gydF4y2B一个 30.gydF4y2B一个，gydF4y2B一个 31gydF4y2B一个]．为了从生物医学知识库(KB)中吸收更多信息，Zhao等[gydF4y2B一个 32gydF4y2B一个]利用RL框架从外部生物医学知识库中提取生物医学事件。Li等[gydF4y2B一个 33gydF4y2B一个将基因本体融合成具有分布表征的树状长短期记忆模型。Huang等[gydF4y2B一个 34gydF4y2B一个]使用GNN分层模拟来自统一医学语言系统的两个基于知识的视图，具有概念和语义推理路径。Trieu等[gydF4y2B一个 35gydF4y2B一个]使用多个重叠的、有向的、无环的图结构，共同提取生物医学实体、触发器、角色和事件。Zhao等[gydF4y2B一个 36gydF4y2B一个]将基于依赖的GCN与超图相结合，共同提取生物医学事件。Ramponi等[gydF4y2B一个 37gydF4y2B一个提出了一种联合端到端框架，该框架将生物医学事件提取视为具有多标签感知编码策略的序列标记。gydF4y2B一个

与这些方法相比，我们的方法联合提取具有概率分布的生物医学事件，减轻了流水线方法带来的级联误差。此外，考虑到触发器和相关实体之间的潜在相互关系，我们的方法将句法结构集成到基于注意力的门GCN中，以捕获关键信息的流向，从而大大提高了嵌套生物医学事件的提取性能。值得一提的是，我们的方法不需要任何外部资源来协助生物医学事件提取任务。gydF4y2B一个

方法gydF4y2B一个概述gydF4y2B一个

本节说明建议的CPJE模型。让gydF4y2B一个 WgydF4y2B一个= {gydF4y2B一个 wgydF4y2B一个_{1gydF4y2B一个}，gydF4y2B一个 wgydF4y2B一个_{2gydF4y2B一个}，…，gydF4y2B一个 wgydF4y2B一个_{ngydF4y2B一个}是一个有长度的句子gydF4y2B一个 ngydF4y2B一个,在那里gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}是gydF4y2B一个我gydF4y2B一个句子中的单词。同样的,gydF4y2B一个 EgydF4y2B一个= {gydF4y2B一个 egydF4y2B一个_{1gydF4y2B一个}，gydF4y2B一个 egydF4y2B一个_{2gydF4y2B一个}，…，gydF4y2B一个 egydF4y2B一个_{kgydF4y2B一个}}是句子中提到的一组实体，其中gydF4y2B一个 kgydF4y2B一个是实体的数量。由于触发器可能包含多个令牌，因此我们使用BIO标记方案来注释句子中每个令牌的触发器类型。当我们获得句子中相应的事件触发器时，我们使用该信息来预测相应的事件参数。gydF4y2B一个

如图所示gydF4y2B一个图2gydF4y2B一个CPJE模型主要包括3层:输入层、信息提取层和联合提取层。输入层将非结构化文本信息(如词序列、句法结构树、POS标签表示和实体标签信息)转换为结构化的离散表示，并将其输入到下一层。信息提取层将离散信息转化为连续特征表示，深度提取句子中的语义和依赖信息。联合提取层对之前的融合信息进行解析，并将解析后的信息发送到触发softmax分类器和事件softmax分类器中，共同提取生物医学事件。gydF4y2B一个

图2gydF4y2B一个

条件概率联合抽取框架的架构，其中数字0 ~ 9代表句子中的每个单词，蓝色条代表BioBERT嵌入，黄色条代表POS-tagging嵌入，绿色条代表实体嵌入。BERT:来自变压器的双向编码器表示BioBERT:来自变形金刚的生物医学双向编码器表示B-BVD: b血管发育;LSTM:长短期记忆;词性:词性。gydF4y2B一个

信息提取层gydF4y2B一个

由于输入层太肤浅(仅将文本转换为数字序列)，因此没有详细解释这一点。信息提取层的每个模块将在以下几节中介绍。gydF4y2B一个

词表示gydF4y2B一个

在单词表示模块中，提高对每个单词初始特征的表示能力gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}在句子中转换为实值向量gydF4y2B一个 xgydF4y2B一个_{我gydF4y2B一个}通过连接以下各节中描述的嵌入。gydF4y2B一个

基于变压器嵌入的生物医学双向编码器表示gydF4y2B一个

我们使用了生物医学双向编码器表示(BioBERT)预训练模型[gydF4y2B一个 38gydF4y2B一个来获得单词的动态语义表示gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}。BioBERT嵌入包括令牌嵌入、段嵌入和位置嵌入，由多层双向变压器编码。因此，它包含了丰富的语义和位置信息。此外，它还可以解决单词的多义问题。我们定义gydF4y2B一个一个gydF4y2B一个_{我gydF4y2B一个}作为词向量表示的词gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}。gydF4y2B一个

词类嵌入gydF4y2B一个

我们使用随机初始化的pos标注嵌入表来获得每个pos标注向量。我们定义gydF4y2B一个 bgydF4y2B一个_{我gydF4y2B一个}作为该词的pos标记向量表示gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}。gydF4y2B一个

实体标签嵌入gydF4y2B一个

与pos标签嵌入相似，我们使用BIO标签方案对句子中提到的实体进行标注，并通过查阅嵌入表将实体类型标签转换为实值向量。我们定义gydF4y2B一个 cgydF4y2B一个_{我gydF4y2B一个}作为单词的实体向量表示gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}。gydF4y2B一个

令牌的转换gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}到向量gydF4y2B一个 xgydF4y2B一个_{我gydF4y2B一个}转换输入句子gydF4y2B一个 WgydF4y2B一个变成一个实值向量序列gydF4y2B一个 XgydF4y2B一个= {gydF4y2B一个 xgydF4y2B一个_{1gydF4y2B一个}，gydF4y2B一个 xgydF4y2B一个_{2gydF4y2B一个}，…，gydF4y2B一个 xgydF4y2B一个_{ngydF4y2B一个}}，gydF4y2B一个,在那里gydF4y2B一个是连接操作，gydF4y2B一个 xgydF4y2B一个_{我gydF4y2B一个}μ维(即?的维数之和gydF4y2B一个一个gydF4y2B一个_{我gydF4y2B一个}，gydF4y2B一个 bgydF4y2B一个_{我gydF4y2B一个},gydF4y2B一个 cgydF4y2B一个_{我gydF4y2B一个}),gydF4y2B一个。gydF4y2B一个 XgydF4y2B一个被输入到后续块中，以获得更有价值的信息，用于提取生物医学事件。gydF4y2B一个

双向LSTMgydF4y2B一个

为了获取输入文本的上下文信息，避免长文本带来的梯度爆炸问题，我们选择经典的双向LSTM (BiLSTM)结构来提取单词表示的上下文特征。gydF4y2B一个

我们输入单词表示序列gydF4y2B一个 XgydF4y2B一个= {gydF4y2B一个 xgydF4y2B一个_{1gydF4y2B一个}，gydF4y2B一个 xgydF4y2B一个_{2gydF4y2B一个}，…，gydF4y2B一个 xgydF4y2B一个_{ngydF4y2B一个}}转换成BiLSTM，得到正向隐藏单元gydF4y2B一个 hgydF4y2B一个_{tgydF4y2B一个}^{fgydF4y2B一个}以及向后隐藏单元gydF4y2B一个 hgydF4y2B一个_{tgydF4y2B一个}^{bgydF4y2B一个}在时间上具有φ维数gydF4y2B一个 tgydF4y2B一个根据方程1。我们将前向LSTM和后向LSTM的所有隐藏状态表示为gydF4y2B一个和gydF4y2B一个，分别为gydF4y2B一个 ngydF4y2B一个为LSTM隐藏单元的个数:gydF4y2B一个

最后，我们将这两个矩阵连接起来以获得上下文表示gydF4y2B一个BiLSTM:gydF4y2B一个

门之下gydF4y2B一个

为了获得句子的句法依赖性，我们参考Liu等人提出的方法[gydF4y2B一个 19gydF4y2B一个应用gate GCN模型分析句子相关特征。我们考虑无向图G=(gydF4y2B一个 VgydF4y2B一个， ε)作为句子的句法依赖树gydF4y2B一个 WgydF4y2B一个,在那里gydF4y2B一个 VgydF4y2B一个是节点的集合，ε是边的集合。定义gydF4y2B一个，gydF4y2B一个 vgydF4y2B一个_{我gydF4y2B一个}代表每个单词gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}的句子gydF4y2B一个 WgydF4y2B一个，每条边gydF4y2B一个表示从单词开始的定向语法弧gydF4y2B一个 wgydF4y2B一个_{我gydF4y2B一个}对单词gydF4y2B一个 wgydF4y2B一个_{jgydF4y2B一个}，具有依赖类型gydF4y2B一个再保险gydF4y2B一个。此外，为了沿着方向移动信息，我们添加了相应的反向边(gydF4y2B一个 vgydF4y2B一个_{wgydF4y2B一个}，gydF4y2B一个 vgydF4y2B一个_{我gydF4y2B一个})，带有依赖类型gydF4y2B一个再保险的gydF4y2B一个自我循环(gydF4y2B一个 vgydF4y2B一个_{我gydF4y2B一个}，gydF4y2B一个 vgydF4y2B一个_{我gydF4y2B一个})。gydF4y2B一个 vgydF4y2B一个_{我gydF4y2B一个}。根据统计，我们使用了斯坦福解析器[gydF4y2B一个 39gydF4y2B一个来获得大约50种不同的句法依赖关系。为了便于GCN内部计算，我们只考虑信息流的方向，将原来的依赖关系简化为3种形式，如式4所示:gydF4y2B一个

为节点gydF4y2B一个，我们可以用隐藏向量gydF4y2B一个 hgydF4y2B一个_{vgydF4y2B一个}^{(j)gydF4y2B一个}在gydF4y2B一个 jgydF4y2B一个栅极GCN层来计算隐藏向量gydF4y2B一个 hgydF4y2B一个_{vgydF4y2B一个}^{(j + 1)gydF4y2B一个}下一层:gydF4y2B一个

在哪里gydF4y2B一个再保险gydF4y2B一个（gydF4y2B一个 ugydF4y2B一个，gydF4y2B一个 vgydF4y2B一个)是节点之间的依赖类型gydF4y2B一个 ugydF4y2B一个和gydF4y2B一个 vgydF4y2B一个，gydF4y2B一个 WgydF4y2B一个_{再保险(u, v)gydF4y2B一个} ^{(j)gydF4y2B一个}和gydF4y2B一个 bgydF4y2B一个_{再保险(u, v)gydF4y2B一个} ^{(j)gydF4y2B一个}分别为权重矩阵和偏置。gydF4y2B一个 NgydF4y2B一个（gydF4y2B一个 vgydF4y2B一个)是节点的邻居的集合gydF4y2B一个 vgydF4y2B一个,包括gydF4y2B一个 VgydF4y2B一个。边的权重(gydF4y2B一个 ugydF4y2B一个，gydF4y2B一个 vgydF4y2B一个)是gydF4y2B一个 ggydF4y2B一个_{u, vgydF4y2B一个} ^{(j)gydF4y2B一个}，将栅极应用于边缘，表示边缘的重要性，如式6所示:gydF4y2B一个

在这里,gydF4y2B一个 VgydF4y2B一个_{再保险(u, v)gydF4y2B一个} ^{jgydF4y2B一个}和gydF4y2B一个 dgydF4y2B一个_{再保险(u, v)gydF4y2B一个} ^{jgydF4y2B一个}分别为栅极权矩阵和偏置。我们使用了BioBERT嵌入gydF4y2B一个一个gydF4y2B一个= {gydF4y2B一个一个gydF4y2B一个_{1gydF4y2B一个}，gydF4y2B一个一个gydF4y2B一个_{2gydF4y2B一个}，…，gydF4y2B一个一个gydF4y2B一个_{ngydF4y2B一个}}初始化第一层GCN的输入。叠加gydF4y2B一个 kgydF4y2B一个GCN各层可以得到一个句法信息矩阵gydF4y2B一个,在那里gydF4y2B一个米gydF4y2B一个节点的维数是多少gydF4y2B一个 vgydF4y2B一个_{我gydF4y2B一个}的相同维数gydF4y2B一个一个gydF4y2B一个_{我gydF4y2B一个}。gydF4y2B一个

多头的关注gydF4y2B一个

如图所示gydF4y2B一个图2gydF4y2B一个，多头注意力[gydF4y2B一个 40gydF4y2B一个)由gydF4y2B一个 HgydF4y2B一个自关注，可以彻底了解节点之间的相似度，并计算每个节点的重要性，使模型能够关注更关键的节点特征。让gydF4y2B一个 WgydF4y2B一个_{我gydF4y2B一个}^{问gydF4y2B一个}，gydF4y2B一个 WgydF4y2B一个_{我gydF4y2B一个}^{KgydF4y2B一个},gydF4y2B一个 WgydF4y2B一个_{我gydF4y2B一个}^{VgydF4y2B一个}是gydF4y2B一个我gydF4y2B一个的初始化权矩阵gydF4y2B一个问gydF4y2B一个，gydF4y2B一个 K,gydF4y2B一个和gydF4y2B一个 VgydF4y2B一个，由式7可知:gydF4y2B一个

在这里,gydF4y2B一个，gydF4y2B一个，gydF4y2B一个,gydF4y2B一个 dgydF4y2B一个_{kgydF4y2B一个}＝gydF4y2B一个 dgydF4y2B一个_{vgydF4y2B一个}＝gydF4y2B一个米gydF4y2B一个/gydF4y2B一个 HgydF4y2B一个。gydF4y2B一个

我们计算了得分矩阵gydF4y2B一个我gydF4y2B一个根据方程8的头。连接后gydF4y2B一个 HgydF4y2B一个正面，我们用方程9得到了注意力输出矩阵gydF4y2B一个米gydF4y2B一个。gydF4y2B一个是线性变换矩阵:gydF4y2B一个

节理抽采层gydF4y2B一个薄铁片gydF4y2B一个

该标注器由单向LSTM(以BiLSTM给出的上下文表示作为输入)和注意力GCN模块生成的语法依赖表示(语法依赖表示)组成，用于解析前一层的信息。让gydF4y2B一个。完成标注模块后，我们得到了输出矩阵gydF4y2B一个 OgydF4y2B一个，将其发送给条件概率提取模块。gydF4y2B一个

条件概率提取gydF4y2B一个

大多数联合抽取模型同时将相同的源信息输入到不同的子任务分类器中，实现信息共享，如式10所示，其中gydF4y2B一个触发器的输出是否符合时间步长gydF4y2B一个我gydF4y2B一个和gydF4y2B一个参数的输出是同步的吗gydF4y2B一个 jgydF4y2B一个。gydF4y2B一个

然而，当同一数据集中2个子任务的出现频率相差较大时，模型容易关注高频子任务而忽略低频子任务。与生物医学事件提取任务类似，对于触发器识别和事件参数检测子任务，每个事件触发器(即生物医学事件)可以包含0、1或2个参与元素，并且参与元素也可以是另一个事件;因此，触发器识别任务的贡献将大于事件参数检测任务。为了缓解上述问题，减少这两个子任务之间的级联误差，我们将触发识别后的softmax输出与源信息相结合，提取触发向量gydF4y2B一个 TrgydF4y2B一个_{我gydF4y2B一个}事件参数向量gydF4y2B一个可以gydF4y2B一个_{jgydF4y2B一个}根据触发器和候选参数的位置。最后，将其聚合输入事件提取分类器中，学习触发标签的分布特征，直接实现生物医学事件提取，无需后处理。gydF4y2B一个

在这里,gydF4y2B一个 WgydF4y2B一个^{三gydF4y2B一个} 和gydF4y2B一个 bgydF4y2B一个^{三gydF4y2B一个} 分别是触发识别的权重矩阵和偏差。的触发softmax的概率输出gydF4y2B一个 kgydF4y2B一个这个词是gydF4y2B一个软gydF4y2B一个_{kgydF4y2B一个}。gydF4y2B一个 WgydF4y2B一个^{事件gydF4y2B一个} 和gydF4y2B一个 bgydF4y2B一个^{事件gydF4y2B一个} 分别是事件提取的权重矩阵和偏差。的字数gydF4y2B一个我gydF4y2B一个触发器和gydF4y2B一个 jgydF4y2B一个候选的论点是gydF4y2B一个我gydF4y2B一个_{米gydF4y2B一个}和gydF4y2B一个 jgydF4y2B一个_{ngydF4y2B一个},分别。gydF4y2B一个 OgydF4y2B一个_{kgydF4y2B一个}源信息向量是gydF4y2B一个 kgydF4y2B一个词。gydF4y2B一个

对比方程10和方程11，我们发现它只使用方程10实现了触发器和事件参数的联合提取;因此，它需要后处理来找出事件元组。然而，由于触发器分布信息的聚合，我们可以发现哪些事件参数属于步骤的触发器gydF4y2B一个 tgydF4y2B一个用方程11。gydF4y2B一个

联合骰子损失gydF4y2B一个

由于生物医学事件语料库数据稀疏，正反例不平衡，交叉熵或负对数似然损失函数导致准确率和召回率之间存在较大差异。为了缓解这个问题，我们提出使用一个联合权值自调整的Dice损失函数[gydF4y2B一个 41gydF4y2B一个]，详情如下:gydF4y2B一个

在这里,gydF4y2B一个 NgydF4y2B一个为语料库中句子的数量;gydF4y2B一个 ngydF4y2B一个_{pgydF4y2B一个}，gydF4y2B一个 tgydF4y2B一个_{pgydF4y2B一个},gydF4y2B一个 egydF4y2B一个_{pgydF4y2B一个}的令牌、提取的触发器候选项和参数的数量是否为gydF4y2B一个 lgydF4y2B一个句子中，λ用于平滑目的，β是调整损失的超参数，θ是需要训练的模型参数。gydF4y2B一个

培训gydF4y2B一个

CPJE模型采用多个epoch进行训练。在每个epoch中，我们将训练集分成几个批次，每个批次包含一个句子列表，每个句子包含一组可变长度的标记。一个批次在一个时间步骤中进行。gydF4y2B一个

对于每个批处理，我们首先运行信息提取层来生成上下文表示gydF4y2B一个以及具有句法信息的注意表征gydF4y2B一个。然后，我们结合gydF4y2B一个 lgydF4y2B一个和gydF4y2B一个米gydF4y2B一个作为LSTM的输入，生成源信息gydF4y2B一个 OgydF4y2B一个。最后，我们运行联合提取层来计算整个网络输出(触发器和事件)的梯度。之后，我们通过CPJE将错误从输出反向传播到输入，并更新所有网络参数。CPJE模型的总体过程总结于gydF4y2B一个文本框2gydF4y2B一个。gydF4y2B一个

条件概率联合抽取模型的训练过程。gydF4y2B一个

输入gydF4y2B一个

记号序列{gydF4y2B一个 wgydF4y2B一个_{1gydF4y2B一个}，…，gydF4y2B一个 wgydF4y2B一个_{ngydF4y2B一个}}以及相应的事件标签gydF4y2B一个

边集{gydF4y2B一个 egydF4y2B一个_{12gydF4y2B一个}，…，gydF4y2B一个 egydF4y2B一个_{ijgydF4y2B一个}，…，gydF4y2B一个 egydF4y2B一个_{锰gydF4y2B一个}}为每个对应的标记gydF4y2B一个

输出gydF4y2B一个

所有参数在条件概率联合抽取模型中gydF4y2B一个

对于每一个时代gydF4y2B一个

生成gydF4y2B一个 lgydF4y2B一个和gydF4y2B一个米gydF4y2B一个通过方程3和9的信息提取层gydF4y2B一个

连接gydF4y2B一个 lgydF4y2B一个和gydF4y2B一个米gydF4y2B一个作为gydF4y2B一个 TgydF4y2B一个

生成源信息gydF4y2B一个 OgydF4y2B一个= {gydF4y2B一个 ogydF4y2B一个_{1gydF4y2B一个}，…，gydF4y2B一个 ogydF4y2B一个_{ngydF4y2B一个}通过长短期记忆gydF4y2B一个

计算触发分数gydF4y2B一个 ygydF4y2B一个_{tgydF4y2B一个}触发软最大概率gydF4y2B一个软gydF4y2B一个通过公式11中的第一个方程，将接头提取层中的“SoftMax Trigger”块gydF4y2B一个

保险丝gydF4y2B一个 OgydF4y2B一个和gydF4y2B一个软gydF4y2B一个通过方程11中的第二和第三个方程gydF4y2B一个

计算事件得分gydF4y2B一个 ygydF4y2B一个_{tgydF4y2B一个}。通过公式11中的第四个方程，将接头提取层中的“SoftMax事件”块gydF4y2B一个

通过反向传播算法更新参数gydF4y2B一个

结束了gydF4y2B一个

数据gydF4y2B一个

我们的实验主要在MLEE语料库上进行[gydF4y2B一个 6gydF4y2B一个]，如gydF4y2B一个表2gydF4y2B一个，其中包含4个类别，其中包含19个预定义的触发器子类别。总共有262个文档，56,588个单词，8291个实体和6677个事件。从gydF4y2B一个表2gydF4y2B一个，我们注意到解剖级事件的数量高于分子级和计划级事件的数量，尽管一般生物医学事件总体上占主导地位。总的来说，18%(1202/6677)的总事件涉及分子和解剖水平上的直接或间接争论。从gydF4y2B一个表1gydF4y2B一个，我们发现监管、积极监管、消极监管和计划过程事件的论点可能不仅仅是实体，还可能是其他事件;因此，这些事件是嵌套事件，约占所有事件的54.87%(3664/6677)。gydF4y2B一个

表2gydF4y2B一个

多级事件提取统计信息。gydF4y2B一个

项gydF4y2B一个			培训，n (%)gydF4y2B一个		发展，n (%)gydF4y2B一个		测试，n (%)gydF4y2B一个		总NgydF4y2B一个
文档gydF4y2B一个			131 (50)gydF4y2B一个		44 (16.8)gydF4y2B一个		87 (33.2)gydF4y2B一个		262gydF4y2B一个
句子gydF4y2B一个			1271 (48.73)gydF4y2B一个		457 (17.52)gydF4y2B一个		880 (33.74)gydF4y2B一个		2608gydF4y2B一个
词gydF4y2B一个			27875 (49.26)gydF4y2B一个		9610 (16.98)gydF4y2B一个		19103 (33.76)gydF4y2B一个		56588年gydF4y2B一个
实体gydF4y2B一个			4147 (50.02)gydF4y2B一个		1431 (17.26)gydF4y2B一个		2713 (32.72)gydF4y2B一个		8291gydF4y2B一个
事件gydF4y2B一个			3296 (49.36)gydF4y2B一个		1175 (17.6)gydF4y2B一个		2206 (33.04)gydF4y2B一个		6677gydF4y2B一个
	解剖gydF4y2B一个	810 (48.36)gydF4y2B一个		269 (16.06)gydF4y2B一个		596 (35.58)gydF4y2B一个		1675gydF4y2B一个
	分子gydF4y2B一个	340 (48.2)gydF4y2B一个		125 (17.7)gydF4y2B一个		240 (34.0)gydF4y2B一个		705gydF4y2B一个
	一般gydF4y2B一个	1851 (50.66)gydF4y2B一个		627 (17.16)gydF4y2B一个		1176 (32.18)gydF4y2B一个		3654gydF4y2B一个
	计划gydF4y2B一个	295 (45.9)gydF4y2B一个		154 (24.0)gydF4y2B一个		194 (30.2)gydF4y2B一个		643gydF4y2B一个

此外，我们使用BioNLP-ST 2011 GE语料库验证了我们的实验[gydF4y2B一个 7gydF4y2B一个]．如图所示gydF4y2B一个表3gydF4y2B一个， BioNLP-ST 2011 GE语料库定义了9种生物医学事件类型。值得注意的是gydF4y2B一个绑定gydF4y2B一个事件可能需要>1个蛋白质实体作为其主题参数，并且agydF4y2B一个监管gydF4y2B一个事件很可能需要一个蛋白质或一个事件作为它的主题论证，并且需要一个蛋白质或一个事件作为它的原因论证。37.20%(9288/24,967)的事件(调控、正向调控和负向调控)导致了巢状结构。gydF4y2B一个

表3gydF4y2B一个

BioNLP-STa 2011 GEb语料库中的主要事件类型和核心论点角色以及GE语料库的重要统计信息。gydF4y2B一个

事件类型和BioNLP-ST 2011 GE项目gydF4y2B一个		核心参数gydF4y2B一个	N值,gydF4y2B一个
事件类型gydF4y2B一个
	基因表达gydF4y2B一个	主题(蛋白质)gydF4y2B一个	N/AgydF4y2B一个^{cgydF4y2B一个}
	转录gydF4y2B一个	主题(蛋白质)gydF4y2B一个	N/AgydF4y2B一个
	蛋白质分解代谢gydF4y2B一个	主题(蛋白质)gydF4y2B一个	N/AgydF4y2B一个
	磷酸化gydF4y2B一个	主题(蛋白质)gydF4y2B一个	N/AgydF4y2B一个
	本地化gydF4y2B一个	主题(蛋白质)gydF4y2B一个	N/AgydF4y2B一个
	绑定gydF4y2B一个	主题(蛋白质)gydF4y2B一个^{dgydF4y2B一个}	N/AgydF4y2B一个
	监管gydF4y2B一个	主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个	N/AgydF4y2B一个
	积极的监管gydF4y2B一个	主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个	N/AgydF4y2B一个
	消极的监管gydF4y2B一个	主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个	N/AgydF4y2B一个
BioNLP-ST 2011 GE语料库统计gydF4y2B一个
	文档gydF4y2B一个	N/AgydF4y2B一个	1224gydF4y2B一个
	词gydF4y2B一个	N/AgydF4y2B一个	348908年gydF4y2B一个
	实体gydF4y2B一个	N/AgydF4y2B一个	21616年gydF4y2B一个
	事件gydF4y2B一个	N/AgydF4y2B一个	24967年gydF4y2B一个

^{一个gydF4y2B一个}BioNLP- st: BioNLP共享任务。gydF4y2B一个

^{bgydF4y2B一个}GE: Genia事件。gydF4y2B一个

^{cgydF4y2B一个}-不适用。gydF4y2B一个

^{dgydF4y2B一个}表示参数>1的个数。gydF4y2B一个

Hyperparameter设置gydF4y2B一个

对于我们实验的超参数设置，我们为BioBERT嵌入设置了768个维度，为pos标记和实体标签嵌入设置了64个维度。我们应用了一个包含128个隐藏单元的1层BiLSTM，并对我们的模型使用了一个2层GCN和2头自注意。辍学率为0.3，学习率为0.01，优化函数为随机梯度下降(SGD)。CPJE模型的训练基于Ubuntu 20.04操作系统，使用PyTorch(1.9.0版本)和Python(3.8.8版本)。图形处理单元是NVIDIA TITAN Xp，内存为12gb。gydF4y2B一个

结果gydF4y2B一个 MLEE的整体表现gydF4y2B一个

我们将我们的性能与中所示的基线进行比较gydF4y2B一个文本框3gydF4y2B一个。gydF4y2B一个

性能基准。gydF4y2B一个

EventMinegydF4y2B一个

Pyysalo等[gydF4y2B一个 6gydF4y2B一个]应用了一种基于流水线的事件提取系统，主要依靠支持向量机分类器实现触发器识别和事件提取。gydF4y2B一个

Semisupervised学习gydF4y2B一个

这是Zhou等人提出的半监督学习框架[gydF4y2B一个 30.gydF4y2B一个]，它可以使用未注释的数据提取生物医学事件。gydF4y2B一个

卷积神经网络gydF4y2B一个

Wang等[gydF4y2B一个 3.gydF4y2B一个]使用卷积神经网络和多个分布式特征向量表示来实现事件提取任务。gydF4y2B一个

具有多层次注意机制的双向长短期记忆和基于依赖的词嵌入gydF4y2B一个

他等人[gydF4y2B一个 5gydF4y2B一个提出了一种基于多层次注意机制和基于依赖的词嵌入的双向长短期记忆神经网络提取生物医学事件。gydF4y2B一个

强化学习+知识库gydF4y2B一个

Zhao等[gydF4y2B一个 32gydF4y2B一个]提出了一种基于外部生物医学知识库的强化学习框架，用于提取生物医学事件。gydF4y2B一个

DeepEventMinegydF4y2B一个

Trieu等[gydF4y2B一个 35gydF4y2B一个提出了一个端到端神经模型。它使用多重叠有向无环图来检测嵌套的生物医学实体、触发器、角色和事件。gydF4y2B一个

分层人工神经网络gydF4y2B一个

Zhao等[gydF4y2B一个 36gydF4y2B一个]提出了一种文档级联合生物医学事件提取的二级建模方法。gydF4y2B一个

表4gydF4y2B一个说明了使用金标准实体的最先进方法的总体性能。从该表中可以看出，我们的CPJE模型在触发器识别任务中只取得了轻微的改进。对于事件提取任务，FgydF4y2B一个_{1gydF4y2B一个}得分明显优于其他基线。值得注意的是，我们的模型的准确率和召回率之间的差距比mdBLSTM(双向长短期记忆，多层次注意机制和基于依赖的词嵌入)模型要小得多，精度也比RL+KBs模型好得多。这表明我们的模型在减少级联错误方面比管道模型有更好的效果。此外，层次人工神经网络(HANN)模型也是一种联合抽取模型;然而，它的表现令人失望。这是因为HANN模型专注于提取文档级生物医学事件，其中包含许多跨句实体、触发器和事件。然而，其他模型旨在提取句子级事件;因此，这些模型的性能优于HANN模型。gydF4y2Ba

表4gydF4y2B一个

多层事件提取的总体性能与具有金标准实体的最先进方法的比较。gydF4y2B一个

方法gydF4y2B一个	触发识别(%)gydF4y2B一个				事件提取(%)gydF4y2B一个
	精度gydF4y2B一个	回忆gydF4y2B一个	FgydF4y2B一个_{1gydF4y2B一个}分数gydF4y2B一个	精度gydF4y2B一个		回忆gydF4y2B一个	FgydF4y2B一个_{1gydF4y2B一个}分数gydF4y2B一个
EventMinegydF4y2B一个^{一个gydF4y2B一个}	70.79gydF4y2B一个	81.69gydF4y2B一个	75.84gydF4y2B一个	62.28gydF4y2B一个		49.56gydF4y2B一个	55.20gydF4y2B一个
SSLgydF4y2B一个^{a、bgydF4y2B一个}	72.17gydF4y2B一个	82.26gydF4y2B一个	76.89gydF4y2B一个	55.76gydF4y2B一个		59.16gydF4y2B一个	57.41gydF4y2B一个
美国有线电视新闻网gydF4y2B一个^{a、cgydF4y2B一个}	80.92gydF4y2B一个	75.23gydF4y2B一个	77.97gydF4y2B一个	60.56gydF4y2B一个		56.23gydF4y2B一个	58.31gydF4y2B一个
mdBLSTMgydF4y2B一个^{,维gydF4y2B一个}	82.79gydF4y2B一个	76.56gydF4y2B一个	79.55gydF4y2B一个	90.24gydF4y2B一个		44.50gydF4y2B一个	59.61gydF4y2B一个
RLgydF4y2B一个^{egydF4y2B一个}+ KBsgydF4y2B一个^{一个fgydF4y2B一个}	N/AgydF4y2B一个^{ggydF4y2B一个}	N/AgydF4y2B一个	N/AgydF4y2B一个	63.78gydF4y2B一个		56.81gydF4y2B一个	60.09gydF4y2B一个
DeepEventMinegydF4y2B一个^{hgydF4y2B一个}	N/AgydF4y2B一个	N/AgydF4y2B一个	N/AgydF4y2B一个	69.91gydF4y2B一个		55.49gydF4y2B一个	61.87gydF4y2B一个
损害gydF4y2B一个^{h,我gydF4y2B一个}	N/AgydF4y2B一个	N/AgydF4y2B一个	N/AgydF4y2B一个	63.91gydF4y2B一个		56.08gydF4y2B一个	59.74gydF4y2B一个
我们的模型gydF4y2B一个^{hgydF4y2B一个}	82.20gydF4y2B一个	78.25gydF4y2B一个	80.18gydF4y2B一个	72.26gydF4y2B一个		55.23gydF4y2B一个	62.80gydF4y2B一个^{jgydF4y2B一个}

^{一个gydF4y2B一个}管道模型。gydF4y2B一个

^{bgydF4y2B一个}SSL:半监督学习。gydF4y2B一个

^{cgydF4y2B一个}CNN:卷积神经网络。gydF4y2B一个

^{dgydF4y2B一个}具有多层次注意机制和基于依赖的词嵌入的双向长短期记忆gydF4y2B一个

^{egydF4y2B一个}强化学习。gydF4y2B一个

^{fgydF4y2B一个}知识库:知识库gydF4y2B一个

^{ggydF4y2B一个}-不适用。gydF4y2B一个

^{hgydF4y2B一个}联合模型。gydF4y2B一个

^{我gydF4y2B一个}层次人工神经网络。gydF4y2B一个

^{jgydF4y2B一个}与基线比较的最佳值。gydF4y2B一个

MLEE上嵌套事件的性能gydF4y2B一个

为了评估我们的模型在改进嵌套生物医学事件提取方面的有效性，我们将测试集分为2部分(gydF4y2B一个简单的gydF4y2B一个和gydF4y2B一个嵌套的gydF4y2B一个)。gydF4y2B一个简单的gydF4y2B一个表示1事件只将实体作为其参数;gydF4y2B一个嵌套的gydF4y2B一个意味着一个事件的一个参数可能是另一个事件。通常，嵌套事件存在于规则、积极规则、消极规则和计划的流程事件中。gydF4y2B一个

表5gydF4y2B一个说明了性能(FgydF4y2B一个_{1gydF4y2B一个}的分数)[gydF4y2B一个 3.gydF4y2B一个]、RL+KBs模式[gydF4y2B一个 32gydF4y2B一个]， deep peventmine [gydF4y2B一个 35gydF4y2B一个]模型，HANN [gydF4y2B一个 36gydF4y2B一个]模型，以及我们在触发器识别和事件提取子任务中的模型。在gydF4y2B一个简单的gydF4y2B一个和gydF4y2B一个嵌套的gydF4y2B一个与CNN模型相比，我们的框架分别提高了0.44%和1.25%，这表明我们的模型可以提高触发器识别的性能。但是，简单触发器和嵌套触发器之间没有明显的区别。在gydF4y2B一个嵌套的gydF4y2B一个结果表明，我们的CPJE模型比CNN模型高6.97%，比RL+KBs模型高2.57%，比DeepEventMine模型高9.53%，比HANN模型高15.8%，这说明我们的CPJE模型使用gate GCN和注意机制有助于提高嵌套事件提取的性能。gydF4y2B一个

表5gydF4y2B一个

F1对简单事件、嵌套事件和多层事件提取语料库上的所有事件的性能进行评分。gydF4y2B一个

子任务和模型gydF4y2B一个			简单(%)gydF4y2B一个		嵌套(%)gydF4y2B一个		所有(%)gydF4y2B一个
触发gydF4y2B一个
	美国有线电视新闻网gydF4y2B一个^{一个gydF4y2B一个}	79.52gydF4y2B一个		78.80gydF4y2B一个		78.52gydF4y2B一个
	RLgydF4y2B一个^{bgydF4y2B一个}+ KBsgydF4y2B一个^{cgydF4y2B一个}	N/AgydF4y2B一个^{dgydF4y2B一个}		N/AgydF4y2B一个		N/AgydF4y2B一个
	DeepEventMinegydF4y2B一个	N/AgydF4y2B一个		79.12gydF4y2B一个		N/AgydF4y2B一个
	损害gydF4y2B一个^{egydF4y2B一个}	N/AgydF4y2B一个		N/AgydF4y2B一个		N/AgydF4y2B一个
	我们的模型gydF4y2B一个	79.96gydF4y2B一个^{fgydF4y2B一个}		80.05gydF4y2B一个^{fgydF4y2B一个}		80.18gydF4y2B一个^{fgydF4y2B一个}
事件gydF4y2B一个
	美国有线电视新闻网gydF4y2B一个	61.33gydF4y2B一个		54.29gydF4y2B一个		58.87gydF4y2B一个
	RL + KBsgydF4y2B一个	N/AgydF4y2B一个		58.69gydF4y2B一个		60.09gydF4y2B一个
	DeepEventMinegydF4y2B一个	N/AgydF4y2B一个		51.73gydF4y2B一个		61.87gydF4y2B一个
	损害gydF4y2B一个	77.08gydF4y2B一个^{fgydF4y2B一个}		45.46gydF4y2B一个		59.74gydF4y2B一个
	我们的模型gydF4y2B一个	64.85gydF4y2B一个		61.26gydF4y2B一个^{fgydF4y2B一个}		62.80gydF4y2B一个^{fgydF4y2B一个}

^{一个gydF4y2B一个}CNN:卷积神经网络。gydF4y2B一个

^{bgydF4y2B一个}强化学习。gydF4y2B一个

^{cgydF4y2B一个}知识库。gydF4y2B一个

^{dgydF4y2B一个}-不适用。gydF4y2B一个

^{egydF4y2B一个}层次人工神经网络。gydF4y2B一个

^{fgydF4y2B一个}与其他机型相比性价比最佳。gydF4y2B一个

MLEE上所有项目的表现gydF4y2B一个

为了更详细地说明我们的框架对不同事件的影响，gydF4y2B一个表6gydF4y2B一个展示所有事件类型的事件提取性能。从这个表中，我们得到了去磷酸化事件的最佳提取性能和转录事件的最差提取性能。其中，分解代谢事件的提取精度最高，磷酸化事件的提取召回率最高。gydF4y2B一个

表6gydF4y2B一个

多层事件提取语料库中不同事件的提取性能。gydF4y2B一个

事件gydF4y2B一个	精度(%)gydF4y2B一个	回忆(%)gydF4y2B一个	FgydF4y2B一个_{1gydF4y2B一个}分数(%)gydF4y2B一个
细胞增殖gydF4y2B一个	62.50gydF4y2B一个	58.57gydF4y2B一个	60.47gydF4y2B一个
发展gydF4y2B一个	51.82gydF4y2B一个	66.43gydF4y2B一个	58.22gydF4y2B一个
血管发育gydF4y2B一个	90.42gydF4y2B一个	72.66gydF4y2B一个	80.57gydF4y2B一个
增长gydF4y2B一个	78.02gydF4y2B一个	50.58gydF4y2B一个	61.37gydF4y2B一个
死亡gydF4y2B一个	79.12gydF4y2B一个	44.32gydF4y2B一个	56.81gydF4y2B一个
分解gydF4y2B一个	71.30gydF4y2B一个	48.30gydF4y2B一个	57.59gydF4y2B一个
重构gydF4y2B一个	85.71gydF4y2B一个	58.32gydF4y2B一个	69.41gydF4y2B一个
合成gydF4y2B一个	48.00gydF4y2B一个	20.30gydF4y2B一个	28.53gydF4y2B一个
基因表达gydF4y2B一个	74.72gydF4y2B一个	82.42gydF4y2B一个	78.38gydF4y2B一个
转录gydF4y2B一个	16.67gydF4y2B一个	33.33gydF4y2B一个	22.22gydF4y2B一个
分解代谢gydF4y2B一个	100.00gydF4y2B一个	50.00gydF4y2B一个	66.67gydF4y2B一个
磷酸化gydF4y2B一个	90．00gydF4y2B一个	100.00gydF4y2B一个	94.74gydF4y2B一个
去磷酸化gydF4y2B一个	100.00gydF4y2B一个	100.00gydF4y2B一个	100.00gydF4y2B一个
本地化gydF4y2B一个	76.86gydF4y2B一个	49.98gydF4y2B一个	60.57gydF4y2B一个
绑定gydF4y2B一个	74.52gydF4y2B一个	51.23gydF4y2B一个	60.71gydF4y2B一个
监管gydF4y2B一个	63.82gydF4y2B一个	51.49gydF4y2B一个	56.99gydF4y2B一个
积极的监管gydF4y2B一个	78.28gydF4y2B一个	50.66gydF4y2B一个	61.51gydF4y2B一个
消极的监管gydF4y2B一个	64.35gydF4y2B一个	54.69gydF4y2B一个	59.13gydF4y2B一个
计划过程gydF4y2B一个	69.57gydF4y2B一个	51.86gydF4y2B一个	59.42gydF4y2B一个
所有gydF4y2B一个	64.85gydF4y2B一个	61.26gydF4y2B一个	62.80gydF4y2B一个

BioNLP-ST 2011 GE的整体性能gydF4y2B一个

为了提高说服力，我们将实验扩展到BioNLP-ST 2011 GE语料库。我们将我们的事件提取结果与使用相同语料库的以前系统的事件提取结果进行了比较，如下所示gydF4y2B一个表7gydF4y2B一个。其中，图尔库事件提取系统(TEES) [gydF4y2B一个 42gydF4y2B一个]， EventMine [gydF4y2B一个 6gydF4y2B一个]、叠加泛化[gydF4y2B一个 25gydF4y2B一个系统基于具有设计特征的支持向量机。美国有线电视新闻网[gydF4y2B一个 4gydF4y2B一个]是cnn集成到TEES系统中以提取关系和事件。深矿坑[gydF4y2B一个 35gydF4y2B一个基于双向变压器和重叠有向无环图来联合提取生物医学事件。HANN [gydF4y2B一个 36gydF4y2B一个模型依赖于GCN和超图来获得局部和全局上下文。kb驱动树LSTM [gydF4y2B一个 33gydF4y2B一个依赖于知识库概念嵌入来改进预训练的分布式单词表示。基于科学BERT的图边条件注意网络[j]gydF4y2B一个 34gydF4y2B一个]采用由图边缘条件注意网络编码的分层图表示，将统一医学语言系统的领域知识整合到预训练的语言模型中。gydF4y2B一个表7gydF4y2B一个说明除了DeepEventMine之外，我们的方法优于之前的所有方法。gydF4y2B一个

表7gydF4y2B一个

生物医学事件提取在BioNLP共享任务2011 Genia事件语料库上的性能。gydF4y2B一个

方法和事件类型gydF4y2B一个		精度(%)gydF4y2B一个	回忆(%)gydF4y2B一个	FgydF4y2B一个_{1gydF4y2B一个}分数(%)gydF4y2B一个
t恤gydF4y2B一个^{a、bgydF4y2B一个}
	事件总gydF4y2B一个^{cgydF4y2B一个}	57.65gydF4y2B一个	49.56gydF4y2B一个	53.30gydF4y2B一个
EventMinegydF4y2B一个^{一个gydF4y2B一个}
	事件总gydF4y2B一个	63.48gydF4y2B一个	53.35gydF4y2B一个	57.98gydF4y2B一个
堆叠泛化gydF4y2B一个^{一个gydF4y2B一个}
	事件总gydF4y2B一个	66.46gydF4y2B一个	48.96gydF4y2B一个	56.38gydF4y2B一个
TEES-CNNsgydF4y2B一个^{,维gydF4y2B一个}
	事件总gydF4y2B一个	69.45gydF4y2B一个	49.94gydF4y2B一个	58.07gydF4y2B一个
损害gydF4y2B一个^{e, fgydF4y2B一个}
	事件总gydF4y2B一个	71.73gydF4y2B一个	53.21gydF4y2B一个	61.10gydF4y2B一个
KBgydF4y2B一个^{ggydF4y2B一个}驱动树LSTMgydF4y2B一个^{e、hgydF4y2B一个}
	简单的总gydF4y2B一个^{我gydF4y2B一个}	85.95gydF4y2B一个	72.62gydF4y2B一个	78.73gydF4y2B一个
	绑定gydF4y2B一个	53.16gydF4y2B一个	37.68gydF4y2B一个	44.10gydF4y2B一个
	监管总gydF4y2B一个^{jgydF4y2B一个}	55.73gydF4y2B一个	41.73gydF4y2B一个	47.72gydF4y2B一个
	事件总gydF4y2B一个	67.10gydF4y2B一个	52.14gydF4y2B一个	58.65gydF4y2B一个
GEANet-SciBERTgydF4y2B一个^{e、kgydF4y2B一个}
	监管总gydF4y2B一个	55.21gydF4y2B一个	47.23gydF4y2B一个	50.91gydF4y2B一个
	事件总gydF4y2B一个	64.61gydF4y2B一个	56.11gydF4y2B一个	60.06gydF4y2B一个
DeepEventMinegydF4y2B一个^{egydF4y2B一个}
	监管总gydF4y2B一个	62.36gydF4y2B一个	51.88gydF4y2B一个	56.64gydF4y2B一个^{lgydF4y2B一个}
	事件总gydF4y2B一个	76.28gydF4y2B一个	55.06gydF4y2B一个	63.96gydF4y2B一个^{lgydF4y2B一个}
我们的模型gydF4y2B一个^{egydF4y2B一个}
	简单的总gydF4y2B一个	82.23gydF4y2B一个	78.88gydF4y2B一个	80.52gydF4y2B一个
	绑定gydF4y2B一个	55.12gydF4y2B一个	37.48gydF4y2B一个	44.62gydF4y2B一个
	监管总gydF4y2B一个	57.82gydF4y2B一个	46.39gydF4y2B一个	51.48gydF4y2B一个
	事件总gydF4y2B一个	72.62gydF4y2B一个	53.33gydF4y2B一个	61.50gydF4y2B一个

^{一个gydF4y2B一个}管道模型。gydF4y2B一个

^{bgydF4y2B一个}图尔库事件提取系统。gydF4y2B一个

^{cgydF4y2B一个}表示测试集上的整体性能。gydF4y2B一个

^{dgydF4y2B一个}CNN:卷积神经网络。gydF4y2B一个

^{egydF4y2B一个}联合模型。gydF4y2B一个

^{fgydF4y2B一个}层次人工神经网络。gydF4y2B一个

^{ggydF4y2B一个}知识库。gydF4y2B一个

^{hgydF4y2B一个}LSTM:长短期记忆。gydF4y2B一个

^{我gydF4y2B一个}表示测试集中简单事件的总体性能。gydF4y2B一个

^{jgydF4y2B一个}表示测试集中嵌套事件的总体性能(包括规则、积极规则和消极规则子事件)。gydF4y2B一个

^{kgydF4y2B一个}基于科学BERT的边缘条件注意网络图。gydF4y2B一个

^{lgydF4y2B一个}与其他机型相比性价比最佳。gydF4y2B一个

KB驱动的树LSTM和GEANet-SciBERT都利用KB来增强单词的语义表示，以提高嵌套(规则)事件的提取性能。然而，KB驱动的树状LSTM仅利用传统的静态词嵌入，不能深度集成知识库中的信息;因此，它在嵌套事件上的性能不能令人满意。gydF4y2B一个

与KB驱动的树状LSTM方法不同，GEANet-SciBERT模型利用专门的医学KB和科学信息丰富了变形器双向编码器表示(BERT)的动态语义表示，并通过新颖的GNN增强了对嵌套事件的推断能力。因此，FgydF4y2B一个_{1gydF4y2B一个}嵌套事件提取的得分显著提高。gydF4y2B一个

有趣的是，DeepEventMine在提取BioNLP-ST 2011 GE上的嵌套生物医学事件方面表现出色，但在MLEE上表现被动。这一事实有三个原因。首先，DeepEventMine模型共同学习4个生物医学信息任务(实体检测、触发检测、角色检测、事件检测)，可以在模型训练时共享更多的生物医学特征和知识。其次，DeepEventMine模型使用更复杂的图结构(多个重叠的有向无环图)来获得丰富的语法信息。(最后，BioNLP-ST 2011 GE数据集的规模大于MLEE数据集;因此，DeepEventMine模型可以在大型语料库上进行充分训练，并提高提取嵌套事件的性能。gydF4y2B一个

讨论gydF4y2B一个

在本节中，我们将研究和讨论使用MLEE语料库的CPJE模型的性能。gydF4y2B一个

消融实验gydF4y2B一个法案的影响gydF4y2B一个

虽然BioBERT的输出包含了丰富的语义信息，但将POS嵌入、实体嵌入和BioBERT嵌入串联起来后，会对语义信息产生一定的噪声影响。另外，BioBERT输出的维数为768，拼接后的总尺寸比较广泛，容易造成特征空间的组合爆炸现象。因此，我们考虑使用BiLSTM，它降低了总维数，并将其他信息与BioBERT信息集成在一起，以获得更丰富的语义表示。gydF4y2B一个

如果去除BiLSTM层，触发识别精度从82.20%下降到75.64%，触发识别FgydF4y2B一个_{1gydF4y2B一个}分数从80.18%下降到76.39%，进一步影响了事件提取性能(事件提取FgydF4y2B一个_{1gydF4y2B一个}得分从62.80%降至58.02%)。gydF4y2B一个

Softmax概率的影响gydF4y2B一个

为了评估触发预测后的softmax概率分布对事件提取任务的贡献，我们使用传统的联合提取方法(如式10所示)，该方法在提取候选触发向量和事件参数向量时仅使用源信息。gydF4y2B一个

如果仅使用源信息(软触发器)进行联合提取，则事件提取任务缺乏触发器识别后的概率分布信息，导致模型的召回率下降，进一步影响FgydF4y2B一个_{1gydF4y2B一个}分数(事件提取gydF4y2B一个_{1gydF4y2B一个}分数从62.80%降至60.09%)。但总体结果仍略高于管道基线，这也反映了联合提取可以消除级联误差。gydF4y2B一个

GCN的影响gydF4y2B一个

我们去掉了语法结构来评估GCN网络的重要性;因此，GCN模块在我们的模型中是无用的。如果模型缺少GCN组件，则触发识别的性能会略有下降(触发识别FgydF4y2B一个_{1gydF4y2B一个}分数从80.18%下降到78.78%)，事件提取结果明显差于所提模型(事件提取FgydF4y2B一个_{1gydF4y2B一个}分数从62.80%降至58.40%)。gydF4y2B一个

由于句法结构可以为事件提取提供重要的潜在信息，GCN模型可以感知句法结构中的信息流方向，并有效地捕获这些特征。因此，GCN模型对于事件提取至关重要。gydF4y2B一个

骰子丢失的影响gydF4y2B一个

面对生物医学语料库的不平衡，我们使用了Dice损失函数。为了验证Dice损失函数对事件提取的效果更好，我们使用交叉熵损失函数进行比较。gydF4y2B一个

数据集中大量的反例表明易反例是广泛的。大量直观的例子淹没了训练，使得模型无法区分正面和硬反面的例子。由于交叉熵损失以精度为导向，并且每个实例对损失函数的贡献相等，因此模型的精度提高了(事件提取精度从72.26%提高到89.26%)，但FgydF4y2B一个_{1gydF4y2B一个}得分不增加(事件提取FgydF4y2B一个_{1gydF4y2B一个}分数从62.60%下降到60.30%)。骰子损失是F的弱化版本gydF4y2B一个_{1gydF4y2B一个}分数-准确率和召回率的调和平均值。当数据集中的正样例和负样例不平衡时，Dice loss会减少对易负样例的关注，增加对正负样例和难负样例的关注，从而平衡精度和召回值，增加FgydF4y2B一个_{1gydF4y2B一个}分数。gydF4y2B一个

可视化gydF4y2B一个

对于注意门GCN的有效性，我们引用了文献中的“螺内酯对大鼠同种异体角膜移植存活的影响”gydF4y2B一个图3gydF4y2B一个作为示例来说明捕获的交互特性。从gydF4y2B一个图3gydF4y2B一个B，我们知道这个句子包含两个事件:agydF4y2B一个监管gydF4y2B一个事件原因gydF4y2B一个影响gydF4y2B一个和一个gydF4y2B一个死亡gydF4y2B一个事件原因gydF4y2B一个生存gydF4y2B一个。此外，死亡事件是监管事件的论据之一。gydF4y2B一个

图3gydF4y2B一个

一个基于注意的门图神经网络有效性的例子。(A)逐行堆映射，其中每一行是由多头注意机制获得的2个头的平均分数的数组。颜色越深，分数越高，相互作用越强。(B)斯坦福CoreNLP产生的依赖解析结果和事件触发器与参数之间的黄金关系，其中黄框表示实体类型，蓝框表示事件类型。gydF4y2B一个

我们可以看到gydF4y2B一个图3gydF4y2B一个一个,gydF4y2B一个影响gydF4y2B一个Row有中等强度的联系gydF4y2B一个影响gydF4y2B一个(self)，螺内酯(其参数)，和gydF4y2B一个生存gydF4y2B一个(它的参数和另一个事件)。与此同时,gydF4y2B一个生存gydF4y2B一个Row与……有着密切的联系gydF4y2B一个生存gydF4y2B一个(自我),gydF4y2B一个影响gydF4y2B一个(另一件事)，以及gydF4y2B一个角膜移植gydF4y2B一个(它的参数)。此外，文字gydF4y2B一个老鼠gydF4y2B一个和gydF4y2B一个在gydF4y2B一个也有很强的联系gydF4y2B一个生存gydF4y2B一个，这意味着解析生成的语法依赖信息通过GCN传播。gydF4y2B一个

案例研究gydF4y2B一个概述gydF4y2B一个

我们的框架在BioNLP-ST 2011 GE语料库中还没有达到最先进的结果。然而，提取嵌套生物医学事件的性能令人满意，特别是在MLEE语料库中。为了更直观地展示我们的模型在提取嵌套生物医学事件方面的性能，我们分析了从MLEE测试集中选择的3个嵌套事件示例，研究我们的模型与CNN相比的优缺点[gydF4y2B一个 3.gydF4y2B一个]．gydF4y2B一个

案例1gydF4y2B一个

如图所示gydF4y2B一个图4gydF4y2B一个，情况1是一个简单的嵌套事件，其中事件参数的角色类型只有gydF4y2B一个主题gydF4y2B一个。它是一个嵌套事件;然而，CNN和我们的模型都获得了正确的事件提取结果。这是因为这个句子没有一个完整的成分，也许，它只是一个完整句子的一部分。句子结构越简单，模型越容易提取实际特征。因此，此类嵌套事件的提取性能通常是有利的。gydF4y2B一个

图4gydF4y2B一个

多层事件提取语料库上一个简单嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个

案例2gydF4y2B一个

案例2是一个一般的嵌套事件，其句子组件是完整的，事件参数的角色类型是gydF4y2B一个主题gydF4y2B一个和gydF4y2B一个导致gydF4y2B一个。如图所示gydF4y2B一个图5gydF4y2B一个， CNN模型检测到所有正确的事件触发器，但无法检测到正确的事件参数。CNN模型是一种流水线方法，将触发器识别和参数检测任务考虑为级联而不是并行关系。一般来说，他们首先将文本输入到CNN模型中，以识别句子中的触发器。然后，他们构造或候选对，并将其再次输入到CNN模型中以检测参数。最后，使用基于规则或基于机器学习的方法对触发器和参数进行后处理，以构建完整的生物医学事件。如果在这些步骤中出现错误，将直接影响事件提取的性能。然而，我们的联合方法将触发识别和参数检测视为可以提供有效信息的并行任务。因此，我们使用一个模型联合训练两个任务，并且只有在模型训练过程中才会产生错误。gydF4y2Ba

图5gydF4y2B一个

多层事件提取语料库中常见嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个

案例3gydF4y2B一个

案例3是一个跨句子嵌套事件，如gydF4y2B一个图6gydF4y2B一个。从这个例子中，我们可以确定需要改进的地方。由于多个事件相互嵌套，并且其中一些事件不在同一个句子中，这使得模型无法高效准确地提取所有事件。与CNN模型相比，虽然我们的模型可以识别gydF4y2B一个积极的监管gydF4y2B一个触发的事件gydF4y2B一个结果gydF4y2B一个，它不在同一个子句中gydF4y2B一个发展gydF4y2B一个触发的事件gydF4y2B一个创建gydF4y2B一个，导致gydF4y2B一个积极的监管gydF4y2B一个事件以缺少事件参数。gydF4y2B一个

图6gydF4y2B一个

多层次事件抽取语料库中跨句嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个

结论gydF4y2B一个

本研究提出了一种基于多头注意图CNN的CPJE框架来实现生物医学事件提取任务。由于采用了联合提取框架，减少了两个子任务之间的级联误差。利用基于注意的门式GCN，可以有效地学习句法依赖信息以及触发器与相关实体之间的相互关系;从而提高了嵌套生物医学事件的提取性能。Dice损失取代了交叉熵损失，削弱了不平衡数据集的负面影响。总体而言，该模型获得了最佳的FgydF4y2B一个_{1gydF4y2B一个}在MLEE生物医学事件提取语料库中得分，并在BioNLP-ST 2011 GE语料库上取得了良好的表现。未来，我们将考虑整合外部资源知识，让模型学习更丰富的信息，提高跨句嵌套事件的性能。gydF4y2B一个

缩写gydF4y2B一个

伯特gydF4y2B一个

从变压器双向编码器表示gydF4y2B一个

BiLSTMgydF4y2B一个

双向长短期记忆gydF4y2B一个

BioBERTgydF4y2B一个

来自变形金刚的生物医学双向编码器表示gydF4y2B一个

BioNLPgydF4y2B一个

生物医学自然语言处理gydF4y2B一个

BioNLP-STgydF4y2B一个

生物医学自然语言处理共享任务gydF4y2B一个

美国有线电视新闻网gydF4y2B一个

卷积神经网络gydF4y2B一个

CPJEgydF4y2B一个

条件概率联合提取gydF4y2B一个

政府通讯gydF4y2B一个

图卷积网络gydF4y2B一个

通用电气gydF4y2B一个

珍妮亚事件gydF4y2B一个

GEANet-SciBERTgydF4y2B一个

基于科学BERT的图边条件注意网络gydF4y2B一个

GNNgydF4y2B一个

图神经网络gydF4y2B一个

损害gydF4y2B一个

分层人工神经网络gydF4y2B一个

KBgydF4y2B一个

知识库gydF4y2B一个

LSTMgydF4y2B一个

长短期记忆gydF4y2B一个

mdBLSTMgydF4y2B一个

具有多层次注意机制的双向长短期记忆和基于依赖的词嵌入gydF4y2B一个

MLEEgydF4y2B一个

多级事件提取gydF4y2B一个

POSgydF4y2B一个

词性gydF4y2B一个

RLgydF4y2B一个

强化学习gydF4y2B一个

SGDgydF4y2B一个

随机梯度下降gydF4y2B一个

t恤gydF4y2B一个

图尔库事件提取系统gydF4y2B一个

本研究得到国家自然科学基金(no . 62072070)资助。gydF4y2B一个

YW提出生物医学事件提取的研究，实施并验证联合提取框架的有效性，并撰写初稿。JW对该草案的修改提出了建设性意见。陆先生读了定稿，并提出了一些有用的建议。林海阅读并批复了定稿。BX阅读并批准了最终的手稿。YZ帮助审查和修改了草案。SKB帮助修改了草案。gydF4y2Ba

没有宣布。gydF4y2B一个

1gydF4y2B一个

麦当劳gydF4y2B一个

RTgydF4y2B一个

佩雷拉gydF4y2B一个

足球俱乐部gydF4y2B一个

KulickgydF4y2B一个

SNgydF4y2B一个

冬天gydF4y2B一个

RgydF4y2B一个

金gydF4y2B一个

YgydF4y2B一个

白色gydF4y2B一个

PSgydF4y2B一个

复杂关系提取的简单算法及其在生物医学IE中的应用gydF4y2B一个

计算语言学协会第43届年会论文集gydF4y2B一个 2005gydF4y2B一个

ACL 05gydF4y2B一个

2005年6月25-30日gydF4y2B一个

美国密歇根州安娜堡gydF4y2B一个

491gydF4y2B一个 8gydF4y2B一个

10.3115/1219840.1219901gydF4y2B一个

2gydF4y2B一个

KilicoglugydF4y2B一个

HgydF4y2B一个

BerglergydF4y2B一个

年代gydF4y2B一个

使用触发词和句法依赖的有效生物事件提取gydF4y2B一个

第一版智能gydF4y2B一个 2011gydF4y2B一个 11gydF4y2B一个 27gydF4y2B一个 27gydF4y2B一个 4gydF4y2B一个 583gydF4y2B一个 609gydF4y2B一个

10.1111 / j.1467-8640.2011.00401.xgydF4y2B一个

3.gydF4y2B一个

王gydF4y2B一个

一个gydF4y2B一个

王gydF4y2B一个

JgydF4y2B一个

凌ydF4y2B一个

HgydF4y2B一个

张gydF4y2B一个

JgydF4y2B一个

杨gydF4y2B一个

ZgydF4y2B一个

徐gydF4y2B一个

KgydF4y2B一个

基于神经网络的生物医学事件提取的多分布式表示方法gydF4y2B一个

BMC Med Inform Decis markgydF4y2B一个 2017gydF4y2B一个 12gydF4y2B一个 20.gydF4y2B一个 17gydF4y2B一个 ,85gydF4y2B一个 171gydF4y2B一个

10.1186 / s12911 - 017 - 0563 - 9gydF4y2B一个

29297321gydF4y2B一个

10.1186 / s12911 - 017 - 0563 - 9gydF4y2B一个

PMC5751641gydF4y2B一个

4gydF4y2B一个

BjornegydF4y2B一个

JgydF4y2B一个

SalakoskigydF4y2B一个

TgydF4y2B一个

基于卷积神经网络和依赖关系分析的生物医学事件提取gydF4y2B一个

BioNLP 2018研讨会论文集gydF4y2B一个 2018gydF4y2B一个

BioNLP的18gydF4y2B一个

2018年7月19日gydF4y2B一个

澳大利亚墨尔本gydF4y2B一个

98gydF4y2B一个 108gydF4y2B一个

10.18653 / v1 / w18 - 2311gydF4y2B一个

5gydF4y2B一个

他gydF4y2B一个

XgydF4y2B一个

李gydF4y2B一个

lgydF4y2B一个

首歌gydF4y2B一个

XgydF4y2B一个

黄gydF4y2B一个

DgydF4y2B一个

任gydF4y2B一个

FgydF4y2B一个

基于多层次关注的生物医学事件提取的BLSTM神经网络gydF4y2B一个

交通信息系统gydF4y2B一个 2019gydF4y2B一个 E102。DgydF4y2B一个 9gydF4y2B一个 1842gydF4y2B一个 50gydF4y2B一个

10.1587 / transinf.2018edp7268gydF4y2B一个

6gydF4y2B一个

PyysalogydF4y2B一个

年代gydF4y2B一个

太gydF4y2B一个

TgydF4y2B一个

古板的gydF4y2B一个

米gydF4y2B一个

赵gydF4y2B一个

HgydF4y2B一个

辻井gydF4y2B一个

JgydF4y2B一个

AnaniadougydF4y2B一个

年代gydF4y2B一个

跨多个生物组织层次的事件提取gydF4y2B一个

生物信息学gydF4y2B一个 2012gydF4y2B一个 09gydF4y2B一个 15gydF4y2B一个 28gydF4y2B一个 18gydF4y2B一个 i575gydF4y2B一个 81gydF4y2B一个

10.1093 /生物信息学/ bts407gydF4y2B一个

22962484gydF4y2B一个

bts407gydF4y2B一个

PMC3436834gydF4y2B一个

7gydF4y2B一个

金gydF4y2B一个

JDgydF4y2B一个

王gydF4y2B一个

YgydF4y2B一个

高木涉gydF4y2B一个

TgydF4y2B一个

YonezawagydF4y2B一个

一个gydF4y2B一个

BioNLP共享任务2011中Genia事件任务概述gydF4y2B一个

2011 BioNLP共享任务研讨会论文集gydF4y2B一个 2011gydF4y2B一个

BioNLP的11gydF4y2B一个

2011年6月24日gydF4y2B一个

波特兰，俄勒冈，美国gydF4y2B一个

7gydF4y2B一个 15gydF4y2B一个

10.1186 / 1471 - 2105 - 13 - s11 - s1gydF4y2B一个

8gydF4y2B一个

郑gydF4y2B一个

年代gydF4y2B一个

郝gydF4y2B一个

YgydF4y2B一个

陆gydF4y2B一个

DgydF4y2B一个

保gydF4y2B一个

HgydF4y2B一个

徐gydF4y2B一个

JgydF4y2B一个

郝gydF4y2B一个

HgydF4y2B一个

徐gydF4y2B一个

BgydF4y2B一个

基于混合神经网络的关节实体及关系提取gydF4y2B一个

NeurocomputinggydF4y2B一个 2017gydF4y2B一个 09gydF4y2B一个 27gydF4y2B一个 257gydF4y2B一个 59gydF4y2B一个 66gydF4y2B一个

10.1016 / j.neucom.2016.12.075gydF4y2B一个

9gydF4y2B一个

叶gydF4y2B一个

ZXgydF4y2B一个

凌gydF4y2B一个

古银gydF4y2B一个

关注袋内和袋间的远程监控关系提取gydF4y2B一个

计算语言学协会北美分会2019年会议论文集:人类语言技术gydF4y2B一个 2019gydF4y2B一个

NAACL的19gydF4y2B一个

2019年6月2日至7日gydF4y2B一个

明尼阿波利斯，明尼苏达州，美国gydF4y2B一个

2810gydF4y2B一个 9gydF4y2B一个

10.48550 / arXiv.1904.00143gydF4y2B一个

10gydF4y2B一个

冯gydF4y2B一个

JgydF4y2B一个

黄gydF4y2B一个

米gydF4y2B一个

赵gydF4y2B一个

lgydF4y2B一个

杨gydF4y2B一个

YgydF4y2B一个

朱gydF4y2B一个

XgydF4y2B一个

基于噪声数据的关系分类强化学习gydF4y2B一个

第32届AAAI人工智能会议论文集gydF4y2B一个 2018gydF4y2B一个 2gydF4y2B一个

AAAI的18gydF4y2B一个

2018年2月2-7日gydF4y2B一个

新奥尔良，洛杉矶，美国gydF4y2B一个

11gydF4y2B一个

傅gydF4y2B一个

TJgydF4y2B一个

李gydF4y2B一个

PH值gydF4y2B一个

妈gydF4y2B一个

王寅gydF4y2B一个

Graphrel:将文本建模为关系图，用于联合实体和关系提取gydF4y2B一个

计算语言学协会第57届年会论文集gydF4y2B一个 2019gydF4y2B一个

ACL的19gydF4y2B一个

2019年7月28日至8月2日gydF4y2B一个

意大利的佛罗伦萨gydF4y2B一个

1409gydF4y2B一个 18gydF4y2B一个

10.18653 / v1 / p19 - 1136gydF4y2B一个

12gydF4y2B一个

郭gydF4y2B一个

ZgydF4y2B一个

张gydF4y2B一个

YgydF4y2B一个

陆gydF4y2B一个

WgydF4y2B一个

用于关系提取的注意引导图卷积网络gydF4y2B一个

计算语言学协会第57届年会论文集gydF4y2B一个 2019gydF4y2B一个

ACL的19gydF4y2B一个

2019年7月28日至8月2日gydF4y2B一个

意大利的佛罗伦萨gydF4y2B一个

241gydF4y2B一个 51gydF4y2B一个

10.18653 / v1 / p19 - 1024gydF4y2B一个

13gydF4y2B一个

李gydF4y2B一个

问gydF4y2B一个

霁gydF4y2B一个

HgydF4y2B一个

黄gydF4y2B一个

lgydF4y2B一个

基于全局特征的结构化预测联合事件提取gydF4y2B一个

计算语言学协会第51届年会论文集gydF4y2B一个 2013gydF4y2B一个 8gydF4y2B一个

ACL的13gydF4y2B一个

2013年8月4日至9日gydF4y2B一个

保加利亚索非亚gydF4y2B一个

73gydF4y2B一个 82gydF4y2B一个

14gydF4y2B一个

基思gydF4y2B一个

卡gydF4y2B一个

处理程序gydF4y2B一个

一个gydF4y2B一个

PinkhamgydF4y2B一个

米gydF4y2B一个

MagliozzigydF4y2B一个

CgydF4y2B一个

麦克达菲gydF4y2B一个

JgydF4y2B一个

奥康纳gydF4y2B一个

BgydF4y2B一个

通过远程监督实体事件提取识别被警察杀害的平民gydF4y2B一个

2017年自然语言处理经验方法会议论文集gydF4y2B一个 2017gydF4y2B一个 9gydF4y2B一个

EMNLP的17gydF4y2B一个

2017年9月7日至8日gydF4y2B一个

丹麦哥本哈根gydF4y2B一个

1547gydF4y2B一个 57gydF4y2B一个

10.18653 / v1 / d17 - 1163gydF4y2B一个

15gydF4y2B一个

ReichartgydF4y2B一个

RgydF4y2B一个

,22gydF4y2B一个

RgydF4y2B一个

由全局约束引导的多事件提取gydF4y2B一个

计算语言学协会北美分会2012年会议论文集:人类语言技术gydF4y2B一个 2012gydF4y2B一个 6gydF4y2B一个

NAACL”12gydF4y2B一个

2012年6月3日至8日gydF4y2B一个

加拿大蒙特利尔gydF4y2B一个

70gydF4y2B一个 9gydF4y2B一个

16gydF4y2B一个

陆gydF4y2B一个

WgydF4y2B一个

罗斯gydF4y2B一个

DgydF4y2B一个

使用结构化偏好建模的自动事件提取gydF4y2B一个

计算语言学协会第50届年会论文集gydF4y2B一个 2012gydF4y2B一个 7gydF4y2B一个

ACL的12gydF4y2B一个

2012年7月8日至14日gydF4y2B一个

韩国济州岛gydF4y2B一个

835gydF4y2B一个 44gydF4y2B一个

17gydF4y2B一个

沙gydF4y2B一个

lgydF4y2B一个

钱gydF4y2B一个

FgydF4y2B一个

常gydF4y2B一个

BgydF4y2B一个

隋gydF4y2B一个

ZgydF4y2B一个

通过依赖桥RNN和基于张量的参数交互，联合提取事件触发器和参数gydF4y2B一个

第32届AAAI人工智能会议论文集gydF4y2B一个 2018gydF4y2B一个

AAAI的18gydF4y2B一个

2018年2月2日至7日gydF4y2B一个

新奥尔良，洛杉矶，美国gydF4y2B一个

18gydF4y2B一个

阮gydF4y2B一个

THgydF4y2B一个

GrishmangydF4y2B一个

RgydF4y2B一个

基于卷积神经网络的事件检测跳跃图建模gydF4y2B一个

2016年自然语言处理经验方法会议论文集gydF4y2B一个 2016gydF4y2B一个

EMNLP的16gydF4y2B一个

2016年11月1-5日gydF4y2B一个

奥斯汀，德克萨斯州，美国gydF4y2B一个

886gydF4y2B一个 91gydF4y2B一个

10.18653 / v1 / d16 - 1085gydF4y2B一个

19gydF4y2B一个

刘gydF4y2B一个

XgydF4y2B一个

罗gydF4y2B一个

ZgydF4y2B一个

黄gydF4y2B一个

HgydF4y2B一个

基于注意的图信息聚合联合多事件提取gydF4y2B一个

2018年自然语言处理经验方法会议论文集gydF4y2B一个 2018gydF4y2B一个

EMNLP的18gydF4y2B一个

2018年10月31日至11月4日gydF4y2B一个

比利时布鲁塞尔gydF4y2B一个

1247gydF4y2B一个 56gydF4y2B一个

10.18653 / v1 / d18 - 1156gydF4y2B一个

20.gydF4y2B一个

金gydF4y2B一个

JDgydF4y2B一个

太gydF4y2B一个

TgydF4y2B一个

PyysalogydF4y2B一个

年代gydF4y2B一个

卡诺gydF4y2B一个

YgydF4y2B一个

辻井gydF4y2B一个

JgydF4y2B一个

BioNLP'09事件提取共享任务概述gydF4y2B一个

生物医学自然语言处理的当前趋势研讨会论文集:共享任务gydF4y2B一个 2009gydF4y2B一个

BioNLP 09年gydF4y2B一个

2009年6月5日gydF4y2B一个

博尔德，科罗拉多州，美国gydF4y2B一个

1gydF4y2B一个 9gydF4y2B一个

10.3115/1572340.1572342gydF4y2B一个

21gydF4y2B一个

专横的gydF4y2B一个

RgydF4y2B一个

GolikgydF4y2B一个

WgydF4y2B一个

RatkovicgydF4y2B一个

ZgydF4y2B一个

BessieresgydF4y2B一个

PgydF4y2B一个

NedellecgydF4y2B一个

CgydF4y2B一个

Bionlp共享任务2013 -细菌生物群任务概述gydF4y2B一个

BioNLP共享任务2013研讨会论文集gydF4y2B一个 2013gydF4y2B一个

BioNLP“13gydF4y2B一个

2013年8月9日gydF4y2B一个

保加利亚索非亚gydF4y2B一个

161gydF4y2B一个 9gydF4y2B一个

10.18653 / v1 / w16 - 3002gydF4y2B一个

22gydF4y2B一个

古板的gydF4y2B一个

米gydF4y2B一个

伦-gydF4y2B一个

RgydF4y2B一个

金gydF4y2B一个

JDgydF4y2B一个

辻井gydF4y2B一个

JgydF4y2B一个

利用丰富特征进行复杂事件分类的事件提取gydF4y2B一个

[J] .计算机学报gydF4y2B一个 2010gydF4y2B一个 02gydF4y2B一个 8gydF4y2B一个 1gydF4y2B一个 131gydF4y2B一个 46gydF4y2B一个

10.1142 / s0219720010004586gydF4y2B一个

20183879gydF4y2B一个

S0219720010004586gydF4y2B一个

23gydF4y2B一个

古板的gydF4y2B一个

米gydF4y2B一个

汤普森gydF4y2B一个

PgydF4y2B一个

AnaniadougydF4y2B一个

年代gydF4y2B一个

基于领域自适应和共参考分辨率的文献事件自动提取方法gydF4y2B一个

生物信息学gydF4y2B一个 2012gydF4y2B一个 07gydF4y2B一个 01gydF4y2B一个 28gydF4y2B一个 13gydF4y2B一个 1759gydF4y2B一个 65gydF4y2B一个

10.1093 /生物信息学/ bts237gydF4y2B一个

22539668gydF4y2B一个

bts237gydF4y2B一个

PMC3381963gydF4y2B一个

24gydF4y2B一个

BjornegydF4y2B一个

JgydF4y2B一个

SalakoskigydF4y2B一个

TgydF4y2B一个

TEES 2.1: BioNLP 2013共享任务中的自动标注方案学习gydF4y2B一个

BioNLP共享任务2013研讨会论文集gydF4y2B一个 2013gydF4y2B一个

BioNLP“13gydF4y2B一个

2013年8月9日gydF4y2B一个

保加利亚索非亚gydF4y2B一个

16gydF4y2B一个 25gydF4y2B一个

10.18653 / v1 / w16 - 3009gydF4y2B一个

25gydF4y2B一个

MajumdergydF4y2B一个

一个gydF4y2B一个

EkbalgydF4y2B一个

一个gydF4y2B一个

NaskargydF4y2B一个

SKgydF4y2B一个

基于堆叠泛化分类器的生物分子事件提取gydF4y2B一个

第十三届自然语言处理国际会议论文集gydF4y2B一个 2016gydF4y2B一个

ICNLP的16gydF4y2B一个

2016年12月17日至20日gydF4y2B一个

印度瓦拉纳西gydF4y2B一个

55gydF4y2B一个 64gydF4y2B一个

26gydF4y2B一个

里德尔gydF4y2B一个

年代gydF4y2B一个

McCallumgydF4y2B一个

一个gydF4y2B一个

基于对偶分解和最小域自适应的鲁棒生物医学事件提取gydF4y2B一个

2011 BioNLP共享任务研讨会论文集gydF4y2B一个 2011gydF4y2B一个

BioNLP的11gydF4y2B一个

2011年6月24日gydF4y2B一个

波特兰，俄勒冈，美国gydF4y2B一个

46gydF4y2B一个 50gydF4y2B一个

27gydF4y2B一个

VenugopalgydF4y2B一个

DgydF4y2B一个

陈gydF4y2B一个

CgydF4y2B一个

GogategydF4y2B一个

VgydF4y2B一个

NggydF4y2B一个

VgydF4y2B一个

缓解计算瓶颈:高维特征事件提取的联合推理gydF4y2B一个

2014年自然语言处理经验方法会议论文集gydF4y2B一个 2014gydF4y2B一个

EMNLP的14gydF4y2B一个

2014年10月25日至29日gydF4y2B一个

卡塔尔多哈gydF4y2B一个

831gydF4y2B一个 43gydF4y2B一个

10.3115 / v1 / d14 - 1090gydF4y2B一个

28gydF4y2B一个

阮gydF4y2B一个

DQgydF4y2B一个

VerspoorgydF4y2B一个

KgydF4y2B一个

从词性标注到生物医学事件提取的依赖解析gydF4y2B一个

BMC生物信息学gydF4y2B一个 2019gydF4y2B一个 02gydF4y2B一个 12gydF4y2B一个 20.gydF4y2B一个 1gydF4y2B一个 72gydF4y2B一个

10.1186 / s12859 - 019 - 2604 - 0gydF4y2B一个

30755172gydF4y2B一个

10.1186 / s12859 - 019 - 2604 - 0gydF4y2B一个

PMC6373122gydF4y2B一个

29gydF4y2B一个

周gydF4y2B一个

DgydF4y2B一个

钟gydF4y2B一个

DgydF4y2B一个

基于隐藏主题的生物医学事件提取半监督学习框架gydF4y2B一个

Artif Intell MedgydF4y2B一个 2015gydF4y2B一个 05gydF4y2B一个 64gydF4y2B一个 1gydF4y2B一个 51gydF4y2B一个 8gydF4y2B一个

10.1016 / j.artmed.2015.03.004gydF4y2B一个

25863986gydF4y2B一个

s0933 - 3657 (15) 00027 - 5gydF4y2B一个

30.gydF4y2B一个

饶gydF4y2B一个

年代gydF4y2B一个

MarcugydF4y2B一个

DgydF4y2B一个

骑士gydF4y2B一个

KgydF4y2B一个

Daume三世gydF4y2B一个

HgydF4y2B一个

基于抽象意义表示的生物医学事件提取gydF4y2B一个

BioNLP 2017研讨会论文集gydF4y2B一个 2017gydF4y2B一个

BioNLP的17gydF4y2B一个

2017年8月4日gydF4y2B一个

加拿大温哥华gydF4y2B一个

126gydF4y2B一个 35gydF4y2B一个

10.18653 / v1 / w17 - 2315gydF4y2B一个

31gydF4y2B一个

杨ydF4y2B一个

年代gydF4y2B一个

黄gydF4y2B一个

KCgydF4y2B一个

生物医学事件提取的上下文感知与嵌入gydF4y2B一个

生物信息学gydF4y2B一个 2020gydF4y2B一个 01gydF4y2B一个 15gydF4y2B一个 36gydF4y2B一个 2gydF4y2B一个 637gydF4y2B一个 43gydF4y2B一个

10.1093 /生物信息学/ btz607gydF4y2B一个

31392318gydF4y2B一个

5544930gydF4y2B一个

32gydF4y2B一个

赵gydF4y2B一个

WgydF4y2B一个

赵gydF4y2B一个

YgydF4y2B一个

姜gydF4y2B一个

XgydF4y2B一个

他gydF4y2B一个

TgydF4y2B一个

刘gydF4y2B一个

FgydF4y2B一个

李gydF4y2B一个

NgydF4y2B一个

一种基于强化学习和知识库的生物医学事件提取新方法gydF4y2B一个

2020年IEEE生物信息学与生物医学国际会议论文集gydF4y2B一个 2020gydF4y2B一个

BIBM 20gydF4y2B一个

2020年12月16日至19日gydF4y2B一个

韩国首尔gydF4y2B一个

402gydF4y2B一个 7gydF4y2B一个

10.1109 / bibm49941.2020.9313214gydF4y2B一个

33gydF4y2B一个

李gydF4y2B一个

DgydF4y2B一个

黄gydF4y2B一个

lgydF4y2B一个

霁gydF4y2B一个

HgydF4y2B一个

汉gydF4y2B一个

JgydF4y2B一个

基于知识驱动树lstm的生物医学事件提取gydF4y2B一个

计算语言学协会北美分会2019年会议论文集:人类语言技术gydF4y2B一个 2019gydF4y2B一个

NAACL的19gydF4y2B一个

2019年6月2日至7日gydF4y2B一个

明尼阿波利斯，明尼苏达州，美国gydF4y2B一个

1421gydF4y2B一个 30.gydF4y2B一个

10.18653 / v1 / n19 - 1145gydF4y2B一个

34gydF4y2B一个

黄gydF4y2B一个

KHgydF4y2B一个

杨gydF4y2B一个

米gydF4y2B一个

彭gydF4y2B一个

NgydF4y2B一个

基于层次知识图的生物医学事件提取gydF4y2B一个

2020年自然语言处理经验方法会议论文集gydF4y2B一个 2020gydF4y2B一个

EMNLP 20gydF4y2B一个

2020年11月16日至20日gydF4y2B一个

虚拟gydF4y2B一个

1277gydF4y2B一个 85gydF4y2B一个

10.18653 / v1/2020.findings-emnlp.114gydF4y2B一个

35gydF4y2B一个

TrieugydF4y2B一个

霍奇金淋巴瘤gydF4y2B一个

TrangydF4y2B一个

TTgydF4y2B一个

DuonggydF4y2B一个

KNgydF4y2B一个

阮gydF4y2B一个

一个gydF4y2B一个

古板的gydF4y2B一个

米gydF4y2B一个

AnaniadougydF4y2B一个

年代gydF4y2B一个

DeepEventMine:从生物医学文本中提取端到端的神经嵌套事件gydF4y2B一个

生物信息学gydF4y2B一个 2020gydF4y2B一个 12gydF4y2B一个 08gydF4y2B一个 36gydF4y2B一个 19gydF4y2B一个 4910gydF4y2B一个 7gydF4y2B一个

10.1093 /生物信息学/ btaa540gydF4y2B一个

33141147gydF4y2B一个

5858975gydF4y2B一个

PMC7750964gydF4y2B一个

36gydF4y2B一个

赵gydF4y2B一个

WgydF4y2B一个

张gydF4y2B一个

JgydF4y2B一个

杨gydF4y2B一个

JgydF4y2B一个

他gydF4y2B一个

TgydF4y2B一个

妈gydF4y2B一个

HgydF4y2B一个

李gydF4y2B一个

ZgydF4y2B一个

一种基于文档两级建模的联合生物医学事件提取框架gydF4y2B一个

正科学gydF4y2B一个 2021gydF4y2B一个 03gydF4y2B一个 550gydF4y2B一个 27gydF4y2B一个 40gydF4y2B一个

10.1016 / j.ins.2020.10.047gydF4y2B一个

37gydF4y2B一个

RamponigydF4y2B一个

一个gydF4y2B一个

范德古特gydF4y2B一个

RgydF4y2B一个

LombardogydF4y2B一个

RgydF4y2B一个

板材gydF4y2B一个

BgydF4y2B一个

生物医学事件提取作为序列标记gydF4y2B一个

2020年自然语言处理经验方法会议论文集gydF4y2B一个 2020gydF4y2B一个

EMNLP 20gydF4y2B一个

2020年11月16日至20日gydF4y2B一个

虚拟gydF4y2B一个

5357gydF4y2B一个 67gydF4y2B一个

10.18653 / v1/2020.emnlp-main.431gydF4y2B一个

38gydF4y2B一个

李gydF4y2B一个

JgydF4y2B一个

尹gydF4y2B一个

WgydF4y2B一个

金gydF4y2B一个

年代gydF4y2B一个

金gydF4y2B一个

DgydF4y2B一个

金gydF4y2B一个

年代gydF4y2B一个

所以gydF4y2B一个

CHgydF4y2B一个

康gydF4y2B一个

JgydF4y2B一个

BioBERT:用于生物医学文本挖掘的预训练生物医学语言表示模型gydF4y2B一个

生物信息学gydF4y2B一个 2020gydF4y2B一个 02gydF4y2B一个 15gydF4y2B一个 36gydF4y2B一个 4gydF4y2B一个 1234gydF4y2B一个 40gydF4y2B一个

10.1093 /生物信息学/ btz682gydF4y2B一个

31501885gydF4y2B一个

5566506gydF4y2B一个

PMC7703786gydF4y2B一个

39gydF4y2B一个

克莱因gydF4y2B一个

DgydF4y2B一个

曼宁gydF4y2B一个

CDgydF4y2B一个

准确的非词汇化解析gydF4y2B一个

计算语言学协会第41届年会论文集gydF4y2B一个 2003gydF4y2B一个

ACL的03gydF4y2B一个

2003年7月7日至12日gydF4y2B一个

日本札幌gydF4y2B一个

423gydF4y2B一个 30.gydF4y2B一个

10.3115/1075096.1075150gydF4y2B一个

40gydF4y2B一个

VaswanigydF4y2B一个

一个gydF4y2B一个

ShazeergydF4y2B一个

NgydF4y2B一个

ParmargydF4y2B一个

NgydF4y2B一个

UszkoreitgydF4y2B一个

JgydF4y2B一个

琼斯gydF4y2B一个

lgydF4y2B一个

戈麦斯gydF4y2B一个

一个gydF4y2B一个

凯撒gydF4y2B一个

ŁgydF4y2B一个

PolosukhingydF4y2B一个

我gydF4y2B一个

注意力就是你所需的一切gydF4y2B一个

神经信息处理系统进展年度会议论文集gydF4y2B一个 2017gydF4y2B一个

少量的17gydF4y2B一个

2017年12月4日至9日gydF4y2B一个

长滩，加州，美国gydF4y2B一个

41gydF4y2B一个

李gydF4y2B一个

XgydF4y2B一个

太阳gydF4y2B一个

XgydF4y2B一个

孟gydF4y2B一个

YgydF4y2B一个

梁gydF4y2B一个

JgydF4y2B一个

吴gydF4y2B一个

FgydF4y2B一个

李gydF4y2B一个

JgydF4y2B一个

数据不平衡NLP任务的骰子损失gydF4y2B一个

计算语言学协会第58届年会论文集gydF4y2B一个 2020gydF4y2B一个

ACL 20gydF4y2B一个

2020年7月5日至10日gydF4y2B一个

虚拟gydF4y2B一个

465gydF4y2B一个 76gydF4y2B一个

10.18653 / v1/2020.acl-main.45gydF4y2B一个

42gydF4y2B一个

BjornegydF4y2B一个

JgydF4y2B一个

SalakoskigydF4y2B一个

TgydF4y2B一个

泛化生物医学事件提取gydF4y2B一个

2011 BioNLP共享任务研讨会论文集gydF4y2B一个 2011gydF4y2B一个

BioNLP的11gydF4y2B一个

2011年6月24日gydF4y2B一个

波特兰，俄勒冈，美国gydF4y2B一个

183gydF4y2B一个 91gydF4y2B一个