JMIgydF4y2B一个 JMIR Med InformgydF4y2B一个 JMIR医学信息学gydF4y2B一个 2291 - 9694gydF4y2B一个 卡塔尔世界杯8强波胆分析 加拿大多伦多gydF4y2B一个 v10i6e37804gydF4y2B一个 35671070gydF4y2B一个 10.2196/37804gydF4y2B一个 原始论文gydF4y2B一个 原始论文gydF4y2B一个 嵌套生物医学事件的条件概率联合抽取:基于神经网络的统一抽取框架设计gydF4y2B一个 郝gydF4y2B一个 田勇gydF4y2B一个 张gydF4y2B一个 TongxuangydF4y2B一个 一个gydF4y2B一个 杨gydF4y2B一个 王gydF4y2B一个 杨ydF4y2B一个 博士学位gydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0003-1036-9365gydF4y2B一个 王gydF4y2B一个 姜ydF4y2B一个 博士学位gydF4y2B一个 1gydF4y2B一个
计算机科学与技术学院gydF4y2B一个 大连理工大学gydF4y2B一个 灵工路2号gydF4y2B一个 大连116024gydF4y2B一个 中国gydF4y2B一个 86 13604119266gydF4y2B一个 wangjian@dlut.edu.cngydF4y2B一个
https://orcid.org/0000-0002-4656-7446gydF4y2B一个
陆gydF4y2B一个 HuiyigydF4y2B一个 博士学位gydF4y2B一个 2gydF4y2B一个 https://orcid.org/0000-0003-4384-4636gydF4y2B一个 徐gydF4y2B一个 必应gydF4y2B一个 博士学位gydF4y2B一个 2gydF4y2B一个 https://orcid.org/0000-0002-1217-4169gydF4y2B一个 张gydF4y2B一个 出gydF4y2B一个 博士学位gydF4y2B一个 3.gydF4y2B一个 https://orcid.org/0000-0002-5843-4675gydF4y2B一个 BanbhranigydF4y2B一个 Santosh KumargydF4y2B一个 博士学位gydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0003-2573-9162gydF4y2B一个 凌ydF4y2B一个 红飞gydF4y2B一个 博士学位gydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0003-0872-7688gydF4y2B一个
计算机科学与技术学院gydF4y2B一个 大连理工大学gydF4y2B一个 大连gydF4y2B一个 中国gydF4y2B一个 药学系gydF4y2B一个 大连医科大学第二附属医院gydF4y2B一个 大连gydF4y2B一个 中国gydF4y2B一个 信息科学与技术学院gydF4y2B一个 大连海事大学gydF4y2B一个 大连gydF4y2B一个 中国gydF4y2B一个 通讯作者:王健gydF4y2B一个 wangjian@dlut.edu.cngydF4y2B一个 6gydF4y2B一个 2022gydF4y2B一个 7gydF4y2B一个 6gydF4y2B一个 2022gydF4y2B一个 10gydF4y2B一个 6gydF4y2B一个 e37804gydF4y2B一个 8gydF4y2B一个 3.gydF4y2B一个 2022gydF4y2B一个 6gydF4y2B一个 4gydF4y2B一个 2022gydF4y2B一个 15gydF4y2B一个 4gydF4y2B一个 2022gydF4y2B一个 19gydF4y2B一个 4gydF4y2B一个 2022gydF4y2B一个 ©王燕,王健,卢慧毅,徐冰,张一嘉,Santosh Kumar Banbhrani,林鸿飞。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 2022年6月7日。gydF4y2B一个 2022gydF4y2B一个

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到https://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2B一个

背景gydF4y2B一个

事件提取是自然语言处理的基础。在生物医学领域,嵌套事件现象(事件A作为事件B的参与角色)使得提取该事件比提取单个事件更加困难。因此,嵌套生物医学事件的表现总是不尽如人意。此外,以往的工作依赖于管道来构建事件提取模型,忽略了触发器识别和事件参数检测任务之间的依赖关系,产生了严重的级联误差。gydF4y2B一个

客观的gydF4y2B一个

本研究旨在设计一个统一的框架,联合训练生物医学事件触发器和参数,提高嵌套生物医学事件提取的性能。gydF4y2B一个

方法gydF4y2B一个

提出了一种考虑触发器概率分布的端到端联合提取模型,以减轻级联误差。此外,我们将句法结构集成到基于注意力的门图卷积网络中,以捕获触发器和相关实体之间的潜在相互关系,从而提高了提取嵌套生物医学事件的性能。gydF4y2B一个

结果gydF4y2B一个

实验结果表明,本文提出的方法在多层次事件提取生物医学事件提取语料库上取得了最好的F1分数,在生物医学自然语言处理共享任务2011 Genia事件语料库上取得了良好的性能。gydF4y2B一个

结论gydF4y2B一个

由于联合抽取机制和语法图结构,我们的条件概率联合抽取模型能够很好地提取嵌套生物医学事件。此外,由于我们的模型不依赖于外部知识和特定的特征工程,因此具有特殊的泛化性能。gydF4y2B一个

嵌套生物医学事件gydF4y2B一个 联合提取gydF4y2B一个 图卷积网络gydF4y2B一个 政府通讯gydF4y2B一个 骰子的损失gydF4y2B一个 句法结构gydF4y2B一个
介绍gydF4y2B一个 背景gydF4y2B一个

近年来,事件提取研究受到了广泛关注,特别是生物医学事件提取,它对于理解科学语料库中描述的生物分子相互作用至关重要。事件是信息抽取领域中的重要概念。然而,基于不同的研究目的和研究视角,研究者对事件的定义不尽相同。在一般领域中,事件是描述涉及不同参与者的状态变化的特定事物,例如自动内容提取的评估,其中在层次结构中定义了事件的8个类别和33个子类别,每种类型的事件包含不同的语义角色。在生物医学领域,McDonald等[gydF4y2B一个 1gydF4y2B一个]将事件提取定义为多关系提取,其目的是提取事件中不同实体之间的语义角色信息。例如,生物医学自然语言处理(BioNLP)评估任务定义了9种不同类别的生化事件。每个事件包括一个事件触发器和至少一个事件参数,不同的事件类型具有不同的语义角色。与自动内容提取中的事件不同,生物医学事件可能有嵌套的事件现象。gydF4y2B一个

为了清晰地描述生物医学事件提取的进展,我们定义了生物医学事件的4个概念,如下所示gydF4y2B一个 图1gydF4y2B一个和gydF4y2B一个 文本框1gydF4y2B一个。gydF4y2B一个

生物医学事件提取的基本进展,其中黄框表示实体类型,蓝框表示触发类型。主题和原因表示参与者和事件之间的关系,即论点检测。IL-8:白细胞介素8;tnf - α:肿瘤坏死因子。gydF4y2B一个

生物医学事件的概念。gydF4y2B一个

事件类型gydF4y2B一个

不同事件的语义类型gydF4y2B一个

事件描述gydF4y2B一个

一个完整的句子或从句,在文章中具体描述至少一个事件gydF4y2B一个

事件触发gydF4y2B一个

事件描述中表示事件发生的单词或短语;通常指gydF4y2B一个 动词gydF4y2B一个或gydF4y2B一个 nonverbgydF4y2B一个性质,其范畴为事件型;应该注意的是,每个事件只有一个事件触发器。gydF4y2B一个

事件参数gydF4y2B一个

事件参与者描述了事件中不同的语义角色,其类型代表了事件与相关参与者之间的关系;在生物医学事件系统中,有6种不同的语义角色,其中“主题”和“原因”是核心论点。gydF4y2B一个

事件提取任务包括3个子任务:命名实体识别、触发器识别和事件参数检测。以前的研究依赖于管道方法[gydF4y2B一个 2gydF4y2B一个-gydF4y2B一个 5gydF4y2B一个提取生物医学事件。例如,给定事件描述(一个句子),如gydF4y2B一个 图1gydF4y2B一个,事件提取系统在命名实体识别步骤中可以找到该句子中的2个实体(“TNF-alpha”和“IL-8”)。在识别触发器后,它可以识别一个gydF4y2B一个 积极的监管gydF4y2B一个(" Pos_Reg ")由单词触发的事件提及gydF4y2B一个 激活剂gydF4y2B一个和一个gydF4y2B一个 表达式gydF4y2B一个(“Exp”)由单词触发的事件提及gydF4y2B一个 表达式gydF4y2B一个。在识别的实体和触发器的基础上,系统检测参数并将它们与相关的事件触发器关联起来。因此,实体“TNF-alpha”是一个参与者gydF4y2B一个 积极的监管gydF4y2B一个事件,实体“IL-8”是该事件的参与者gydF4y2B一个 表达式gydF4y2B一个事件。由于前一步的结果是后续步骤的输入,如果前一步的精度有偏差,管道方法可能会引入级联误差。gydF4y2B一个

由于句法依赖树丰富了特征表示,以往的研究倾向于利用句法关系来提高事件提取的性能。例如,Kilicoglu等[gydF4y2B一个 2gydF4y2B一个]利用外部工具来分割句子、注释词性(POS)和分析句法依赖性。然后,他们将这些特征结合起来,使用字典和规则提取生物医学事件。Björne等[gydF4y2B一个 4gydF4y2B一个]将句法关系转化为路径嵌入,然后与词嵌入、POS嵌入、实体嵌入、距离嵌入和相对位置嵌入结合,输入卷积神经网络(CNN)模型,提取生物医学事件。但是,以往的研究只采用句法关系作为外部特征,忽略了从句法依赖树中获得的触发器与相关实体之间的相互关系,提高了提取简单事件而非嵌套事件的性能。gydF4y2B一个

在本研究中,我们主要使用多层事件提取(MLEE)语料库[gydF4y2B一个 6gydF4y2B一个]和BioNLP共享任务(BioNLP- st) 2011 Genia事件(GE)语料库[gydF4y2B一个 7gydF4y2B一个来评估我们的方法。对于MLEE将事件提取方法扩展到生物医学信息领域,覆盖从分子到整个生物体的生物组织的各个层面,有一定的解释。MLEE标签方案与BioNLP事件系统相同,但具有更丰富的事件类型:4大类(解剖类、分子类、一般类和计划类)和19个子类。具体信息见gydF4y2B一个 表1gydF4y2B一个。gydF4y2B一个

多层事件提取语料库中的主要事件类型和参数角色(N=6827)。gydF4y2B一个

事件和子事件类型gydF4y2B一个 核心参数gydF4y2B一个 值,n (%)gydF4y2B一个
解剖gydF4y2B一个
细胞增殖gydF4y2B一个 主题(实体)gydF4y2B一个 133 (2.42)gydF4y2B一个
发展gydF4y2B一个 主题(实体)gydF4y2B一个 316 (4.81)gydF4y2B一个
血管发育gydF4y2B一个 主题(实体)gydF4y2B一个 855 (12.91)gydF4y2B一个
增长gydF4y2B一个 主题(实体)gydF4y2B一个 469 (2.65)gydF4y2B一个
死亡gydF4y2B一个 主题(实体)gydF4y2B一个 97 (1.53)gydF4y2B一个
分解gydF4y2B一个 主题(实体)gydF4y2B一个 69 (1.1)gydF4y2B一个
重构gydF4y2B一个 主题(实体)gydF4y2B一个 33 (0.45)gydF4y2B一个
分子gydF4y2B一个
合成gydF4y2B一个 主题(实体)gydF4y2B一个 17 (0.3)gydF4y2B一个
基因表达gydF4y2B一个 主题(实体)gydF4y2B一个 435 (6.66)gydF4y2B一个
转录gydF4y2B一个 主题(实体)gydF4y2B一个 37 (0.61)gydF4y2B一个
分解代谢gydF4y2B一个 主题(实体)gydF4y2B一个 26日(0.39)gydF4y2B一个
磷酸化gydF4y2B一个 主题(实体)gydF4y2B一个 33 (0.5)gydF4y2B一个
去磷酸化gydF4y2B一个 主题(实体)gydF4y2B一个 6 (0.09)gydF4y2B一个
一般gydF4y2B一个
本地化gydF4y2B一个 主题(实体)gydF4y2B一个 450 (6.87)gydF4y2B一个
绑定gydF4y2B一个 主题(实体)gydF4y2B一个 187 (2.92)gydF4y2B一个
监管gydF4y2B一个 主题(实体或事件)和原因(实体或事件)gydF4y2B一个 773 (11.81)gydF4y2B一个
积极的监管gydF4y2B一个 主题(实体或事件)和原因(实体或事件)gydF4y2B一个 1327 (20.33)gydF4y2B一个
消极的监管gydF4y2B一个 主题(实体或事件)和原因(实体或事件)gydF4y2B一个 921 (14.08)gydF4y2B一个
计划gydF4y2B一个
计划过程gydF4y2B一个 主题(实体或事件)gydF4y2B一个 643 (9.9)gydF4y2B一个

为了减少级联错误的影响,我们提出了一种端到端的条件概率联合提取(CPJE)方法,该方法可以有效地将触发器分布信息传递给事件参数检测任务。为了捕获触发器和相关实体之间的相互关系,提高生物医学事件嵌套提取的性能,我们将句法依赖树集成到一个基于注意力的门图卷积网络(GCN)中,该网络可以捕获关键信息的流向。本研究的贡献如下:gydF4y2B一个

我们提出了一个端到端的CPJE框架,CPJE,它有效地利用触发器分布信息来提高事件参数检测的性能,并削弱整个事件提取过程中的级联错误。gydF4y2B一个

我们使用句法依赖树来捕获触发器和相关实体之间的相互关系,并将该树集成到基于注意力的门GCN中以提取嵌套的生物医学事件。gydF4y2B一个

我们在MLEE和BioNLP-ST 2011 GE语料库上获得了最先进的性能,用于提取嵌套的生物医学事件。gydF4y2B一个

我们总结了事件提取任务的当前框架gydF4y2B一个 相关的工作gydF4y2B一个部分。中介绍了我们的框架gydF4y2B一个 方法gydF4y2B一个部分。中显示整体性能gydF4y2B一个 结果gydF4y2B一个部分。我们介绍消融研究,可视化和案例研究gydF4y2B一个 讨论gydF4y2B一个部分。本文对本文的工作进行了总结,并对今后的研究方向进行了讨论gydF4y2B一个 结论gydF4y2B一个部分。gydF4y2B一个

相关的工作gydF4y2B一个

生物医学事件提取问题类似于一般领域事件提取和实体关系提取;因此,我们有许多理论基础和实验方法可供借鉴。gydF4y2B一个

实体关系提取gydF4y2B一个

生物医学事件可以看作是复杂的关系提取任务,关系提取方法在各个领域都取得了优异的效果。因此,我们研究了一些关系提取方法,以帮助构思事件提取模型的构建。随着深度学习的发展,越来越多的研究人员使用深度学习算法来实现实体关系的联合提取[gydF4y2B一个 8gydF4y2B一个].为了解决标记样本数量稀疏的问题,将远程监督方法应用于关系提取任务[gydF4y2B一个 9gydF4y2B一个].深度强化学习(RL)算法也被应用于关系提取任务,以解决有噪声的数据样本[gydF4y2B一个 10gydF4y2B一个].此外,随着图神经网络(gnn)的广泛应用,gnn已被用于某些关系提取任务[gydF4y2B一个 11gydF4y2B一个,gydF4y2B一个 12gydF4y2B一个].gydF4y2B一个

通用领域事件提取gydF4y2B一个

总的来说,新闻事件提取是一个研究热点。一些方法通过研究特征工程提高了事件提取的性能。句子级特征提取包括触发器和事件参数的组合特征[gydF4y2B一个 13gydF4y2B一个]或触发器和实体关系的组合特征[gydF4y2B一个 14gydF4y2B一个].文档级特征提取包括从多个文档中提取公共信息事件[gydF4y2B一个 15gydF4y2B一个]和基于潜变量半马尔可夫条件随机场的联合事件参数提取[gydF4y2B一个 16gydF4y2B一个].其他人也使用深度学习来减少特征工程,这提高了模型的泛化能力和提取性能;例如,使用循环神经网络学习上下文依赖信息[gydF4y2B一个 17gydF4y2B一个],用非连续cnn检测事件[gydF4y2B一个 18gydF4y2B一个],利用GCNs获取句法结构信息[gydF4y2B一个 19gydF4y2B一个].这些方法为生物医学事件的提取奠定了较好的基础。gydF4y2B一个

生物医学事件提取gydF4y2B一个

提取生物医学事件是BioNLP-STs中的一项[gydF4y2B一个 7gydF4y2B一个,gydF4y2B一个 20.gydF4y2B一个,gydF4y2B一个 21gydF4y2B一个].以往的研究主要是基于支持向量机模型探索人类工程特征[gydF4y2B一个 22gydF4y2B一个-gydF4y2B一个 25gydF4y2B一个].由于管道方法中的误差传递,Riedel等[gydF4y2B一个 26gydF4y2B一个]开发了具有双重分解的联合模型,Venugopal等[gydF4y2B一个 27gydF4y2B一个利用马尔可夫逻辑网络进行联合推理。最近,大多数研究都观察到神经模型的显著益处。例如,一些人已经开始使用不同的神经模型添加POS标签和句法分析[gydF4y2B一个 28gydF4y2B一个],利用半监督框架改进了生物医学事件提取模型[gydF4y2B一个 29gydF4y2B一个],试图利用注意机制获取生物医学文本的语义关系[gydF4y2B一个 5gydF4y2B一个],并使用分布式表示获得上下文嵌入[gydF4y2B一个 3.gydF4y2B一个,gydF4y2B一个 4gydF4y2B一个,gydF4y2B一个 30.gydF4y2B一个,gydF4y2B一个 31gydF4y2B一个].为了从生物医学知识库(KB)中吸收更多信息,Zhao等[gydF4y2B一个 32gydF4y2B一个]利用RL框架从外部生物医学知识库中提取生物医学事件。Li等[gydF4y2B一个 33gydF4y2B一个将基因本体融合成具有分布表征的树状长短期记忆模型。Huang等[gydF4y2B一个 34gydF4y2B一个]使用GNN分层模拟来自统一医学语言系统的两个基于知识的视图,具有概念和语义推理路径。Trieu等[gydF4y2B一个 35gydF4y2B一个]使用多个重叠的、有向的、无环的图结构,共同提取生物医学实体、触发器、角色和事件。Zhao等[gydF4y2B一个 36gydF4y2B一个]将基于依赖的GCN与超图相结合,共同提取生物医学事件。Ramponi等[gydF4y2B一个 37gydF4y2B一个提出了一种联合端到端框架,该框架将生物医学事件提取视为具有多标签感知编码策略的序列标记。gydF4y2B一个

与这些方法相比,我们的方法联合提取具有概率分布的生物医学事件,减轻了流水线方法带来的级联误差。此外,考虑到触发器和相关实体之间的潜在相互关系,我们的方法将句法结构集成到基于注意力的门GCN中,以捕获关键信息的流向,从而大大提高了嵌套生物医学事件的提取性能。值得一提的是,我们的方法不需要任何外部资源来协助生物医学事件提取任务。gydF4y2B一个

方法gydF4y2B一个 概述gydF4y2B一个

本节说明建议的CPJE模型。让gydF4y2B一个 WgydF4y2B一个= {gydF4y2B一个 wgydF4y2B一个1gydF4y2B一个,gydF4y2B一个 wgydF4y2B一个2gydF4y2B一个,…,gydF4y2B一个 wgydF4y2B一个ngydF4y2B一个是一个有长度的句子gydF4y2B一个 ngydF4y2B一个,在那里gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个是gydF4y2B一个 我gydF4y2B一个句子中的单词。同样的,gydF4y2B一个 EgydF4y2B一个= {gydF4y2B一个 egydF4y2B一个1gydF4y2B一个,gydF4y2B一个 egydF4y2B一个2gydF4y2B一个,…,gydF4y2B一个 egydF4y2B一个kgydF4y2B一个}是句子中提到的一组实体,其中gydF4y2B一个 kgydF4y2B一个是实体的数量。由于触发器可能包含多个令牌,因此我们使用BIO标记方案来注释句子中每个令牌的触发器类型。当我们获得句子中相应的事件触发器时,我们使用该信息来预测相应的事件参数。gydF4y2B一个

如图所示gydF4y2B一个 图2gydF4y2B一个CPJE模型主要包括3层:输入层、信息提取层和联合提取层。输入层将非结构化文本信息(如词序列、句法结构树、POS标签表示和实体标签信息)转换为结构化的离散表示,并将其输入到下一层。信息提取层将离散信息转化为连续特征表示,深度提取句子中的语义和依赖信息。联合提取层对之前的融合信息进行解析,并将解析后的信息发送到触发softmax分类器和事件softmax分类器中,共同提取生物医学事件。gydF4y2B一个

条件概率联合抽取框架的架构,其中数字0 ~ 9代表句子中的每个单词,蓝色条代表BioBERT嵌入,黄色条代表POS-tagging嵌入,绿色条代表实体嵌入。BERT:来自变压器的双向编码器表示BioBERT:来自变形金刚的生物医学双向编码器表示B-BVD: b血管发育;LSTM:长短期记忆;词性:词性。gydF4y2B一个

信息提取层gydF4y2B一个

由于输入层太肤浅(仅将文本转换为数字序列),因此没有详细解释这一点。信息提取层的每个模块将在以下几节中介绍。gydF4y2B一个

词表示gydF4y2B一个

在单词表示模块中,提高对每个单词初始特征的表示能力gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个在句子中转换为实值向量gydF4y2B一个 xgydF4y2B一个我gydF4y2B一个通过连接以下各节中描述的嵌入。gydF4y2B一个

基于变压器嵌入的生物医学双向编码器表示gydF4y2B一个

我们使用了生物医学双向编码器表示(BioBERT)预训练模型[gydF4y2B一个 38gydF4y2B一个来获得单词的动态语义表示gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个。BioBERT嵌入包括令牌嵌入、段嵌入和位置嵌入,由多层双向变压器编码。因此,它包含了丰富的语义和位置信息。此外,它还可以解决单词的多义问题。我们定义gydF4y2B一个 一个gydF4y2B一个我gydF4y2B一个作为词向量表示的词gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个。gydF4y2B一个

词类嵌入gydF4y2B一个

我们使用随机初始化的pos标注嵌入表来获得每个pos标注向量。我们定义gydF4y2B一个 bgydF4y2B一个我gydF4y2B一个作为该词的pos标记向量表示gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个。gydF4y2B一个

实体标签嵌入gydF4y2B一个

与pos标签嵌入相似,我们使用BIO标签方案对句子中提到的实体进行标注,并通过查阅嵌入表将实体类型标签转换为实值向量。我们定义gydF4y2B一个 cgydF4y2B一个我gydF4y2B一个作为单词的实体向量表示gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个。gydF4y2B一个

令牌的转换gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个到向量gydF4y2B一个 xgydF4y2B一个我gydF4y2B一个转换输入句子gydF4y2B一个 WgydF4y2B一个变成一个实值向量序列gydF4y2B一个 XgydF4y2B一个= {gydF4y2B一个 xgydF4y2B一个1gydF4y2B一个,gydF4y2B一个 xgydF4y2B一个2gydF4y2B一个,…,gydF4y2B一个 xgydF4y2B一个ngydF4y2B一个},gydF4y2B一个,在那里gydF4y2B一个是连接操作,gydF4y2B一个 xgydF4y2B一个我gydF4y2B一个μ维(即?的维数之和gydF4y2B一个 一个gydF4y2B一个我gydF4y2B一个,gydF4y2B一个 bgydF4y2B一个我gydF4y2B一个,gydF4y2B一个 cgydF4y2B一个我gydF4y2B一个),gydF4y2B一个。gydF4y2B一个 XgydF4y2B一个被输入到后续块中,以获得更有价值的信息,用于提取生物医学事件。gydF4y2B一个

双向LSTMgydF4y2B一个

为了获取输入文本的上下文信息,避免长文本带来的梯度爆炸问题,我们选择经典的双向LSTM (BiLSTM)结构来提取单词表示的上下文特征。gydF4y2B一个

我们输入单词表示序列gydF4y2B一个 XgydF4y2B一个= {gydF4y2B一个 xgydF4y2B一个1gydF4y2B一个,gydF4y2B一个 xgydF4y2B一个2gydF4y2B一个,…,gydF4y2B一个 xgydF4y2B一个ngydF4y2B一个}转换成BiLSTM,得到正向隐藏单元gydF4y2B一个 hgydF4y2B一个tgydF4y2B一个fgydF4y2B一个以及向后隐藏单元gydF4y2B一个 hgydF4y2B一个tgydF4y2B一个bgydF4y2B一个在时间上具有φ维数gydF4y2B一个 tgydF4y2B一个根据方程1。我们将前向LSTM和后向LSTM的所有隐藏状态表示为gydF4y2B一个和gydF4y2B一个,分别为gydF4y2B一个 ngydF4y2B一个为LSTM隐藏单元的个数:gydF4y2B一个

最后,我们将这两个矩阵连接起来以获得上下文表示gydF4y2B一个BiLSTM:gydF4y2B一个

门之下gydF4y2B一个

为了获得句子的句法依赖性,我们参考Liu等人提出的方法[gydF4y2B一个 19gydF4y2B一个应用gate GCN模型分析句子相关特征。我们考虑无向图G=(gydF4y2B一个 VgydF4y2B一个, ε)作为句子的句法依赖树gydF4y2B一个 WgydF4y2B一个,在那里gydF4y2B一个 VgydF4y2B一个是节点的集合,ε是边的集合。定义gydF4y2B一个,gydF4y2B一个 vgydF4y2B一个我gydF4y2B一个代表每个单词gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个的句子gydF4y2B一个 WgydF4y2B一个,每条边gydF4y2B一个表示从单词开始的定向语法弧gydF4y2B一个 wgydF4y2B一个我gydF4y2B一个对单词gydF4y2B一个 wgydF4y2B一个jgydF4y2B一个,具有依赖类型gydF4y2B一个 再保险gydF4y2B一个。此外,为了沿着方向移动信息,我们添加了相应的反向边(gydF4y2B一个 vgydF4y2B一个wgydF4y2B一个,gydF4y2B一个 vgydF4y2B一个我gydF4y2B一个),带有依赖类型gydF4y2B一个 再保险的gydF4y2B一个自我循环(gydF4y2B一个 vgydF4y2B一个我gydF4y2B一个,gydF4y2B一个 vgydF4y2B一个我gydF4y2B一个)。gydF4y2B一个 vgydF4y2B一个我gydF4y2B一个。根据统计,我们使用了斯坦福解析器[gydF4y2B一个 39gydF4y2B一个来获得大约50种不同的句法依赖关系。为了便于GCN内部计算,我们只考虑信息流的方向,将原来的依赖关系简化为3种形式,如式4所示:gydF4y2B一个

为节点gydF4y2B一个,我们可以用隐藏向量gydF4y2B一个 hgydF4y2B一个vgydF4y2B一个(j)gydF4y2B一个在gydF4y2B一个 jgydF4y2B一个栅极GCN层来计算隐藏向量gydF4y2B一个 hgydF4y2B一个vgydF4y2B一个(j + 1)gydF4y2B一个下一层:gydF4y2B一个

在哪里gydF4y2B一个 再保险gydF4y2B一个(gydF4y2B一个 ugydF4y2B一个,gydF4y2B一个 vgydF4y2B一个)是节点之间的依赖类型gydF4y2B一个 ugydF4y2B一个和gydF4y2B一个 vgydF4y2B一个,gydF4y2B一个 WgydF4y2B一个再保险(u, v)gydF4y2B一个 (j)gydF4y2B一个和gydF4y2B一个 bgydF4y2B一个再保险(u, v)gydF4y2B一个 (j)gydF4y2B一个分别为权重矩阵和偏置。gydF4y2B一个 NgydF4y2B一个(gydF4y2B一个 vgydF4y2B一个)是节点的邻居的集合gydF4y2B一个 vgydF4y2B一个,包括gydF4y2B一个 VgydF4y2B一个。边的权重(gydF4y2B一个 ugydF4y2B一个,gydF4y2B一个 vgydF4y2B一个)是gydF4y2B一个 ggydF4y2B一个u, vgydF4y2B一个 (j)gydF4y2B一个,将栅极应用于边缘,表示边缘的重要性,如式6所示:gydF4y2B一个

在这里,gydF4y2B一个 VgydF4y2B一个再保险(u, v)gydF4y2B一个 jgydF4y2B一个和gydF4y2B一个 dgydF4y2B一个再保险(u, v)gydF4y2B一个 jgydF4y2B一个分别为栅极权矩阵和偏置。我们使用了BioBERT嵌入gydF4y2B一个 一个gydF4y2B一个= {gydF4y2B一个 一个gydF4y2B一个1gydF4y2B一个,gydF4y2B一个 一个gydF4y2B一个2gydF4y2B一个,…,gydF4y2B一个 一个gydF4y2B一个ngydF4y2B一个}初始化第一层GCN的输入。叠加gydF4y2B一个 kgydF4y2B一个GCN各层可以得到一个句法信息矩阵gydF4y2B一个,在那里gydF4y2B一个 米gydF4y2B一个节点的维数是多少gydF4y2B一个 vgydF4y2B一个我gydF4y2B一个的相同维数gydF4y2B一个 一个gydF4y2B一个我gydF4y2B一个。gydF4y2B一个

多头的关注gydF4y2B一个

如图所示gydF4y2B一个 图2gydF4y2B一个,多头注意力[gydF4y2B一个 40gydF4y2B一个)由gydF4y2B一个 HgydF4y2B一个自关注,可以彻底了解节点之间的相似度,并计算每个节点的重要性,使模型能够关注更关键的节点特征。让gydF4y2B一个 WgydF4y2B一个我gydF4y2B一个问gydF4y2B一个,gydF4y2B一个 WgydF4y2B一个我gydF4y2B一个KgydF4y2B一个,gydF4y2B一个 WgydF4y2B一个我gydF4y2B一个VgydF4y2B一个是gydF4y2B一个 我gydF4y2B一个的初始化权矩阵gydF4y2B一个 问gydF4y2B一个,gydF4y2B一个 K,gydF4y2B一个和gydF4y2B一个 VgydF4y2B一个,由式7可知:gydF4y2B一个

在这里,gydF4y2B一个,gydF4y2B一个,gydF4y2B一个,gydF4y2B一个 dgydF4y2B一个kgydF4y2B一个=gydF4y2B一个 dgydF4y2B一个vgydF4y2B一个=gydF4y2B一个 米gydF4y2B一个/gydF4y2B一个 HgydF4y2B一个。gydF4y2B一个

我们计算了得分矩阵gydF4y2B一个 我gydF4y2B一个根据方程8的头。连接后gydF4y2B一个 HgydF4y2B一个正面,我们用方程9得到了注意力输出矩阵gydF4y2B一个 米gydF4y2B一个。gydF4y2B一个是线性变换矩阵:gydF4y2B一个

节理抽采层gydF4y2B一个 薄铁片gydF4y2B一个

该标注器由单向LSTM(以BiLSTM给出的上下文表示作为输入)和注意力GCN模块生成的语法依赖表示(语法依赖表示)组成,用于解析前一层的信息。让gydF4y2B一个。完成标注模块后,我们得到了输出矩阵gydF4y2B一个 OgydF4y2B一个,将其发送给条件概率提取模块。gydF4y2B一个

条件概率提取gydF4y2B一个

大多数联合抽取模型同时将相同的源信息输入到不同的子任务分类器中,实现信息共享,如式10所示,其中gydF4y2B一个触发器的输出是否符合时间步长gydF4y2B一个 我gydF4y2B一个和gydF4y2B一个参数的输出是同步的吗gydF4y2B一个 jgydF4y2B一个。gydF4y2B一个

然而,当同一数据集中2个子任务的出现频率相差较大时,模型容易关注高频子任务而忽略低频子任务。与生物医学事件提取任务类似,对于触发器识别和事件参数检测子任务,每个事件触发器(即生物医学事件)可以包含0、1或2个参与元素,并且参与元素也可以是另一个事件;因此,触发器识别任务的贡献将大于事件参数检测任务。为了缓解上述问题,减少这两个子任务之间的级联误差,我们将触发识别后的softmax输出与源信息相结合,提取触发向量gydF4y2B一个 TrgydF4y2B一个我gydF4y2B一个事件参数向量gydF4y2B一个 可以gydF4y2B一个jgydF4y2B一个根据触发器和候选参数的位置。最后,将其聚合输入事件提取分类器中,学习触发标签的分布特征,直接实现生物医学事件提取,无需后处理。gydF4y2B一个

在这里,gydF4y2B一个 WgydF4y2B一个三gydF4y2B一个 和gydF4y2B一个 bgydF4y2B一个三gydF4y2B一个 分别是触发识别的权重矩阵和偏差。的触发softmax的概率输出gydF4y2B一个 kgydF4y2B一个这个词是gydF4y2B一个 软gydF4y2B一个kgydF4y2B一个。gydF4y2B一个 WgydF4y2B一个事件gydF4y2B一个 和gydF4y2B一个 bgydF4y2B一个事件gydF4y2B一个 分别是事件提取的权重矩阵和偏差。的字数gydF4y2B一个 我gydF4y2B一个触发器和gydF4y2B一个 jgydF4y2B一个候选的论点是gydF4y2B一个 我gydF4y2B一个米gydF4y2B一个和gydF4y2B一个 jgydF4y2B一个ngydF4y2B一个,分别。gydF4y2B一个 OgydF4y2B一个kgydF4y2B一个源信息向量是gydF4y2B一个 kgydF4y2B一个词。gydF4y2B一个

对比方程10和方程11,我们发现它只使用方程10实现了触发器和事件参数的联合提取;因此,它需要后处理来找出事件元组。然而,由于触发器分布信息的聚合,我们可以发现哪些事件参数属于步骤的触发器gydF4y2B一个 tgydF4y2B一个用方程11。gydF4y2B一个

联合骰子损失gydF4y2B一个

由于生物医学事件语料库数据稀疏,正反例不平衡,交叉熵或负对数似然损失函数导致准确率和召回率之间存在较大差异。为了缓解这个问题,我们提出使用一个联合权值自调整的Dice损失函数[gydF4y2B一个 41gydF4y2B一个],详情如下:gydF4y2B一个

在这里,gydF4y2B一个 NgydF4y2B一个为语料库中句子的数量;gydF4y2B一个 ngydF4y2B一个pgydF4y2B一个,gydF4y2B一个 tgydF4y2B一个pgydF4y2B一个,gydF4y2B一个 egydF4y2B一个pgydF4y2B一个的令牌、提取的触发器候选项和参数的数量是否为gydF4y2B一个 lgydF4y2B一个句子中,λ用于平滑目的,β是调整损失的超参数,θ是需要训练的模型参数。gydF4y2B一个

培训gydF4y2B一个

CPJE模型采用多个epoch进行训练。在每个epoch中,我们将训练集分成几个批次,每个批次包含一个句子列表,每个句子包含一组可变长度的标记。一个批次在一个时间步骤中进行。gydF4y2B一个

对于每个批处理,我们首先运行信息提取层来生成上下文表示gydF4y2B一个以及具有句法信息的注意表征gydF4y2B一个。然后,我们结合gydF4y2B一个 lgydF4y2B一个和gydF4y2B一个 米gydF4y2B一个作为LSTM的输入,生成源信息gydF4y2B一个 OgydF4y2B一个。最后,我们运行联合提取层来计算整个网络输出(触发器和事件)的梯度。之后,我们通过CPJE将错误从输出反向传播到输入,并更新所有网络参数。CPJE模型的总体过程总结于gydF4y2B一个 文本框2gydF4y2B一个。gydF4y2B一个

条件概率联合抽取模型的训练过程。gydF4y2B一个

输入gydF4y2B一个

记号序列{gydF4y2B一个 wgydF4y2B一个1gydF4y2B一个,…,gydF4y2B一个 wgydF4y2B一个ngydF4y2B一个}以及相应的事件标签gydF4y2B一个

边集{gydF4y2B一个 egydF4y2B一个12gydF4y2B一个,…,gydF4y2B一个 egydF4y2B一个ijgydF4y2B一个,…,gydF4y2B一个 egydF4y2B一个锰gydF4y2B一个}为每个对应的标记gydF4y2B一个

输出gydF4y2B一个

所有参数在条件概率联合抽取模型中gydF4y2B一个

对于每一个时代gydF4y2B一个

对于每一个时代gydF4y2B一个

生成gydF4y2B一个 lgydF4y2B一个和gydF4y2B一个 米gydF4y2B一个通过方程3和9的信息提取层gydF4y2B一个

连接gydF4y2B一个 lgydF4y2B一个和gydF4y2B一个 米gydF4y2B一个作为gydF4y2B一个 TgydF4y2B一个

生成源信息gydF4y2B一个 OgydF4y2B一个= {gydF4y2B一个 ogydF4y2B一个1gydF4y2B一个,…,gydF4y2B一个 ogydF4y2B一个ngydF4y2B一个通过长短期记忆gydF4y2B一个

计算触发分数gydF4y2B一个 ygydF4y2B一个tgydF4y2B一个触发软最大概率gydF4y2B一个 软gydF4y2B一个通过公式11中的第一个方程,将接头提取层中的“SoftMax Trigger”块gydF4y2B一个

保险丝gydF4y2B一个 OgydF4y2B一个和gydF4y2B一个 软gydF4y2B一个通过方程11中的第二和第三个方程gydF4y2B一个

计算事件得分gydF4y2B一个 ygydF4y2B一个tgydF4y2B一个。通过公式11中的第四个方程,将接头提取层中的“SoftMax事件”块gydF4y2B一个

通过反向传播算法更新参数gydF4y2B一个

结束了gydF4y2B一个

结束了gydF4y2B一个

数据gydF4y2B一个

我们的实验主要在MLEE语料库上进行[gydF4y2B一个 6gydF4y2B一个],如gydF4y2B一个 表2gydF4y2B一个,其中包含4个类别,其中包含19个预定义的触发器子类别。总共有262个文档,56,588个单词,8291个实体和6677个事件。从gydF4y2B一个 表2gydF4y2B一个,我们注意到解剖级事件的数量高于分子级和计划级事件的数量,尽管一般生物医学事件总体上占主导地位。总的来说,18%(1202/6677)的总事件涉及分子和解剖水平上的直接或间接争论。从gydF4y2B一个 表1gydF4y2B一个,我们发现监管、积极监管、消极监管和计划过程事件的论点可能不仅仅是实体,还可能是其他事件;因此,这些事件是嵌套事件,约占所有事件的54.87%(3664/6677)。gydF4y2B一个

多级事件提取统计信息。gydF4y2B一个

项gydF4y2B一个 培训,n (%)gydF4y2B一个 发展,n (%)gydF4y2B一个 测试,n (%)gydF4y2B一个 总NgydF4y2B一个
文档gydF4y2B一个 131 (50)gydF4y2B一个 44 (16.8)gydF4y2B一个 87 (33.2)gydF4y2B一个 262gydF4y2B一个
句子gydF4y2B一个 1271 (48.73)gydF4y2B一个 457 (17.52)gydF4y2B一个 880 (33.74)gydF4y2B一个 2608gydF4y2B一个
词gydF4y2B一个 27875 (49.26)gydF4y2B一个 9610 (16.98)gydF4y2B一个 19103 (33.76)gydF4y2B一个 56588年gydF4y2B一个
实体gydF4y2B一个 4147 (50.02)gydF4y2B一个 1431 (17.26)gydF4y2B一个 2713 (32.72)gydF4y2B一个 8291gydF4y2B一个
事件gydF4y2B一个 3296 (49.36)gydF4y2B一个 1175 (17.6)gydF4y2B一个 2206 (33.04)gydF4y2B一个 6677gydF4y2B一个
解剖gydF4y2B一个 810 (48.36)gydF4y2B一个 269 (16.06)gydF4y2B一个 596 (35.58)gydF4y2B一个 1675gydF4y2B一个
分子gydF4y2B一个 340 (48.2)gydF4y2B一个 125 (17.7)gydF4y2B一个 240 (34.0)gydF4y2B一个 705gydF4y2B一个
一般gydF4y2B一个 1851 (50.66)gydF4y2B一个 627 (17.16)gydF4y2B一个 1176 (32.18)gydF4y2B一个 3654gydF4y2B一个
计划gydF4y2B一个 295 (45.9)gydF4y2B一个 154 (24.0)gydF4y2B一个 194 (30.2)gydF4y2B一个 643gydF4y2B一个

此外,我们使用BioNLP-ST 2011 GE语料库验证了我们的实验[gydF4y2B一个 7gydF4y2B一个].如图所示gydF4y2B一个 表3gydF4y2B一个, BioNLP-ST 2011 GE语料库定义了9种生物医学事件类型。值得注意的是gydF4y2B一个 绑定gydF4y2B一个事件可能需要>1个蛋白质实体作为其主题参数,并且agydF4y2B一个 监管gydF4y2B一个事件很可能需要一个蛋白质或一个事件作为它的主题论证,并且需要一个蛋白质或一个事件作为它的原因论证。37.20%(9288/24,967)的事件(调控、正向调控和负向调控)导致了巢状结构。gydF4y2B一个

BioNLP-STa 2011 GEb语料库中的主要事件类型和核心论点角色以及GE语料库的重要统计信息。gydF4y2B一个

事件类型和BioNLP-ST 2011 GE项目gydF4y2B一个 核心参数gydF4y2B一个 N值,gydF4y2B一个
事件类型gydF4y2B一个
基因表达gydF4y2B一个 主题(蛋白质)gydF4y2B一个 N/AgydF4y2B一个cgydF4y2B一个
转录gydF4y2B一个 主题(蛋白质)gydF4y2B一个 N/AgydF4y2B一个
蛋白质分解代谢gydF4y2B一个 主题(蛋白质)gydF4y2B一个 N/AgydF4y2B一个
磷酸化gydF4y2B一个 主题(蛋白质)gydF4y2B一个 N/AgydF4y2B一个
本地化gydF4y2B一个 主题(蛋白质)gydF4y2B一个 N/AgydF4y2B一个
绑定gydF4y2B一个 主题(蛋白质)gydF4y2B一个dgydF4y2B一个 N/AgydF4y2B一个
监管gydF4y2B一个 主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个 N/AgydF4y2B一个
积极的监管gydF4y2B一个 主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个 N/AgydF4y2B一个
消极的监管gydF4y2B一个 主题(蛋白质或事件)和原因(蛋白质或事件)gydF4y2B一个 N/AgydF4y2B一个
BioNLP-ST 2011 GE语料库统计gydF4y2B一个
文档gydF4y2B一个 N/AgydF4y2B一个 1224gydF4y2B一个
词gydF4y2B一个 N/AgydF4y2B一个 348908年gydF4y2B一个
实体gydF4y2B一个 N/AgydF4y2B一个 21616年gydF4y2B一个
事件gydF4y2B一个 N/AgydF4y2B一个 24967年gydF4y2B一个

一个gydF4y2B一个BioNLP- st: BioNLP共享任务。gydF4y2B一个

bgydF4y2B一个GE: Genia事件。gydF4y2B一个

cgydF4y2B一个-不适用。gydF4y2B一个

dgydF4y2B一个表示参数>1的个数。gydF4y2B一个

Hyperparameter设置gydF4y2B一个

对于我们实验的超参数设置,我们为BioBERT嵌入设置了768个维度,为pos标记和实体标签嵌入设置了64个维度。我们应用了一个包含128个隐藏单元的1层BiLSTM,并对我们的模型使用了一个2层GCN和2头自注意。辍学率为0.3,学习率为0.01,优化函数为随机梯度下降(SGD)。CPJE模型的训练基于Ubuntu 20.04操作系统,使用PyTorch(1.9.0版本)和Python(3.8.8版本)。图形处理单元是NVIDIA TITAN Xp,内存为12gb。gydF4y2B一个

结果gydF4y2B一个 MLEE的整体表现gydF4y2B一个

我们将我们的性能与中所示的基线进行比较gydF4y2B一个 文本框3gydF4y2B一个。gydF4y2B一个

性能基准。gydF4y2B一个

EventMinegydF4y2B一个

Pyysalo等[gydF4y2B一个 6gydF4y2B一个]应用了一种基于流水线的事件提取系统,主要依靠支持向量机分类器实现触发器识别和事件提取。gydF4y2B一个

Semisupervised学习gydF4y2B一个

这是Zhou等人提出的半监督学习框架[gydF4y2B一个 30.gydF4y2B一个],它可以使用未注释的数据提取生物医学事件。gydF4y2B一个

卷积神经网络gydF4y2B一个

Wang等[gydF4y2B一个 3.gydF4y2B一个]使用卷积神经网络和多个分布式特征向量表示来实现事件提取任务。gydF4y2B一个

具有多层次注意机制的双向长短期记忆和基于依赖的词嵌入gydF4y2B一个

他等人[gydF4y2B一个 5gydF4y2B一个提出了一种基于多层次注意机制和基于依赖的词嵌入的双向长短期记忆神经网络提取生物医学事件。gydF4y2B一个

强化学习+知识库gydF4y2B一个

Zhao等[gydF4y2B一个 32gydF4y2B一个]提出了一种基于外部生物医学知识库的强化学习框架,用于提取生物医学事件。gydF4y2B一个

DeepEventMinegydF4y2B一个

Trieu等[gydF4y2B一个 35gydF4y2B一个提出了一个端到端神经模型。它使用多重叠有向无环图来检测嵌套的生物医学实体、触发器、角色和事件。gydF4y2B一个

分层人工神经网络gydF4y2B一个

Zhao等[gydF4y2B一个 36gydF4y2B一个]提出了一种文档级联合生物医学事件提取的二级建模方法。gydF4y2B一个

表4gydF4y2B一个说明了使用金标准实体的最先进方法的总体性能。从该表中可以看出,我们的CPJE模型在触发器识别任务中只取得了轻微的改进。对于事件提取任务,FgydF4y2B一个1gydF4y2B一个得分明显优于其他基线。值得注意的是,我们的模型的准确率和召回率之间的差距比mdBLSTM(双向长短期记忆,多层次注意机制和基于依赖的词嵌入)模型要小得多,精度也比RL+KBs模型好得多。这表明我们的模型在减少级联错误方面比管道模型有更好的效果。此外,层次人工神经网络(HANN)模型也是一种联合抽取模型;然而,它的表现令人失望。这是因为HANN模型专注于提取文档级生物医学事件,其中包含许多跨句实体、触发器和事件。然而,其他模型旨在提取句子级事件;因此,这些模型的性能优于HANN模型。gydF4y2Ba

多层事件提取的总体性能与具有金标准实体的最先进方法的比较。gydF4y2B一个

方法gydF4y2B一个 触发识别(%)gydF4y2B一个 事件提取(%)gydF4y2B一个
精度gydF4y2B一个 回忆gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个 精度gydF4y2B一个 回忆gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个
EventMinegydF4y2B一个一个gydF4y2B一个 70.79gydF4y2B一个 81.69gydF4y2B一个 75.84gydF4y2B一个 62.28gydF4y2B一个 49.56gydF4y2B一个 55.20gydF4y2B一个
SSLgydF4y2B一个a、bgydF4y2B一个 72.17gydF4y2B一个 82.26gydF4y2B一个 76.89gydF4y2B一个 55.76gydF4y2B一个 59.16gydF4y2B一个 57.41gydF4y2B一个
美国有线电视新闻网gydF4y2B一个a、cgydF4y2B一个 80.92gydF4y2B一个 75.23gydF4y2B一个 77.97gydF4y2B一个 60.56gydF4y2B一个 56.23gydF4y2B一个 58.31gydF4y2B一个
mdBLSTMgydF4y2B一个,维gydF4y2B一个 82.79gydF4y2B一个 76.56gydF4y2B一个 79.55gydF4y2B一个 90.24gydF4y2B一个 44.50gydF4y2B一个 59.61gydF4y2B一个
RLgydF4y2B一个egydF4y2B一个+ KBsgydF4y2B一个一个fgydF4y2B一个 N/AgydF4y2B一个ggydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个 63.78gydF4y2B一个 56.81gydF4y2B一个 60.09gydF4y2B一个
DeepEventMinegydF4y2B一个hgydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个 69.91gydF4y2B一个 55.49gydF4y2B一个 61.87gydF4y2B一个
损害gydF4y2B一个h,我gydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个 63.91gydF4y2B一个 56.08gydF4y2B一个 59.74gydF4y2B一个
我们的模型gydF4y2B一个hgydF4y2B一个 82.20gydF4y2B一个 78.25gydF4y2B一个 80.18gydF4y2B一个 72.26gydF4y2B一个 55.23gydF4y2B一个 62.80gydF4y2B一个jgydF4y2B一个

一个gydF4y2B一个管道模型。gydF4y2B一个

bgydF4y2B一个SSL:半监督学习。gydF4y2B一个

cgydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

dgydF4y2B一个具有多层次注意机制和基于依赖的词嵌入的双向长短期记忆gydF4y2B一个

egydF4y2B一个强化学习。gydF4y2B一个

fgydF4y2B一个知识库:知识库gydF4y2B一个

ggydF4y2B一个-不适用。gydF4y2B一个

hgydF4y2B一个联合模型。gydF4y2B一个

我gydF4y2B一个层次人工神经网络。gydF4y2B一个

jgydF4y2B一个与基线比较的最佳值。gydF4y2B一个

MLEE上嵌套事件的性能gydF4y2B一个

为了评估我们的模型在改进嵌套生物医学事件提取方面的有效性,我们将测试集分为2部分(gydF4y2B一个 简单的gydF4y2B一个和gydF4y2B一个 嵌套的gydF4y2B一个)。gydF4y2B一个 简单的gydF4y2B一个表示1事件只将实体作为其参数;gydF4y2B一个 嵌套的gydF4y2B一个意味着一个事件的一个参数可能是另一个事件。通常,嵌套事件存在于规则、积极规则、消极规则和计划的流程事件中。gydF4y2B一个

表5gydF4y2B一个说明了性能(FgydF4y2B一个1gydF4y2B一个的分数)[gydF4y2B一个 3.gydF4y2B一个]、RL+KBs模式[gydF4y2B一个 32gydF4y2B一个], deep peventmine [gydF4y2B一个 35gydF4y2B一个]模型,HANN [gydF4y2B一个 36gydF4y2B一个]模型,以及我们在触发器识别和事件提取子任务中的模型。在gydF4y2B一个 简单的gydF4y2B一个和gydF4y2B一个 嵌套的gydF4y2B一个与CNN模型相比,我们的框架分别提高了0.44%和1.25%,这表明我们的模型可以提高触发器识别的性能。但是,简单触发器和嵌套触发器之间没有明显的区别。在gydF4y2B一个 嵌套的gydF4y2B一个结果表明,我们的CPJE模型比CNN模型高6.97%,比RL+KBs模型高2.57%,比DeepEventMine模型高9.53%,比HANN模型高15.8%,这说明我们的CPJE模型使用gate GCN和注意机制有助于提高嵌套事件提取的性能。gydF4y2B一个

F1对简单事件、嵌套事件和多层事件提取语料库上的所有事件的性能进行评分。gydF4y2B一个

子任务和模型gydF4y2B一个 简单(%)gydF4y2B一个 嵌套(%)gydF4y2B一个 所有(%)gydF4y2B一个
触发gydF4y2B一个
美国有线电视新闻网gydF4y2B一个一个gydF4y2B一个 79.52gydF4y2B一个 78.80gydF4y2B一个 78.52gydF4y2B一个
RLgydF4y2B一个bgydF4y2B一个+ KBsgydF4y2B一个cgydF4y2B一个 N/AgydF4y2B一个dgydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个
DeepEventMinegydF4y2B一个 N/AgydF4y2B一个 79.12gydF4y2B一个 N/AgydF4y2B一个
损害gydF4y2B一个egydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个 N/AgydF4y2B一个
我们的模型gydF4y2B一个 79.96gydF4y2B一个fgydF4y2B一个 80.05gydF4y2B一个fgydF4y2B一个 80.18gydF4y2B一个fgydF4y2B一个
事件gydF4y2B一个
美国有线电视新闻网gydF4y2B一个 61.33gydF4y2B一个 54.29gydF4y2B一个 58.87gydF4y2B一个
RL + KBsgydF4y2B一个 N/AgydF4y2B一个 58.69gydF4y2B一个 60.09gydF4y2B一个
DeepEventMinegydF4y2B一个 N/AgydF4y2B一个 51.73gydF4y2B一个 61.87gydF4y2B一个
损害gydF4y2B一个 77.08gydF4y2B一个fgydF4y2B一个 45.46gydF4y2B一个 59.74gydF4y2B一个
我们的模型gydF4y2B一个 64.85gydF4y2B一个 61.26gydF4y2B一个fgydF4y2B一个 62.80gydF4y2B一个fgydF4y2B一个

一个gydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

bgydF4y2B一个强化学习。gydF4y2B一个

cgydF4y2B一个知识库。gydF4y2B一个

dgydF4y2B一个-不适用。gydF4y2B一个

egydF4y2B一个层次人工神经网络。gydF4y2B一个

fgydF4y2B一个与其他机型相比性价比最佳。gydF4y2B一个

MLEE上所有项目的表现gydF4y2B一个

为了更详细地说明我们的框架对不同事件的影响,gydF4y2B一个 表6gydF4y2B一个展示所有事件类型的事件提取性能。从这个表中,我们得到了去磷酸化事件的最佳提取性能和转录事件的最差提取性能。其中,分解代谢事件的提取精度最高,磷酸化事件的提取召回率最高。gydF4y2B一个

多层事件提取语料库中不同事件的提取性能。gydF4y2B一个

事件gydF4y2B一个 精度(%)gydF4y2B一个 回忆(%)gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个分数(%)gydF4y2B一个
细胞增殖gydF4y2B一个 62.50gydF4y2B一个 58.57gydF4y2B一个 60.47gydF4y2B一个
发展gydF4y2B一个 51.82gydF4y2B一个 66.43gydF4y2B一个 58.22gydF4y2B一个
血管发育gydF4y2B一个 90.42gydF4y2B一个 72.66gydF4y2B一个 80.57gydF4y2B一个
增长gydF4y2B一个 78.02gydF4y2B一个 50.58gydF4y2B一个 61.37gydF4y2B一个
死亡gydF4y2B一个 79.12gydF4y2B一个 44.32gydF4y2B一个 56.81gydF4y2B一个
分解gydF4y2B一个 71.30gydF4y2B一个 48.30gydF4y2B一个 57.59gydF4y2B一个
重构gydF4y2B一个 85.71gydF4y2B一个 58.32gydF4y2B一个 69.41gydF4y2B一个
合成gydF4y2B一个 48.00gydF4y2B一个 20.30gydF4y2B一个 28.53gydF4y2B一个
基因表达gydF4y2B一个 74.72gydF4y2B一个 82.42gydF4y2B一个 78.38gydF4y2B一个
转录gydF4y2B一个 16.67gydF4y2B一个 33.33gydF4y2B一个 22.22gydF4y2B一个
分解代谢gydF4y2B一个 100.00gydF4y2B一个 50.00gydF4y2B一个 66.67gydF4y2B一个
磷酸化gydF4y2B一个 90.00gydF4y2B一个 100.00gydF4y2B一个 94.74gydF4y2B一个
去磷酸化gydF4y2B一个 100.00gydF4y2B一个 100.00gydF4y2B一个 100.00gydF4y2B一个
本地化gydF4y2B一个 76.86gydF4y2B一个 49.98gydF4y2B一个 60.57gydF4y2B一个
绑定gydF4y2B一个 74.52gydF4y2B一个 51.23gydF4y2B一个 60.71gydF4y2B一个
监管gydF4y2B一个 63.82gydF4y2B一个 51.49gydF4y2B一个 56.99gydF4y2B一个
积极的监管gydF4y2B一个 78.28gydF4y2B一个 50.66gydF4y2B一个 61.51gydF4y2B一个
消极的监管gydF4y2B一个 64.35gydF4y2B一个 54.69gydF4y2B一个 59.13gydF4y2B一个
计划过程gydF4y2B一个 69.57gydF4y2B一个 51.86gydF4y2B一个 59.42gydF4y2B一个
所有gydF4y2B一个 64.85gydF4y2B一个 61.26gydF4y2B一个 62.80gydF4y2B一个
BioNLP-ST 2011 GE的整体性能gydF4y2B一个

为了提高说服力,我们将实验扩展到BioNLP-ST 2011 GE语料库。我们将我们的事件提取结果与使用相同语料库的以前系统的事件提取结果进行了比较,如下所示gydF4y2B一个 表7gydF4y2B一个。其中,图尔库事件提取系统(TEES) [gydF4y2B一个 42gydF4y2B一个], EventMine [gydF4y2B一个 6gydF4y2B一个]、叠加泛化[gydF4y2B一个 25gydF4y2B一个系统基于具有设计特征的支持向量机。美国有线电视新闻网[gydF4y2B一个 4gydF4y2B一个]是cnn集成到TEES系统中以提取关系和事件。深矿坑[gydF4y2B一个 35gydF4y2B一个基于双向变压器和重叠有向无环图来联合提取生物医学事件。HANN [gydF4y2B一个 36gydF4y2B一个模型依赖于GCN和超图来获得局部和全局上下文。kb驱动树LSTM [gydF4y2B一个 33gydF4y2B一个依赖于知识库概念嵌入来改进预训练的分布式单词表示。基于科学BERT的图边条件注意网络[j]gydF4y2B一个 34gydF4y2B一个]采用由图边缘条件注意网络编码的分层图表示,将统一医学语言系统的领域知识整合到预训练的语言模型中。gydF4y2B一个 表7gydF4y2B一个说明除了DeepEventMine之外,我们的方法优于之前的所有方法。gydF4y2B一个

生物医学事件提取在BioNLP共享任务2011 Genia事件语料库上的性能。gydF4y2B一个

方法和事件类型gydF4y2B一个 精度(%)gydF4y2B一个 回忆(%)gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个分数(%)gydF4y2B一个
t恤gydF4y2B一个a、bgydF4y2B一个
事件总gydF4y2B一个cgydF4y2B一个 57.65gydF4y2B一个 49.56gydF4y2B一个 53.30gydF4y2B一个
EventMinegydF4y2B一个一个gydF4y2B一个
事件总gydF4y2B一个 63.48gydF4y2B一个 53.35gydF4y2B一个 57.98gydF4y2B一个
堆叠泛化gydF4y2B一个一个gydF4y2B一个
事件总gydF4y2B一个 66.46gydF4y2B一个 48.96gydF4y2B一个 56.38gydF4y2B一个
TEES-CNNsgydF4y2B一个,维gydF4y2B一个
事件总gydF4y2B一个 69.45gydF4y2B一个 49.94gydF4y2B一个 58.07gydF4y2B一个
损害gydF4y2B一个e, fgydF4y2B一个
事件总gydF4y2B一个 71.73gydF4y2B一个 53.21gydF4y2B一个 61.10gydF4y2B一个
KBgydF4y2B一个ggydF4y2B一个驱动树LSTMgydF4y2B一个e、hgydF4y2B一个
简单的总gydF4y2B一个我gydF4y2B一个 85.95gydF4y2B一个 72.62gydF4y2B一个 78.73gydF4y2B一个
绑定gydF4y2B一个 53.16gydF4y2B一个 37.68gydF4y2B一个 44.10gydF4y2B一个
监管总gydF4y2B一个jgydF4y2B一个 55.73gydF4y2B一个 41.73gydF4y2B一个 47.72gydF4y2B一个
事件总gydF4y2B一个 67.10gydF4y2B一个 52.14gydF4y2B一个 58.65gydF4y2B一个
GEANet-SciBERTgydF4y2B一个e、kgydF4y2B一个
监管总gydF4y2B一个 55.21gydF4y2B一个 47.23gydF4y2B一个 50.91gydF4y2B一个
事件总gydF4y2B一个 64.61gydF4y2B一个 56.11gydF4y2B一个 60.06gydF4y2B一个
DeepEventMinegydF4y2B一个egydF4y2B一个
监管总gydF4y2B一个 62.36gydF4y2B一个 51.88gydF4y2B一个 56.64gydF4y2B一个lgydF4y2B一个
事件总gydF4y2B一个 76.28gydF4y2B一个 55.06gydF4y2B一个 63.96gydF4y2B一个lgydF4y2B一个
我们的模型gydF4y2B一个egydF4y2B一个
简单的总gydF4y2B一个 82.23gydF4y2B一个 78.88gydF4y2B一个 80.52gydF4y2B一个
绑定gydF4y2B一个 55.12gydF4y2B一个 37.48gydF4y2B一个 44.62gydF4y2B一个
监管总gydF4y2B一个 57.82gydF4y2B一个 46.39gydF4y2B一个 51.48gydF4y2B一个
事件总gydF4y2B一个 72.62gydF4y2B一个 53.33gydF4y2B一个 61.50gydF4y2B一个

一个gydF4y2B一个管道模型。gydF4y2B一个

bgydF4y2B一个图尔库事件提取系统。gydF4y2B一个

cgydF4y2B一个表示测试集上的整体性能。gydF4y2B一个

dgydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

egydF4y2B一个联合模型。gydF4y2B一个

fgydF4y2B一个层次人工神经网络。gydF4y2B一个

ggydF4y2B一个知识库。gydF4y2B一个

hgydF4y2B一个LSTM:长短期记忆。gydF4y2B一个

我gydF4y2B一个表示测试集中简单事件的总体性能。gydF4y2B一个

jgydF4y2B一个表示测试集中嵌套事件的总体性能(包括规则、积极规则和消极规则子事件)。gydF4y2B一个

kgydF4y2B一个基于科学BERT的边缘条件注意网络图。gydF4y2B一个

lgydF4y2B一个与其他机型相比性价比最佳。gydF4y2B一个

KB驱动的树LSTM和GEANet-SciBERT都利用KB来增强单词的语义表示,以提高嵌套(规则)事件的提取性能。然而,KB驱动的树状LSTM仅利用传统的静态词嵌入,不能深度集成知识库中的信息;因此,它在嵌套事件上的性能不能令人满意。gydF4y2B一个

与KB驱动的树状LSTM方法不同,GEANet-SciBERT模型利用专门的医学KB和科学信息丰富了变形器双向编码器表示(BERT)的动态语义表示,并通过新颖的GNN增强了对嵌套事件的推断能力。因此,FgydF4y2B一个1gydF4y2B一个嵌套事件提取的得分显著提高。gydF4y2B一个

有趣的是,DeepEventMine在提取BioNLP-ST 2011 GE上的嵌套生物医学事件方面表现出色,但在MLEE上表现被动。这一事实有三个原因。首先,DeepEventMine模型共同学习4个生物医学信息任务(实体检测、触发检测、角色检测、事件检测),可以在模型训练时共享更多的生物医学特征和知识。其次,DeepEventMine模型使用更复杂的图结构(多个重叠的有向无环图)来获得丰富的语法信息。(最后,BioNLP-ST 2011 GE数据集的规模大于MLEE数据集;因此,DeepEventMine模型可以在大型语料库上进行充分训练,并提高提取嵌套事件的性能。gydF4y2B一个

讨论gydF4y2B一个

在本节中,我们将研究和讨论使用MLEE语料库的CPJE模型的性能。gydF4y2B一个

消融实验gydF4y2B一个 法案的影响gydF4y2B一个

虽然BioBERT的输出包含了丰富的语义信息,但将POS嵌入、实体嵌入和BioBERT嵌入串联起来后,会对语义信息产生一定的噪声影响。另外,BioBERT输出的维数为768,拼接后的总尺寸比较广泛,容易造成特征空间的组合爆炸现象。因此,我们考虑使用BiLSTM,它降低了总维数,并将其他信息与BioBERT信息集成在一起,以获得更丰富的语义表示。gydF4y2B一个

如果去除BiLSTM层,触发识别精度从82.20%下降到75.64%,触发识别FgydF4y2B一个1gydF4y2B一个分数从80.18%下降到76.39%,进一步影响了事件提取性能(事件提取FgydF4y2B一个1gydF4y2B一个得分从62.80%降至58.02%)。gydF4y2B一个

Softmax概率的影响gydF4y2B一个

为了评估触发预测后的softmax概率分布对事件提取任务的贡献,我们使用传统的联合提取方法(如式10所示),该方法在提取候选触发向量和事件参数向量时仅使用源信息。gydF4y2B一个

如果仅使用源信息(软触发器)进行联合提取,则事件提取任务缺乏触发器识别后的概率分布信息,导致模型的召回率下降,进一步影响FgydF4y2B一个1gydF4y2B一个分数(事件提取gydF4y2B一个1gydF4y2B一个分数从62.80%降至60.09%)。但总体结果仍略高于管道基线,这也反映了联合提取可以消除级联误差。gydF4y2B一个

GCN的影响gydF4y2B一个

我们去掉了语法结构来评估GCN网络的重要性;因此,GCN模块在我们的模型中是无用的。如果模型缺少GCN组件,则触发识别的性能会略有下降(触发识别FgydF4y2B一个1gydF4y2B一个分数从80.18%下降到78.78%),事件提取结果明显差于所提模型(事件提取FgydF4y2B一个1gydF4y2B一个分数从62.80%降至58.40%)。gydF4y2B一个

由于句法结构可以为事件提取提供重要的潜在信息,GCN模型可以感知句法结构中的信息流方向,并有效地捕获这些特征。因此,GCN模型对于事件提取至关重要。gydF4y2B一个

骰子丢失的影响gydF4y2B一个

面对生物医学语料库的不平衡,我们使用了Dice损失函数。为了验证Dice损失函数对事件提取的效果更好,我们使用交叉熵损失函数进行比较。gydF4y2B一个

数据集中大量的反例表明易反例是广泛的。大量直观的例子淹没了训练,使得模型无法区分正面和硬反面的例子。由于交叉熵损失以精度为导向,并且每个实例对损失函数的贡献相等,因此模型的精度提高了(事件提取精度从72.26%提高到89.26%),但FgydF4y2B一个1gydF4y2B一个得分不增加(事件提取FgydF4y2B一个1gydF4y2B一个分数从62.60%下降到60.30%)。骰子损失是F的弱化版本gydF4y2B一个1gydF4y2B一个分数-准确率和召回率的调和平均值。当数据集中的正样例和负样例不平衡时,Dice loss会减少对易负样例的关注,增加对正负样例和难负样例的关注,从而平衡精度和召回值,增加FgydF4y2B一个1gydF4y2B一个分数。gydF4y2B一个

可视化gydF4y2B一个

对于注意门GCN的有效性,我们引用了文献中的“螺内酯对大鼠同种异体角膜移植存活的影响”gydF4y2B一个 图3gydF4y2B一个作为示例来说明捕获的交互特性。从gydF4y2B一个 图3gydF4y2B一个B,我们知道这个句子包含两个事件:agydF4y2B一个 监管gydF4y2B一个事件原因gydF4y2B一个 影响gydF4y2B一个和一个gydF4y2B一个 死亡gydF4y2B一个事件原因gydF4y2B一个 生存gydF4y2B一个。此外,死亡事件是监管事件的论据之一。gydF4y2B一个

一个基于注意的门图神经网络有效性的例子。(A)逐行堆映射,其中每一行是由多头注意机制获得的2个头的平均分数的数组。颜色越深,分数越高,相互作用越强。(B)斯坦福CoreNLP产生的依赖解析结果和事件触发器与参数之间的黄金关系,其中黄框表示实体类型,蓝框表示事件类型。gydF4y2B一个

我们可以看到gydF4y2B一个 图3gydF4y2B一个一个,gydF4y2B一个 影响gydF4y2B一个Row有中等强度的联系gydF4y2B一个 影响gydF4y2B一个(self),螺内酯(其参数),和gydF4y2B一个 生存gydF4y2B一个(它的参数和另一个事件)。与此同时,gydF4y2B一个 生存gydF4y2B一个Row与……有着密切的联系gydF4y2B一个 生存gydF4y2B一个(自我),gydF4y2B一个 影响gydF4y2B一个(另一件事),以及gydF4y2B一个 角膜移植gydF4y2B一个(它的参数)。此外,文字gydF4y2B一个 老鼠gydF4y2B一个和gydF4y2B一个 在gydF4y2B一个也有很强的联系gydF4y2B一个 生存gydF4y2B一个,这意味着解析生成的语法依赖信息通过GCN传播。gydF4y2B一个

案例研究gydF4y2B一个 概述gydF4y2B一个

我们的框架在BioNLP-ST 2011 GE语料库中还没有达到最先进的结果。然而,提取嵌套生物医学事件的性能令人满意,特别是在MLEE语料库中。为了更直观地展示我们的模型在提取嵌套生物医学事件方面的性能,我们分析了从MLEE测试集中选择的3个嵌套事件示例,研究我们的模型与CNN相比的优缺点[gydF4y2B一个 3.gydF4y2B一个].gydF4y2B一个

案例1gydF4y2B一个

如图所示gydF4y2B一个 图4gydF4y2B一个,情况1是一个简单的嵌套事件,其中事件参数的角色类型只有gydF4y2B一个 主题gydF4y2B一个。它是一个嵌套事件;然而,CNN和我们的模型都获得了正确的事件提取结果。这是因为这个句子没有一个完整的成分,也许,它只是一个完整句子的一部分。句子结构越简单,模型越容易提取实际特征。因此,此类嵌套事件的提取性能通常是有利的。gydF4y2B一个

多层事件提取语料库上一个简单嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个

案例2gydF4y2B一个

案例2是一个一般的嵌套事件,其句子组件是完整的,事件参数的角色类型是gydF4y2B一个 主题gydF4y2B一个和gydF4y2B一个 导致gydF4y2B一个。如图所示gydF4y2B一个 图5gydF4y2B一个, CNN模型检测到所有正确的事件触发器,但无法检测到正确的事件参数。CNN模型是一种流水线方法,将触发器识别和参数检测任务考虑为级联而不是并行关系。一般来说,他们首先将文本输入到CNN模型中,以识别句子中的触发器。然后,他们构造候选对,并将其再次输入到CNN模型中以检测参数。最后,使用基于规则或基于机器学习的方法对触发器和参数进行后处理,以构建完整的生物医学事件。如果在这些步骤中出现错误,将直接影响事件提取的性能。然而,我们的联合方法将触发识别和参数检测视为可以提供有效信息的并行任务。因此,我们使用一个模型联合训练两个任务,并且只有在模型训练过程中才会产生错误。gydF4y2Ba

多层事件提取语料库中常见嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个

案例3gydF4y2B一个

案例3是一个跨句子嵌套事件,如gydF4y2B一个 图6gydF4y2B一个。从这个例子中,我们可以确定需要改进的地方。由于多个事件相互嵌套,并且其中一些事件不在同一个句子中,这使得模型无法高效准确地提取所有事件。与CNN模型相比,虽然我们的模型可以识别gydF4y2B一个 积极的监管gydF4y2B一个触发的事件gydF4y2B一个 结果gydF4y2B一个,它不在同一个子句中gydF4y2B一个 发展gydF4y2B一个触发的事件gydF4y2B一个 创建gydF4y2B一个,导致gydF4y2B一个 积极的监管gydF4y2B一个事件以缺少事件参数。gydF4y2B一个

多层次事件抽取语料库中跨句嵌套事件的案例研究。CNN:卷积神经网络。gydF4y2B一个

结论gydF4y2B一个

本研究提出了一种基于多头注意图CNN的CPJE框架来实现生物医学事件提取任务。由于采用了联合提取框架,减少了两个子任务之间的级联误差。利用基于注意的门式GCN,可以有效地学习句法依赖信息以及触发器与相关实体之间的相互关系;从而提高了嵌套生物医学事件的提取性能。Dice损失取代了交叉熵损失,削弱了不平衡数据集的负面影响。总体而言,该模型获得了最佳的FgydF4y2B一个1gydF4y2B一个在MLEE生物医学事件提取语料库中得分,并在BioNLP-ST 2011 GE语料库上取得了良好的表现。未来,我们将考虑整合外部资源知识,让模型学习更丰富的信息,提高跨句嵌套事件的性能。gydF4y2B一个

缩写gydF4y2B一个 伯特gydF4y2B一个

从变压器双向编码器表示gydF4y2B一个

BiLSTMgydF4y2B一个

双向长短期记忆gydF4y2B一个

BioBERTgydF4y2B一个

来自变形金刚的生物医学双向编码器表示gydF4y2B一个

BioNLPgydF4y2B一个

生物医学自然语言处理gydF4y2B一个

BioNLP-STgydF4y2B一个

生物医学自然语言处理共享任务gydF4y2B一个

美国有线电视新闻网gydF4y2B一个

卷积神经网络gydF4y2B一个

CPJEgydF4y2B一个

条件概率联合提取gydF4y2B一个

政府通讯gydF4y2B一个

图卷积网络gydF4y2B一个

通用电气gydF4y2B一个

珍妮亚事件gydF4y2B一个

GEANet-SciBERTgydF4y2B一个

基于科学BERT的图边条件注意网络gydF4y2B一个

GNNgydF4y2B一个

图神经网络gydF4y2B一个

损害gydF4y2B一个

分层人工神经网络gydF4y2B一个

KBgydF4y2B一个

知识库gydF4y2B一个

LSTMgydF4y2B一个

长短期记忆gydF4y2B一个

mdBLSTMgydF4y2B一个

具有多层次注意机制的双向长短期记忆和基于依赖的词嵌入gydF4y2B一个

MLEEgydF4y2B一个

多级事件提取gydF4y2B一个

POSgydF4y2B一个

词性gydF4y2B一个

RLgydF4y2B一个

强化学习gydF4y2B一个

SGDgydF4y2B一个

随机梯度下降gydF4y2B一个

t恤gydF4y2B一个

图尔库事件提取系统gydF4y2B一个

本研究得到国家自然科学基金(no . 62072070)资助。gydF4y2B一个

YW提出生物医学事件提取的研究,实施并验证联合提取框架的有效性,并撰写初稿。JW对该草案的修改提出了建设性意见。陆先生读了定稿,并提出了一些有用的建议。林海阅读并批复了定稿。BX阅读并批准了最终的手稿。YZ帮助审查和修改了草案。SKB帮助修改了草案。gydF4y2Ba

没有宣布。gydF4y2B一个

麦当劳gydF4y2B一个 RTgydF4y2B一个 佩雷拉gydF4y2B一个 足球俱乐部gydF4y2B一个 KulickgydF4y2B一个 SNgydF4y2B一个 冬天gydF4y2B一个 RgydF4y2B一个 金gydF4y2B一个 YgydF4y2B一个 白色gydF4y2B一个 PSgydF4y2B一个 复杂关系提取的简单算法及其在生物医学IE中的应用gydF4y2B一个 计算语言学协会第43届年会论文集gydF4y2B一个 2005gydF4y2B一个 ACL 05gydF4y2B一个 2005年6月25-30日gydF4y2B一个 美国密歇根州安娜堡gydF4y2B一个 491gydF4y2B一个 8gydF4y2B一个 10.3115/1219840.1219901gydF4y2B一个 KilicoglugydF4y2B一个 HgydF4y2B一个 BerglergydF4y2B一个 年代gydF4y2B一个 使用触发词和句法依赖的有效生物事件提取gydF4y2B一个 第一版智能gydF4y2B一个 2011gydF4y2B一个 11gydF4y2B一个 27gydF4y2B一个 27gydF4y2B一个 4gydF4y2B一个 583gydF4y2B一个 609gydF4y2B一个 10.1111 / j.1467-8640.2011.00401.xgydF4y2B一个 王gydF4y2B一个 一个gydF4y2B一个 王gydF4y2B一个 JgydF4y2B一个 凌ydF4y2B一个 HgydF4y2B一个 张gydF4y2B一个 JgydF4y2B一个 杨gydF4y2B一个 ZgydF4y2B一个 徐gydF4y2B一个 KgydF4y2B一个 基于神经网络的生物医学事件提取的多分布式表示方法gydF4y2B一个 BMC Med Inform Decis markgydF4y2B一个 2017gydF4y2B一个 12gydF4y2B一个 20.gydF4y2B一个 17gydF4y2B一个 ,85gydF4y2B一个 171gydF4y2B一个 10.1186 / s12911 - 017 - 0563 - 9gydF4y2B一个 29297321gydF4y2B一个 10.1186 / s12911 - 017 - 0563 - 9gydF4y2B一个 PMC5751641gydF4y2B一个 BjornegydF4y2B一个 JgydF4y2B一个 SalakoskigydF4y2B一个 TgydF4y2B一个 基于卷积神经网络和依赖关系分析的生物医学事件提取gydF4y2B一个 BioNLP 2018研讨会论文集gydF4y2B一个 2018gydF4y2B一个 BioNLP的18gydF4y2B一个 2018年7月19日gydF4y2B一个 澳大利亚墨尔本gydF4y2B一个 98gydF4y2B一个 108gydF4y2B一个 10.18653 / v1 / w18 - 2311gydF4y2B一个 他gydF4y2B一个 XgydF4y2B一个 李gydF4y2B一个 lgydF4y2B一个 首歌gydF4y2B一个 XgydF4y2B一个 黄gydF4y2B一个 DgydF4y2B一个 任gydF4y2B一个 FgydF4y2B一个 基于多层次关注的生物医学事件提取的BLSTM神经网络gydF4y2B一个 交通信息系统gydF4y2B一个 2019gydF4y2B一个 E102。DgydF4y2B一个 9gydF4y2B一个 1842gydF4y2B一个 50gydF4y2B一个 10.1587 / transinf.2018edp7268gydF4y2B一个 PyysalogydF4y2B一个 年代gydF4y2B一个 太gydF4y2B一个 TgydF4y2B一个 古板的gydF4y2B一个 米gydF4y2B一个 赵gydF4y2B一个 HgydF4y2B一个 辻井gydF4y2B一个 JgydF4y2B一个 AnaniadougydF4y2B一个 年代gydF4y2B一个 跨多个生物组织层次的事件提取gydF4y2B一个 生物信息学gydF4y2B一个 2012gydF4y2B一个 09gydF4y2B一个 15gydF4y2B一个 28gydF4y2B一个 18gydF4y2B一个 i575gydF4y2B一个 81gydF4y2B一个 10.1093 /生物信息学/ bts407gydF4y2B一个 22962484gydF4y2B一个 bts407gydF4y2B一个 PMC3436834gydF4y2B一个 金gydF4y2B一个 JDgydF4y2B一个 王gydF4y2B一个 YgydF4y2B一个 高木涉gydF4y2B一个 TgydF4y2B一个 YonezawagydF4y2B一个 一个gydF4y2B一个 BioNLP共享任务2011中Genia事件任务概述gydF4y2B一个 2011 BioNLP共享任务研讨会论文集gydF4y2B一个 2011gydF4y2B一个 BioNLP的11gydF4y2B一个 2011年6月24日gydF4y2B一个 波特兰,俄勒冈,美国gydF4y2B一个 7gydF4y2B一个 15gydF4y2B一个 10.1186 / 1471 - 2105 - 13 - s11 - s1gydF4y2B一个 郑gydF4y2B一个 年代gydF4y2B一个 郝gydF4y2B一个 YgydF4y2B一个 陆gydF4y2B一个 DgydF4y2B一个 保gydF4y2B一个 HgydF4y2B一个 徐gydF4y2B一个 JgydF4y2B一个 郝gydF4y2B一个 HgydF4y2B一个 徐gydF4y2B一个 BgydF4y2B一个 基于混合神经网络的关节实体及关系提取gydF4y2B一个 NeurocomputinggydF4y2B一个 2017gydF4y2B一个 09gydF4y2B一个 27gydF4y2B一个 257gydF4y2B一个 59gydF4y2B一个 66gydF4y2B一个 10.1016 / j.neucom.2016.12.075gydF4y2B一个 叶gydF4y2B一个 ZXgydF4y2B一个 凌gydF4y2B一个 古银gydF4y2B一个 关注袋内和袋间的远程监控关系提取gydF4y2B一个 计算语言学协会北美分会2019年会议论文集:人类语言技术gydF4y2B一个 2019gydF4y2B一个 NAACL的19gydF4y2B一个 2019年6月2日至7日gydF4y2B一个 明尼阿波利斯,明尼苏达州,美国gydF4y2B一个 2810gydF4y2B一个 9gydF4y2B一个 10.48550 / arXiv.1904.00143gydF4y2B一个 冯gydF4y2B一个 JgydF4y2B一个 黄gydF4y2B一个 米gydF4y2B一个 赵gydF4y2B一个 lgydF4y2B一个 杨gydF4y2B一个 YgydF4y2B一个 朱gydF4y2B一个 XgydF4y2B一个 基于噪声数据的关系分类强化学习gydF4y2B一个 第32届AAAI人工智能会议论文集gydF4y2B一个 2018gydF4y2B一个 2gydF4y2B一个 AAAI的18gydF4y2B一个 2018年2月2-7日gydF4y2B一个 新奥尔良,洛杉矶,美国gydF4y2B一个 傅gydF4y2B一个 TJgydF4y2B一个 李gydF4y2B一个 PH值gydF4y2B一个 妈gydF4y2B一个 王寅gydF4y2B一个 Graphrel:将文本建模为关系图,用于联合实体和关系提取gydF4y2B一个 计算语言学协会第57届年会论文集gydF4y2B一个 2019gydF4y2B一个 ACL的19gydF4y2B一个 2019年7月28日至8月2日gydF4y2B一个 意大利的佛罗伦萨gydF4y2B一个 1409gydF4y2B一个 18gydF4y2B一个 10.18653 / v1 / p19 - 1136gydF4y2B一个 郭gydF4y2B一个 ZgydF4y2B一个 张gydF4y2B一个 YgydF4y2B一个 陆gydF4y2B一个 WgydF4y2B一个 用于关系提取的注意引导图卷积网络gydF4y2B一个 计算语言学协会第57届年会论文集gydF4y2B一个 2019gydF4y2B一个 ACL的19gydF4y2B一个 2019年7月28日至8月2日gydF4y2B一个 意大利的佛罗伦萨gydF4y2B一个 241gydF4y2B一个 51gydF4y2B一个 10.18653 / v1 / p19 - 1024gydF4y2B一个 李gydF4y2B一个 问gydF4y2B一个 霁gydF4y2B一个 HgydF4y2B一个 黄gydF4y2B一个 lgydF4y2B一个 基于全局特征的结构化预测联合事件提取gydF4y2B一个 计算语言学协会第51届年会论文集gydF4y2B一个 2013gydF4y2B一个 8gydF4y2B一个 ACL的13gydF4y2B一个 2013年8月4日至9日gydF4y2B一个 保加利亚索非亚gydF4y2B一个 73gydF4y2B一个 82gydF4y2B一个 基思gydF4y2B一个 卡gydF4y2B一个 处理程序gydF4y2B一个 一个gydF4y2B一个 PinkhamgydF4y2B一个 米gydF4y2B一个 MagliozzigydF4y2B一个 CgydF4y2B一个 麦克达菲gydF4y2B一个 JgydF4y2B一个 奥康纳gydF4y2B一个 BgydF4y2B一个 通过远程监督实体事件提取识别被警察杀害的平民gydF4y2B一个 2017年自然语言处理经验方法会议论文集gydF4y2B一个 2017gydF4y2B一个 9gydF4y2B一个 EMNLP的17gydF4y2B一个 2017年9月7日至8日gydF4y2B一个 丹麦哥本哈根gydF4y2B一个 1547gydF4y2B一个 57gydF4y2B一个 10.18653 / v1 / d17 - 1163gydF4y2B一个 ReichartgydF4y2B一个 RgydF4y2B一个 ,22gydF4y2B一个 RgydF4y2B一个 由全局约束引导的多事件提取gydF4y2B一个 计算语言学协会北美分会2012年会议论文集:人类语言技术gydF4y2B一个 2012gydF4y2B一个 6gydF4y2B一个 NAACL”12gydF4y2B一个 2012年6月3日至8日gydF4y2B一个 加拿大蒙特利尔gydF4y2B一个 70gydF4y2B一个 9gydF4y2B一个 陆gydF4y2B一个 WgydF4y2B一个 罗斯gydF4y2B一个 DgydF4y2B一个 使用结构化偏好建模的自动事件提取gydF4y2B一个 计算语言学协会第50届年会论文集gydF4y2B一个 2012gydF4y2B一个 7gydF4y2B一个 ACL的12gydF4y2B一个 2012年7月8日至14日gydF4y2B一个 韩国济州岛gydF4y2B一个 835gydF4y2B一个 44gydF4y2B一个 沙gydF4y2B一个 lgydF4y2B一个 钱gydF4y2B一个 FgydF4y2B一个 常gydF4y2B一个 BgydF4y2B一个 隋gydF4y2B一个 ZgydF4y2B一个 通过依赖桥RNN和基于张量的参数交互,联合提取事件触发器和参数gydF4y2B一个 第32届AAAI人工智能会议论文集gydF4y2B一个 2018gydF4y2B一个 AAAI的18gydF4y2B一个 2018年2月2日至7日gydF4y2B一个 新奥尔良,洛杉矶,美国gydF4y2B一个 阮gydF4y2B一个 THgydF4y2B一个 GrishmangydF4y2B一个 RgydF4y2B一个 基于卷积神经网络的事件检测跳跃图建模gydF4y2B一个 2016年自然语言处理经验方法会议论文集gydF4y2B一个 2016gydF4y2B一个 EMNLP的16gydF4y2B一个 2016年11月1-5日gydF4y2B一个 奥斯汀,德克萨斯州,美国gydF4y2B一个 886gydF4y2B一个 91gydF4y2B一个 10.18653 / v1 / d16 - 1085gydF4y2B一个 刘gydF4y2B一个 XgydF4y2B一个 罗gydF4y2B一个 ZgydF4y2B一个 黄gydF4y2B一个 HgydF4y2B一个 基于注意的图信息聚合联合多事件提取gydF4y2B一个 2018年自然语言处理经验方法会议论文集gydF4y2B一个 2018gydF4y2B一个 EMNLP的18gydF4y2B一个 2018年10月31日至11月4日gydF4y2B一个 比利时布鲁塞尔gydF4y2B一个 1247gydF4y2B一个 56gydF4y2B一个 10.18653 / v1 / d18 - 1156gydF4y2B一个 金gydF4y2B一个 JDgydF4y2B一个 太gydF4y2B一个 TgydF4y2B一个 PyysalogydF4y2B一个 年代gydF4y2B一个 卡诺gydF4y2B一个 YgydF4y2B一个 辻井gydF4y2B一个 JgydF4y2B一个 BioNLP'09事件提取共享任务概述gydF4y2B一个 生物医学自然语言处理的当前趋势研讨会论文集:共享任务gydF4y2B一个 2009gydF4y2B一个 BioNLP 09年gydF4y2B一个 2009年6月5日gydF4y2B一个 博尔德,科罗拉多州,美国gydF4y2B一个 1gydF4y2B一个 9gydF4y2B一个 10.3115/1572340.1572342gydF4y2B一个 专横的gydF4y2B一个 RgydF4y2B一个 GolikgydF4y2B一个 WgydF4y2B一个 RatkovicgydF4y2B一个 ZgydF4y2B一个 BessieresgydF4y2B一个 PgydF4y2B一个 NedellecgydF4y2B一个 CgydF4y2B一个 Bionlp共享任务2013 -细菌生物群任务概述gydF4y2B一个 BioNLP共享任务2013研讨会论文集gydF4y2B一个 2013gydF4y2B一个 BioNLP“13gydF4y2B一个 2013年8月9日gydF4y2B一个 保加利亚索非亚gydF4y2B一个 161gydF4y2B一个 9gydF4y2B一个 10.18653 / v1 / w16 - 3002gydF4y2B一个 古板的gydF4y2B一个 米gydF4y2B一个 伦-gydF4y2B一个 RgydF4y2B一个 金gydF4y2B一个 JDgydF4y2B一个 辻井gydF4y2B一个 JgydF4y2B一个 利用丰富特征进行复杂事件分类的事件提取gydF4y2B一个 [J] .计算机学报gydF4y2B一个 2010gydF4y2B一个 02gydF4y2B一个 8gydF4y2B一个 1gydF4y2B一个 131gydF4y2B一个 46gydF4y2B一个 10.1142 / s0219720010004586gydF4y2B一个 20183879gydF4y2B一个 S0219720010004586gydF4y2B一个 古板的gydF4y2B一个 米gydF4y2B一个 汤普森gydF4y2B一个 PgydF4y2B一个 AnaniadougydF4y2B一个 年代gydF4y2B一个 基于领域自适应和共参考分辨率的文献事件自动提取方法gydF4y2B一个 生物信息学gydF4y2B一个 2012gydF4y2B一个 07gydF4y2B一个 01gydF4y2B一个 28gydF4y2B一个 13gydF4y2B一个 1759gydF4y2B一个 65gydF4y2B一个 10.1093 /生物信息学/ bts237gydF4y2B一个 22539668gydF4y2B一个 bts237gydF4y2B一个 PMC3381963gydF4y2B一个 BjornegydF4y2B一个 JgydF4y2B一个 SalakoskigydF4y2B一个 TgydF4y2B一个 TEES 2.1: BioNLP 2013共享任务中的自动标注方案学习gydF4y2B一个 BioNLP共享任务2013研讨会论文集gydF4y2B一个 2013gydF4y2B一个 BioNLP“13gydF4y2B一个 2013年8月9日gydF4y2B一个 保加利亚索非亚gydF4y2B一个 16gydF4y2B一个 25gydF4y2B一个 10.18653 / v1 / w16 - 3009gydF4y2B一个 MajumdergydF4y2B一个 一个gydF4y2B一个 EkbalgydF4y2B一个 一个gydF4y2B一个 NaskargydF4y2B一个 SKgydF4y2B一个 基于堆叠泛化分类器的生物分子事件提取gydF4y2B一个 第十三届自然语言处理国际会议论文集gydF4y2B一个 2016gydF4y2B一个 ICNLP的16gydF4y2B一个 2016年12月17日至20日gydF4y2B一个 印度瓦拉纳西gydF4y2B一个 55gydF4y2B一个 64gydF4y2B一个 里德尔gydF4y2B一个 年代gydF4y2B一个 McCallumgydF4y2B一个 一个gydF4y2B一个 基于对偶分解和最小域自适应的鲁棒生物医学事件提取gydF4y2B一个 2011 BioNLP共享任务研讨会论文集gydF4y2B一个 2011gydF4y2B一个 BioNLP的11gydF4y2B一个 2011年6月24日gydF4y2B一个 波特兰,俄勒冈,美国gydF4y2B一个 46gydF4y2B一个 50gydF4y2B一个 VenugopalgydF4y2B一个 DgydF4y2B一个 陈gydF4y2B一个 CgydF4y2B一个 GogategydF4y2B一个 VgydF4y2B一个 NggydF4y2B一个 VgydF4y2B一个 缓解计算瓶颈:高维特征事件提取的联合推理gydF4y2B一个 2014年自然语言处理经验方法会议论文集gydF4y2B一个 2014gydF4y2B一个 EMNLP的14gydF4y2B一个 2014年10月25日至29日gydF4y2B一个 卡塔尔多哈gydF4y2B一个 831gydF4y2B一个 43gydF4y2B一个 10.3115 / v1 / d14 - 1090gydF4y2B一个 阮gydF4y2B一个 DQgydF4y2B一个 VerspoorgydF4y2B一个 KgydF4y2B一个 从词性标注到生物医学事件提取的依赖解析gydF4y2B一个 BMC生物信息学gydF4y2B一个 2019gydF4y2B一个 02gydF4y2B一个 12gydF4y2B一个 20.gydF4y2B一个 1gydF4y2B一个 72gydF4y2B一个 10.1186 / s12859 - 019 - 2604 - 0gydF4y2B一个 30755172gydF4y2B一个 10.1186 / s12859 - 019 - 2604 - 0gydF4y2B一个 PMC6373122gydF4y2B一个 周gydF4y2B一个 DgydF4y2B一个 钟gydF4y2B一个 DgydF4y2B一个 基于隐藏主题的生物医学事件提取半监督学习框架gydF4y2B一个 Artif Intell MedgydF4y2B一个 2015gydF4y2B一个 05gydF4y2B一个 64gydF4y2B一个 1gydF4y2B一个 51gydF4y2B一个 8gydF4y2B一个 10.1016 / j.artmed.2015.03.004gydF4y2B一个 25863986gydF4y2B一个 s0933 - 3657 (15) 00027 - 5gydF4y2B一个 饶gydF4y2B一个 年代gydF4y2B一个 MarcugydF4y2B一个 DgydF4y2B一个 骑士gydF4y2B一个 KgydF4y2B一个 Daume三世gydF4y2B一个 HgydF4y2B一个 基于抽象意义表示的生物医学事件提取gydF4y2B一个 BioNLP 2017研讨会论文集gydF4y2B一个 2017gydF4y2B一个 BioNLP的17gydF4y2B一个 2017年8月4日gydF4y2B一个 加拿大温哥华gydF4y2B一个 126gydF4y2B一个 35gydF4y2B一个 10.18653 / v1 / w17 - 2315gydF4y2B一个 杨ydF4y2B一个 年代gydF4y2B一个 黄gydF4y2B一个 KCgydF4y2B一个 生物医学事件提取的上下文感知与嵌入gydF4y2B一个 生物信息学gydF4y2B一个 2020gydF4y2B一个 01gydF4y2B一个 15gydF4y2B一个 36gydF4y2B一个 2gydF4y2B一个 637gydF4y2B一个 43gydF4y2B一个 10.1093 /生物信息学/ btz607gydF4y2B一个 31392318gydF4y2B一个 5544930gydF4y2B一个 赵gydF4y2B一个 WgydF4y2B一个 赵gydF4y2B一个 YgydF4y2B一个 姜gydF4y2B一个 XgydF4y2B一个 他gydF4y2B一个 TgydF4y2B一个 刘gydF4y2B一个 FgydF4y2B一个 李gydF4y2B一个 NgydF4y2B一个 一种基于强化学习和知识库的生物医学事件提取新方法gydF4y2B一个 2020年IEEE生物信息学与生物医学国际会议论文集gydF4y2B一个 2020gydF4y2B一个 BIBM 20gydF4y2B一个 2020年12月16日至19日gydF4y2B一个 韩国首尔gydF4y2B一个 402gydF4y2B一个 7gydF4y2B一个 10.1109 / bibm49941.2020.9313214gydF4y2B一个 李gydF4y2B一个 DgydF4y2B一个 黄gydF4y2B一个 lgydF4y2B一个 霁gydF4y2B一个 HgydF4y2B一个 汉gydF4y2B一个 JgydF4y2B一个 基于知识驱动树lstm的生物医学事件提取gydF4y2B一个 计算语言学协会北美分会2019年会议论文集:人类语言技术gydF4y2B一个 2019gydF4y2B一个 NAACL的19gydF4y2B一个 2019年6月2日至7日gydF4y2B一个 明尼阿波利斯,明尼苏达州,美国gydF4y2B一个 1421gydF4y2B一个 30.gydF4y2B一个 10.18653 / v1 / n19 - 1145gydF4y2B一个 黄gydF4y2B一个 KHgydF4y2B一个 杨gydF4y2B一个 米gydF4y2B一个 彭gydF4y2B一个 NgydF4y2B一个 基于层次知识图的生物医学事件提取gydF4y2B一个 2020年自然语言处理经验方法会议论文集gydF4y2B一个 2020gydF4y2B一个 EMNLP 20gydF4y2B一个 2020年11月16日至20日gydF4y2B一个 虚拟gydF4y2B一个 1277gydF4y2B一个 85gydF4y2B一个 10.18653 / v1/2020.findings-emnlp.114gydF4y2B一个 TrieugydF4y2B一个 霍奇金淋巴瘤gydF4y2B一个 TrangydF4y2B一个 TTgydF4y2B一个 DuonggydF4y2B一个 KNgydF4y2B一个 阮gydF4y2B一个 一个gydF4y2B一个 古板的gydF4y2B一个 米gydF4y2B一个 AnaniadougydF4y2B一个 年代gydF4y2B一个 DeepEventMine:从生物医学文本中提取端到端的神经嵌套事件gydF4y2B一个 生物信息学gydF4y2B一个 2020gydF4y2B一个 12gydF4y2B一个 08gydF4y2B一个 36gydF4y2B一个 19gydF4y2B一个 4910gydF4y2B一个 7gydF4y2B一个 10.1093 /生物信息学/ btaa540gydF4y2B一个 33141147gydF4y2B一个 5858975gydF4y2B一个 PMC7750964gydF4y2B一个 赵gydF4y2B一个 WgydF4y2B一个 张gydF4y2B一个 JgydF4y2B一个 杨gydF4y2B一个 JgydF4y2B一个 他gydF4y2B一个 TgydF4y2B一个 妈gydF4y2B一个 HgydF4y2B一个 李gydF4y2B一个 ZgydF4y2B一个 一种基于文档两级建模的联合生物医学事件提取框架gydF4y2B一个 正科学gydF4y2B一个 2021gydF4y2B一个 03gydF4y2B一个 550gydF4y2B一个 27gydF4y2B一个 40gydF4y2B一个 10.1016 / j.ins.2020.10.047gydF4y2B一个 RamponigydF4y2B一个 一个gydF4y2B一个 范德古特gydF4y2B一个 RgydF4y2B一个 LombardogydF4y2B一个 RgydF4y2B一个 板材gydF4y2B一个 BgydF4y2B一个 生物医学事件提取作为序列标记gydF4y2B一个 2020年自然语言处理经验方法会议论文集gydF4y2B一个 2020gydF4y2B一个 EMNLP 20gydF4y2B一个 2020年11月16日至20日gydF4y2B一个 虚拟gydF4y2B一个 5357gydF4y2B一个 67gydF4y2B一个 10.18653 / v1/2020.emnlp-main.431gydF4y2B一个 李gydF4y2B一个 JgydF4y2B一个 尹gydF4y2B一个 WgydF4y2B一个 金gydF4y2B一个 年代gydF4y2B一个 金gydF4y2B一个 DgydF4y2B一个 金gydF4y2B一个 年代gydF4y2B一个 所以gydF4y2B一个 CHgydF4y2B一个 康gydF4y2B一个 JgydF4y2B一个 BioBERT:用于生物医学文本挖掘的预训练生物医学语言表示模型gydF4y2B一个 生物信息学gydF4y2B一个 2020gydF4y2B一个 02gydF4y2B一个 15gydF4y2B一个 36gydF4y2B一个 4gydF4y2B一个 1234gydF4y2B一个 40gydF4y2B一个 10.1093 /生物信息学/ btz682gydF4y2B一个 31501885gydF4y2B一个 5566506gydF4y2B一个 PMC7703786gydF4y2B一个 克莱因gydF4y2B一个 DgydF4y2B一个 曼宁gydF4y2B一个 CDgydF4y2B一个 准确的非词汇化解析gydF4y2B一个 计算语言学协会第41届年会论文集gydF4y2B一个 2003gydF4y2B一个 ACL的03gydF4y2B一个 2003年7月7日至12日gydF4y2B一个 日本札幌gydF4y2B一个 423gydF4y2B一个 30.gydF4y2B一个 10.3115/1075096.1075150gydF4y2B一个 VaswanigydF4y2B一个 一个gydF4y2B一个 ShazeergydF4y2B一个 NgydF4y2B一个 ParmargydF4y2B一个 NgydF4y2B一个 UszkoreitgydF4y2B一个 JgydF4y2B一个 琼斯gydF4y2B一个 lgydF4y2B一个 戈麦斯gydF4y2B一个 一个gydF4y2B一个 凯撒gydF4y2B一个 ŁgydF4y2B一个 PolosukhingydF4y2B一个 我gydF4y2B一个 注意力就是你所需的一切gydF4y2B一个 神经信息处理系统进展年度会议论文集gydF4y2B一个 2017gydF4y2B一个 少量的17gydF4y2B一个 2017年12月4日至9日gydF4y2B一个 长滩,加州,美国gydF4y2B一个 李gydF4y2B一个 XgydF4y2B一个 太阳gydF4y2B一个 XgydF4y2B一个 孟gydF4y2B一个 YgydF4y2B一个 梁gydF4y2B一个 JgydF4y2B一个 吴gydF4y2B一个 FgydF4y2B一个 李gydF4y2B一个 JgydF4y2B一个 数据不平衡NLP任务的骰子损失gydF4y2B一个 计算语言学协会第58届年会论文集gydF4y2B一个 2020gydF4y2B一个 ACL 20gydF4y2B一个 2020年7月5日至10日gydF4y2B一个 虚拟gydF4y2B一个 465gydF4y2B一个 76gydF4y2B一个 10.18653 / v1/2020.acl-main.45gydF4y2B一个 BjornegydF4y2B一个 JgydF4y2B一个 SalakoskigydF4y2B一个 TgydF4y2B一个 泛化生物医学事件提取gydF4y2B一个 2011 BioNLP共享任务研讨会论文集gydF4y2B一个 2011gydF4y2B一个 BioNLP的11gydF4y2B一个 2011年6月24日gydF4y2B一个 波特兰,俄勒冈,美国gydF4y2B一个 183gydF4y2B一个 91gydF4y2B一个
Baidu
map