卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIgydF4y2Ba

JMIR Med InformgydF4y2Ba

JMIR医学信息学gydF4y2Ba

2291 - 9694gydF4y2Ba

卡塔尔世界杯8强波胆分析

加拿大多伦多gydF4y2Ba

v8i11e22661gydF4y2Ba

33245290gydF4y2Ba

10.2196/22661gydF4y2Ba

原始论文gydF4y2Ba

与药物不良事件相关的日文文章的识别:自然语言处理分析gydF4y2Ba

EysenbachgydF4y2Ba

冈瑟gydF4y2Ba

松田gydF4y2Ba

ShinichigydF4y2Ba

格里芬gydF4y2Ba

韦伯gydF4y2Ba

MahnkegydF4y2Ba

安德里亚gydF4y2Ba

UjiiegydF4y2Ba

富山庄gydF4y2Ba

英航gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0001-9869-4386gydF4y2Ba

游泳时gydF4y2Ba

ShuntarogydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0002-6209-1054gydF4y2Ba

WakamiyagydF4y2Ba

祥子gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0002-9371-1340gydF4y2Ba

AramakigydF4y2Ba

二gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

奈良科学技术研究所gydF4y2Ba

Ikoma，高山町8916-5gydF4y2Ba

奈良,630 - 0192gydF4y2Ba

日本gydF4y2Ba 81 743 72 5250gydF4y2Ba aramaki@is.naist.jpgydF4y2Ba

https://orcid.org/0000-0003-0201-3609gydF4y2Ba

1gydF4y2Ba 奈良科学技术研究所gydF4y2Ba

奈良gydF4y2Ba

日本gydF4y2Ba

通讯作者:Eiji AramakigydF4y2Ba aramaki@is.naist.jpgydF4y2Ba

11gydF4y2Ba 2020gydF4y2Ba

27gydF4y2Ba 11gydF4y2Ba 2020gydF4y2Ba

8gydF4y2Ba 11gydF4y2Ba

e22661gydF4y2Ba

21gydF4y2Ba 7gydF4y2Ba 2020gydF4y2Ba 12gydF4y2Ba 8gydF4y2Ba 2020gydF4y2Ba 5gydF4y2Ba 10gydF4y2Ba 2020gydF4y2Ba 28gydF4y2Ba 10gydF4y2Ba 2020gydF4y2Ba

©宇jiie Shogo, Yada Shuntaro，若宫Shoko, Aramaki Eiji。原发表于JMIR医学信息学(http://medinform.www.mybigtv.com)， 2020年11月27日。gydF4y2Ba

2020gydF4y2Ba

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息，到http://medinform.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。gydF4y2Ba

背景gydF4y2Ba

医药公司系统地报道了药物不良事件(ADEs)的医学文章，以提供药物安全信息。虽然向监管机构报告的政策因国家和地区而异，但所有医疗物品报告均可归类为基于准确性或召回的报告。在日本实施的基于召回的报告要求报告任何可能的ADE。因此，基于回忆的报告可能会引入大量的假阴性或大量的噪音，这是一个很难用有限的人工来解决的问题。gydF4y2Ba

客观的gydF4y2Ba

我们的目标是开发一个自动化系统，可以识别与ade相关的医学文章，支持基于召回的报告，并减轻日本制药公司的体力劳动。gydF4y2Ba

方法gydF4y2Ba

使用医学文章作为输入，我们基于自然语言处理的系统应用文档级分类来提取包含ade的文章(取代第一次筛选中的人工劳动)和句子级分类来提取这些文章中包含ade的句子(从而支持专家进行第二次筛选)。我们使用509篇由医学工程师注释的日本医学文章来评估所提出系统的性能。gydF4y2Ba

结果gydF4y2Ba

文档级分类的F1为0.903。句子级分类的F1为0.413。这是五倍交叉验证的平均值。gydF4y2Ba

结论gydF4y2Ba

一个简单的自动化系统可以减轻制药公司筛选药物安全相关医疗物品的体力劳动。在通过考虑更广泛的背景来提高句子级分类的准确性之后，我们打算将该系统应用于现实世界的上市后监测。gydF4y2Ba

药物不良事件gydF4y2Ba 医学信息学gydF4y2Ba 自然语言处理gydF4y2Ba 药物警戒gydF4y2Ba

介绍gydF4y2Ba 背景gydF4y2Ba

根据世界卫生组织的定义，药物不良事件(ADE)是指在使用药物产品治疗期间可能出现的任何不良事件，但不一定与治疗有因果关系[gydF4y2Ba 1gydF4y2Ba]。根据Howard等人进行的一项调查[gydF4y2Ba 2gydF4y2Ba]，在全球所有住院人数中，不良事件约占3.7%。这一问题已通过上市前和上市后药品安全监督制度得到解决。然而，上市后措施比上市前临床试验发挥更重要的作用，因为上市后措施也可以检测到罕见的反应、长期影响和药物-药物/药物-食品相互作用[gydF4y2Ba 3.gydF4y2Ba]。上市后监测的一个主要来源是临床医生、药剂师和制药行业自发或自愿报告的疑似不良反应。然而，由于传入的“信号”量很大，即使是少数可靠报告的识别也是劳动密集型的[gydF4y2Ba 4gydF4y2Ba]。因此，开发一个自动化系统来确定和分类临床ade相关报告的相对重要性将是相当有益的。gydF4y2Ba

现有的自动化研究针对不同的来源材料，反映了现实世界上市后监测处理的广泛信号。这些输入包括电子健康纪录[gydF4y2Ba 5gydF4y2Ba，gydF4y2Ba 6gydF4y2Ba]、病人报告[gydF4y2Ba 7gydF4y2Ba]、医疗用品[gydF4y2Ba 8gydF4y2Ba，gydF4y2Ba 9gydF4y2Ba]，以及社交媒体上的帖子[gydF4y2Ba 10gydF4y2Ba，gydF4y2Ba 11gydF4y2Ba]。本研究的重点是医疗用品，因为它们在许多国家占了上市后监测的很大一部分。制药公司自愿向监管机构提交基于医学文章的报告[gydF4y2Ba 4gydF4y2Ba]。gydF4y2Ba

不同国家及地区规管向规管机构汇报环境污染指数的政策各不相同[gydF4y2Ba 12gydF4y2Ba]。一般来说，报告可能是精确的或基于回忆的。在美国实施的前一种方法中[gydF4y2Ba 13gydF4y2Ba]和欧洲联盟[gydF4y2Ba 14gydF4y2Ba]，疑似严重药物不良反应(adr)迅速报告。严重的不良反应对应于某些事件与药物之间存在合理因果关系的不良反应。在基于召回的报告中，任何可能的不良事件都必须立即报告。不良事件包括不能排除药物与有害事件之间存在因果关系的情况[gydF4y2Ba 15gydF4y2Ba]。然而，这种策略可以引入大量的假阴性或大量的噪音。处理所有可能的ade的大量报告大大增加了手动分类的负担。总的来说，利用有限的人力很难完成基于回忆的报告。gydF4y2Ba

日本采用并实施了以召回为基础的药物警戒[gydF4y2Ba 15gydF4y2Ba]。它的主要信息来源是医药公司的自发报告，这些报告的基础是医学文章。这个过程通常包括第一次(初始)筛选，然后是第二次筛选。在第一次筛选中，医学文章被人工分类和优先排序。例如，如果一篇文章提到致命或致命的ade，它将获得最高优先级。第二次深入筛查由医学专家进行，并评估报告的ADEs的优点。在参与本次调查的日本制药公司中，每年必须监测数千篇文章，每份报告至少需要10分钟的评估时间。这个过程需要大量的人工成本。此外，在第一次筛查中使用的标准可能是主观的(因此根据进行筛查的人而有很大差异)。因此，监测过程可能会不必要地拖延。gydF4y2Ba

目标gydF4y2Ba

为了解决日本的药物警戒问题，我们开发了一种自动化系统，通过提取含有ade的物品来取代第一次筛选。对于第二次筛选，我们还邀请了医学专家的服务来识别文章中提示ade的句子。我们的系统结合了文档级和句子级的分类模型。它对日本医学文章进行分类，提取那些包含ADEs的文章，然后将其作为第二次筛选的候选对象(gydF4y2Ba 含ade物品提取gydF4y2Ba)。它还对ade进行了分类，建议必须由医学专家仔细审查的句子(gydF4y2Ba ade提示句子提取gydF4y2Ba)。gydF4y2Ba

为此，我们实现了自然语言处理(NLP)技术。我们的系统由简单的机器学习方法组成，这些方法很容易被制药公司内部应用和管理。针对日语医学论文也提供了对医学领域内语言资源很少的非英语论文的有效管理方法的见解。gydF4y2Ba

为了支持日本的上市后监管，我们建立了一个自动系统来识别含有ade的医学文章和其中的ade建议句子，以提高可解释性。gydF4y2Ba

我们提出的模型基于手动注释的日本医学文章测试集，将含有ade的文章分类为0.903 F1分，将含有ade的句子分类为0.413 F1分。gydF4y2Ba

我们基于相对简单的模型开发了一个有效的自动化系统。它可以很容易地在制药公司内部实施和管理。此外，我们的系统可以很容易地扩展到分类用非英语语言写的论文。gydF4y2Ba

方法gydF4y2Ba 材料gydF4y2Ba

提供了一家日本制药公司用于上市后监测的日本医疗用品，供随后分析之用。大多数文章与该公司调查的选定药物范围有关，但不限于特定的临床领域或疾病。每种药物在数据中出现的频率报告于gydF4y2Ba 多媒体附录1gydF4y2Ba。文章随机抽样，使用WinReader PRO version 15.0 (NTTDATA NJK Corporation)通过光学字符识别(OCR)从PDF文档中提取文本数据[gydF4y2Ba 16gydF4y2Ba]。由于OCR软件难以识别这种格式的文本，因此包含2个或更多栏目的文章被排除在外。随后的过滤生成了509篇医学文章。某些符号，如“$”和“^”，通常不会出现在日本医学文章被删除。gydF4y2Ba

预处理后，根据ade的出现对所有句子进行过滤。这些是根据以下标准来判断的:gydF4y2Ba

药物处方后提及不良事件;或gydF4y2Ba

作者明确提到可疑ADE的发生。gydF4y2Ba

匹配的句子被标记为gydF4y2Ba 正面暗示gydF4y2Ba。这个决定是通过考虑多个句子做出的。因此，暗示ade的名称可能跨越了几个句子。gydF4y2Ba

包含任何提示ade的句子的医学文章被指定gydF4y2Ba 正面包含gydF4y2Ba。在这里，300/509篇文章(58.9%)被标记为含有ADE。gydF4y2Ba 表1gydF4y2Ba显示每篇医学文章中包含ade的平均句子数和字符数。gydF4y2Ba

表1gydF4y2Ba

每篇医学文章的平均句数和字数。gydF4y2Ba

标签gydF4y2Ba		句子数gydF4y2Ba	字符数gydF4y2Ba
正面gydF4y2Ba^{一个gydF4y2Ba}建议均值(SD)gydF4y2Ba
	所有gydF4y2Ba	3.9 (2.7)gydF4y2Ba	321.7 (456.1)gydF4y2Ba
	一个标准gydF4y2Ba	3.5 (2.6)gydF4y2Ba	399.3 (283.9)gydF4y2Ba
	标准BgydF4y2Ba	0.4 (0.7)gydF4y2Ba	56.8 (112.3)gydF4y2Ba
非ade提示，平均值(SD)gydF4y2Ba		48.2 (72.1)gydF4y2Ba	2897.0 (4104.0)gydF4y2Ba

^{一个gydF4y2Ba}ADE:药物不良事件。gydF4y2Ba

语料库由一位医学工程师注释。为了评价标注质量，Cohen κ [gydF4y2Ba 17gydF4y2Ba]是使用由医学工程师和没有医疗经验的作者生成的并行注释数据计算出来的。后者单独标注了数据集的51/509(10.0%)。51/509(10.0%)样本中句子级标注的Cohen κ值为0.638，文档级标注的Cohen κ值为0.841。这两种方法都满足计算语言语料库的标准质量标准。因此，本研究采用医学工程师编写的完整注释。gydF4y2Ba

系统架构gydF4y2Ba

图1gydF4y2Ba给出了系统架构的概述。该系统由预处理、疾病和药物名称识别、疾病和药物名称规范化和可解释ADE候选检测子模块组成。gydF4y2Ba

图1gydF4y2Ba

被提议系统的体系结构。ADE:药物不良事件;IOL:人工晶状体。gydF4y2Ba

预处理:句子仅在日语字母(包括平假名、片假名和汉字)后自动使用日文句号和句点分隔。gydF4y2Ba

疾病和药物名称识别:从预处理的文章中提取疾病和药物名称。使用Ito等人提供的疾病名称提取器MedEX/J进行疾病名称提取。[gydF4y2Ba 18gydF4y2Ba]，使用条件随机场(CRFs)。该技术通常用于命名实体识别，并在日本病例报告中进行了培训。需要注意的是，MedEX/J还可以提取日语医学文章中出现的任何英文疾病名称。采用与MedEX/J相同的方法训练CRF提取药品名称。文章通过转换成广泛用于命名实体识别的基于字符的IOB2格式被输入到模型中。gydF4y2Ba

疾病和药品名称规范化:由于同一疾病和药品名称有许多变体，因此使用MANBYO [gydF4y2Ba 19gydF4y2Ba]及HYAKUYAKU [gydF4y2Ba 20.gydF4y2Ba字典。日本最大的疾病名称词典MANBYO词典可以将从日本医学文献中提取的30多万种疾病名称(截至2020年9月)链接到MedDRA、ICD-10、ICD-11等各种标准形式。HYAKUYAKU词典收录了从日本医疗文件和患者问卷中提取的4万多个药物名称(截至2020年9月)，并与通用名称相关联。这些字典还包含日本医学文件中出现的英文疾病/药物名称，这些名称也可以规范化。gydF4y2Ba

编辑基于距离的相似度以使疾病和药物名称规范化[gydF4y2Ba 21gydF4y2Ba在抽取词和字典词之间。然后将提取出来的单词替换为与字典中相似度最高的单词相关联的标准表达式。在初步实验的基础上，当词典中没有相似度超过本系统设置的0.3阈值的词时，提取的词不被替换。gydF4y2Ba

可解释ADE候选检测:使用标准化的疾病和药物名称作为特征，提取与ADE相关的候选文章，并使用ADE提示句子进行第二次筛选。gydF4y2Ba

可解释ADE候选检测gydF4y2Ba 概述gydF4y2Ba

进行可解释的ADE候选检测，为第二次筛选提取有用的信息。包含ade的文章提取和暗示ade的句子提取都进行了。两种提取都使用二元分类模型。在含ADE的文章提取中，文章被分类为“含ADE”或“不含ADE”。在ADE暗示句提取中，将“含ADE”冠词中的句子分类为“ADE暗示”或“非ADE暗示”。下面描述了系统的几个设计方面，包括分类算法和每个模型中使用的特征设计。gydF4y2Ba

分类算法gydF4y2Ba

采用逻辑回归对文章和句子进行分类。该方法在文本分类中得到了广泛的应用。在许多NLP任务中，神经网络(NN)模型通常优于其他基于机器学习的模型，如逻辑回归。然而，神经网络模型需要更大的语料库，其输出更难解释[gydF4y2Ba 22gydF4y2Ba]。相比之下，逻辑回归可以使用相对较少的注释数据进行训练，并且每个特征的贡献很容易确定。因此，本文采用逻辑回归而非神经网络模型。scikit-learn的logistic回归类[j]gydF4y2Ba 23gydF4y2Ba使用其默认参数。gydF4y2Ba

功能设计gydF4y2Ba

早先的一项研究[gydF4y2Ba 24gydF4y2Ba]假设每个句子至少涉及一种疾病和药物，然后在这些关键词周围的单词中使用识别特征。然而，这里假定每个句子不一定指任何疾病或药物。因此，为这里使用的设置创建了某些统计特征。gydF4y2Ba

在含ADE的文章提取中，“We stopped the drug”等暗示ADE的表达被视为检测ADE的重要线索。本文的出发点是文章中的文本作为正统词袋表征的特征。MeCab被用来创建这个词袋功能[gydF4y2Ba 25gydF4y2Ba]。MeCab是一个日语词形分析工具，用于将句子分成单词。那些只出现过一次的词被删除了。gydF4y2Ba

有关疾病和药物的特征被认为对ADE检测有用，因为它们在人工ADE检测中起着关键作用。因此，标准表达及其频率的总和被用作解释个体疾病和药物特征的特征。gydF4y2Ba

为了提取ADE暗示句子，需要考虑上下文(因为“ADE暗示”可能跨越多个句子)。因此，我们使用了ade提示句提取中的前句和后句特征，以及与含ade的冠词提取相同的特征。可解释ADE候选检测的特征集如下所示。gydF4y2Ba

单词标记:出现在文本中的单词包;gydF4y2Ba

标准疾病/药品名称:标准疾病和药品名称袋;gydF4y2Ba

疾病/药品名称总和:疾病名称出现次数之和与药品名称出现次数之和;gydF4y2Ba

语境词标记:前句和后句中的词袋;gydF4y2Ba

上下文标准疾病/药品名称:前句和后句中标准疾病和药品名称袋;gydF4y2Ba

疾病/药物名称上下文总和:疾病名称出现次数之和与前句和后句中药物名称出现次数之和。gydF4y2Ba

每个模型的特征如图所示gydF4y2Ba 表2gydF4y2Ba。gydF4y2Ba

表2gydF4y2Ba

用于包含ade的文章提取和包含ade的句子提取的特征集。gydF4y2Ba^{一个gydF4y2Ba}

功能gydF4y2Ba	正面gydF4y2Ba^bgydF4y2Ba含物提取gydF4y2Ba	ade提示句子提取gydF4y2Ba
字标记gydF4y2Ba	✓(7188)gydF4y2Ba	✓(6597)gydF4y2Ba
标准疾病/药物名称gydF4y2Ba	✓(1043)gydF4y2Ba	✓(1083)gydF4y2Ba
疾病/药品名称总和gydF4y2Ba	✓(2)gydF4y2Ba	✓(2)gydF4y2Ba
上下文词标记gydF4y2Ba	XgydF4y2Ba	✓(13194)gydF4y2Ba
标准疾病/药物名称gydF4y2Ba	XgydF4y2Ba	✓(2166)gydF4y2Ba
疾病/药物名称的上下文总和gydF4y2Ba	XgydF4y2Ba	✓(4)gydF4y2Ba

^{一个gydF4y2Ba}括号内的数字表示变量的平均数目。gydF4y2Ba

^bgydF4y2BaADE:药物不良事件。gydF4y2Ba

实验gydF4y2Ba 设置gydF4y2Ba

实验对含有ade的文章提取和含有ade的句子提取进行了评价。gydF4y2Ba

对于含有ade的文章提取，分类器使用中列出的特征通过五倍交叉验证来训练和预测文章gydF4y2Ba 表3gydF4y2Ba。所有5组文章随机抽样，保留标签比例。gydF4y2Ba

表3gydF4y2Ba

各特征对含不良事件物品提取的影响。gydF4y2Ba

功能gydF4y2Ba	ΔF1得分gydF4y2Ba
没有文字标记gydF4y2Ba	-0.0456gydF4y2Ba
没有标准的疾病/药物名称gydF4y2Ba	-0.0001gydF4y2Ba
没有疾病/药品名称的总和gydF4y2Ba	-0.0155gydF4y2Ba

对于提示ade的句子提取，在文档水平上进行五重交叉验证。标记为“不含ADE”的文章缺少标记为“暗示ADE”的句子。因此，当使用训练集中的所有文章进行训练时，标签比例是不平衡的。为了避免这种不平衡，我们只使用“含ade”文章中的句子进行训练，并使用测试集中的所有句子进行评估。gydF4y2Ba

评价指标gydF4y2Ba

根据实验结果，计算F1分数来评价我们的模型的性能。为了更精确地分析性能，我们还制作了精确召回曲线。准确度-召回曲线绘制了每个阈值下的召回率和精度，并评估了在测量之间进行重大权衡的任务。高召回率或灵敏度意味着模型不会遗漏任何ade。该特性对于ADE检测至关重要。精度高意味着模型预测可靠。因此，我们必须以合理的精度和高召回率检测ade。gydF4y2Ba

结果gydF4y2Ba 性能gydF4y2Ba

含ade物品提取的平均交叉验证结果为F1 = 0.903 (SD 0.0165)。对于提示ade的句子提取，F1显著降低;F1 = 0.413 (sd 0.0247)。gydF4y2Ba

具有最高F1的验证集的精确召回率曲线如图所示gydF4y2Ba 图2gydF4y2Ba。对于含ade的文章提取，我们取得了较高的精密度和召回率。相比之下，ade暗示句子提取的准确率和查全率都相对较低。gydF4y2Ba

图2gydF4y2Ba

(a)含ade的文章提取和(b)含ade的句子提取的精确查全率曲线。ADE:药物不良事件。gydF4y2Ba

特性分析gydF4y2Ba

我们进行了消融研究，这是一种评估方法，通过去除每个特征来量化该特征的影响。我们去掉每个特征组，得到平均ߡF1分数。gydF4y2Ba

表3gydF4y2Ba和gydF4y2Ba 4gydF4y2Ba显示了对每个模型中含有ade的文章提取和含有ade的句子提取进行消融研究的结果。对于这两种模型，对应句子中的词袋特征(词标记)贡献最大。标准疾病和药品名称对分类效果无影响(gydF4y2Ba 表4gydF4y2Ba)。同样，标准疾病和药物名称的上下文特征对分类性能没有影响(gydF4y2Ba 表4gydF4y2Ba)。gydF4y2Ba

表4gydF4y2Ba

药物不良事件中各特征对提示句子提取的影响。gydF4y2Ba

功能gydF4y2Ba	ΔF1得分gydF4y2Ba
没有文字标记gydF4y2Ba	-0.0644gydF4y2Ba
没有上下文词标记gydF4y2Ba	0.0070gydF4y2Ba
没有标准的疾病/药物名称gydF4y2Ba	0.0gydF4y2Ba
没有上下文的标准疾病/药物名称gydF4y2Ba	0.0gydF4y2Ba
没有疾病/药品名称的总和gydF4y2Ba	-0.0204gydF4y2Ba
没有上下文的疾病/药物名称总和gydF4y2Ba	-0.0012gydF4y2Ba

讨论gydF4y2Ba 建议方法的可行性gydF4y2Ba 性能gydF4y2Ba

本研究的目的是建立一个支持日本药品上市后监管的系统，通过自动化第一次筛选和医学专业知识支持第二次筛选。我们的系统通过将任务分为相对容易的任务，即在文档级别检测ade，和相对困难的任务，即在句子级别检测ade，有效地解决了这个问题。gydF4y2Ba

该系统对与ADEs相关的医学文章进行分类，具有较高的准确率和召回率。这个结果表明，复杂的模型，如关系分类是不必要的。相反，简单的文档分类足以取代第一次筛选中的手工工作，从而降低注释成本。gydF4y2Ba

我们的分类系统对ade提示句子的提取性能相对较差。但是，从我们最初的目标(支持药品安全监测专家)来看，这一水平的表现仍然可以节省大量的时间和成本。因此，在模型对召回率高的句子进行分类的情况下，专家在相对较短的搜索后找到提示ade的句子的可能性很大。此外，我们的系统相对于其他根据疾病和药物之间的关系进行提取和分类的关系分类模型具有竞争力。基于ade -药物关系的分类总体表现约为40%-60% [gydF4y2Ba 6gydF4y2Ba]。gydF4y2Ba

特性的贡献gydF4y2Ba

从特征贡献来看，词标记是对含ade的文章和暗示ade的句子分类贡献最大的特征。相比之下，与单词标记相比，标准疾病和药物名称以及上下文特征对分类性能的影响较小。这表明，疾病和药物名称的提取，需要相对较大的训练数据来建立模型，不一定需要保持准确性。含ade文章提取和含ade句子提取的所有特征及其系数列于gydF4y2Ba 多媒体附录2gydF4y2Ba和gydF4y2Ba 3.gydF4y2Ba。gydF4y2Ba

我们假设与语言相关的特征，如词嵌入(通常用于考虑词的语义的向量表示)可能会提高性能。然而，获得高质量的词嵌入需要大量的原始文本，并且很难用英语以外的语言准备(特别是在医学领域)。因此，我们更多地关注于使用与语言无关的特性。每个模型的特征并不取决于日语的特征。因此，我们的系统很容易适用于用非英语语言写的论文，这些论文的注释语料库相对较小。gydF4y2Ba

误差分析gydF4y2Ba

我们在ade提示句子提取方面取得了相对较差的性能。因此，我们研究了ade暗示句子提取模型的分类错误，并使用所有特征进行定性系统输出分析。gydF4y2Ba

表5gydF4y2Ba显示系统分类的示例。对于每个例子，第一个句子是前一个句子，其余的是相应的句子。请注意，术语“金标准”和“系统预测”表示相应的句子标签。在本节中，我们分析被系统错误分类的案例(c) - (f)。gydF4y2Ba

表5gydF4y2Ba

分类结果示例。gydF4y2Ba

情况下gydF4y2Ba	正确的标签gydF4y2Ba	预测gydF4y2Ba	句子gydF4y2Ba
(一)gydF4y2Ba	正面gydF4y2Ba^{一个gydF4y2Ba}	正面gydF4y2Ba	MTXgydF4y2Ba^bgydF4y2Ba+阿达木单抗开始给药。因为甲氨蝶呤的副作用改成了赛妥珠单抗pegol。gydF4y2Ba
(b)gydF4y2Ba	正面gydF4y2Ba	正面gydF4y2Ba	病例:男，74岁。(以前的历史)gydF4y2Ba由于ABPC/SBT引起的皮疹gydF4y2Ba^cgydF4y2Ba。CEZ过敏性休克gydF4y2Ba^dgydF4y2Ba。gydF4y2Ba
(c)gydF4y2Ba	正面gydF4y2Ba	Non-ADEgydF4y2Ba	一名59岁的RA患者服用甲氨蝶呤gydF4y2Ba^egydF4y2Ba。2011年3月，患者出现呼吸困难，就诊。gydF4y2Ba
(d)gydF4y2Ba	正面gydF4y2Ba	Non-ADEgydF4y2Ba	病例:女性，79岁。gydF4y2Ba(主诉)gydF4y2Ba【当前病史】gydF4y2Ba患者服用强的松龙40 mg/d，甲氨蝶呤8 mg/周。患者表现为巨细胞动脉炎，并使用胰岛素治疗糖尿病。两周后，她因身体不适和食欲不振而住院。gydF4y2Ba
(e)gydF4y2Ba	Non-ADEgydF4y2Ba^fgydF4y2Ba	正面gydF4y2Ba	史蒂文斯-约翰逊综合征(SJS)的特征是发烧和严重的皮肤粘膜疹，包括眼睛、嘴唇和外阴的粘膜转移，以及表皮红斑和坏死损伤引起的水疱和糜烂。大多数病例被认为是一些最严重形式的药疹。其他的则与病毒和支原体感染有关。gydF4y2Ba
(f)gydF4y2Ba	Non-ADEgydF4y2Ba	正面gydF4y2Ba	图10显示了临床过程。根据报告制度，约25%(92/372)的药物引起TdPgydF4y2Ba^ggydF4y2Ba在过去的五年中，有新的喹诺酮类药物(主要是左氧氟沙星)。gydF4y2Ba
(g)gydF4y2Ba	Non-ADEgydF4y2Ba	Non-ADEgydF4y2Ba	病例:70岁男性，有高血压病史。第X天出现右眼疼痛，并伴有视力模糊。gydF4y2Ba
(h)gydF4y2Ba	Non-ADEgydF4y2Ba	Non-ADEgydF4y2Ba	病例:79岁女性。在诊断为中血管炎后，患者已服用强的松龙60毫克和甲氨蝶呤6毫克6个月。gydF4y2Ba

^{一个gydF4y2Ba}艾德:艾德的建议。gydF4y2Ba

^bgydF4y2BaMTX:甲氨蝶呤。gydF4y2Ba

^cgydF4y2BaABPC / SBT:氨苄西林/ sulbactam。gydF4y2Ba

^dgydF4y2BaCEZ:头孢唑林。gydF4y2Ba

^egydF4y2BaRA:类风湿性关节炎。gydF4y2Ba

^fgydF4y2Ba非ade:非ade建议。gydF4y2Ba

^ggydF4y2BaTdP:扭转点。gydF4y2Ba

情况(c)和(d)是需要前一句中的信息来对句子进行分类的例子。如果只考虑以下句子，每个例子都不会被视为提示ade的句子。但是，如果将前一句也考虑在内，则将后一句视为ADE，因为其中提到的症状可能是指前一句中提到的药物引起的ADE。当我们添加前句和后句的特征时，出现了分类错误。gydF4y2Ba

情况(e)和(f)是将一般陈述与实际情况混淆的例子。每个例子对应的句子描述了药物引起的一般疾病。然而，一般陈述和实际情况在表达方面是相似的。因此，产生了错误。gydF4y2Ba

限制gydF4y2Ba

虽然我们的系统检测含有ade的文章具有较高的准确率和召回率，但是ade暗示句子的提取性能相对较差。这种糟糕的表现可能有3个原因。第一个原因是上下文的范围。我们的系统只能考虑两个连续句子的上下文，这可能会增加假阴性。为了在更广泛的上下文中检测ade，需要其他方法，如段落分类和顺序标记，例如，CRF和隐马尔可夫模型。gydF4y2Ba

第二个可能的原因是过度拟合。gydF4y2Ba 图3gydF4y2Ba显示了几种训练数据大小的F1分数。所有训练集F1分数设置为100%。相比之下，验证集的那些是低的。这种过拟合的发生是因为训练数据的大小相对于模型的复杂性来说很小。在含有ade的句子提取中，由于上下文特征的存在，我们使用的特征数量是含有ade的文章提取的3倍。虽然上下文特征包含了大量的信息，但大多数都是关于不相关的单词，这可能会导致过拟合。gydF4y2Ba

图3gydF4y2Ba

训练数据大小与ade提示句子提取F1分数的关系。ADE:药物不良事件。gydF4y2Ba

ade提示句子提取效果不佳的第三个可能原因是OCR错误。OCR可以省略或误读字母、字符和单词，从而扩大词汇量。对于多列的日文科学论文，OCR精度的提高有望加快预处理的速度和便捷性。gydF4y2Ba

与以往研究比较gydF4y2Ba

许多研究已经通过nlp确定了医学文章中报道的ADEs [gydF4y2Ba 8gydF4y2Ba，gydF4y2Ba 9gydF4y2Ba]、电子健康纪录[gydF4y2Ba 5gydF4y2Ba，gydF4y2Ba 6gydF4y2Ba]，以及社交媒体上的帖子[gydF4y2Ba 10gydF4y2Ba，gydF4y2Ba 11gydF4y2Ba]。为医学文章中的病例报告创建了一个用于ADEs自动检测的带注释的语料库[gydF4y2Ba 26gydF4y2Ba]。一些研究试图通过使用该语料库来检测ade [gydF4y2Ba 23gydF4y2Ba，gydF4y2Ba 27gydF4y2Ba，gydF4y2Ba 28gydF4y2Ba]。可以使用各种方法来检测ade。然而，以往的研究主要采用关系分类和实体分类。相比之下，我们的方法是基于文档和句子分类。gydF4y2Ba

关系分类:该方法提取药物与其对应ADE之间的关系[gydF4y2Ba 29gydF4y2Ba，gydF4y2Ba 30.gydF4y2Ba]。虽然这是捕获这些关联的最精确的方法，但它需要对所有药物、疾病及其关系进行广泛的注释，这是一个昂贵的过程。当参数只是远程相关时，药物-疾病关系的分类是困难的[gydF4y2Ba 6gydF4y2Ba]。gydF4y2Ba

实体分类:这种方法使用关于特定药物的文本片面地关注不良事件。疾病只有在属于ADEs时才会被分类[gydF4y2Ba 11gydF4y2Ba，gydF4y2Ba 30.gydF4y2Ba]。这种方法降低了注释成本。相比之下，它没有提供ADE触发器的指示。gydF4y2Ba

句子分类:这种方法检测与ade相关的句子，但不处理实体。因此，它们与特定药物的关系尚不清楚。药物及其对应的ADE主要出现在一个句子中[gydF4y2Ba 24gydF4y2Ba]。然而，如果药物和相应的ade之间的间隔超过1句话，这种方法就无法捕捉到它们之间的关系。gydF4y2Ba

文档分类:这种方法在文档级别进行ade阳性或ade阴性识别。在大多数情况下，文档可能包含仅在该文档中引用的多个ade，并且可以同时考虑所有ade。然而，输出提供的信息有限，需要手动检测所有句子中的ade。gydF4y2Ba

每种方法在标注成本、覆盖范围和任务难度方面各有优缺点。关系和实体分类方法提供了关于ade的精确信息，但它们的标注成本很高。这一限制严重限制了它们对日语等小语种的应用，因为精通这些语言的医学专家相对较少。相比之下，文档和句子分类可以以相对较低的标注成本进行。然而，它们只能探测到全局现象，提供的关于ade的信息相对较少。为了弥补这些方法的缺点，我们的系统集成了文档和句子分类。gydF4y2Ba

结论gydF4y2Ba

在这里，我们开发了一个系统来监控日本的药品上市后监控。我们的新方法基于文档和句子分类，识别与ade相关的文章并提供ade暗示句子。由于该系统实现了简单的分类算法，可以方便地在制药公司内部应用和管理。gydF4y2Ba

实验结果表明，该系统能够准确地提取与ADEs相关的文章。它采用了NLP技术，可以减轻日本制药公司的一些体力劳动。gydF4y2Ba

我们的目标是将该系统应用于实际的上市后监测，并评估其在实际监测中的效率和有效性。展望未来，我们将探索更复杂的分类算法，以检测更广泛的ade。gydF4y2Ba

多媒体附录1gydF4y2Ba

药物在数据中出现的频率。gydF4y2Ba

多媒体附录2gydF4y2Ba

含ade物品提取的特征和系数。gydF4y2Ba

多媒体附录3gydF4y2Ba

ade暗示句子提取的特征和系数。gydF4y2Ba

缩写gydF4y2Ba

正面gydF4y2Ba

药物不良事件gydF4y2Ba

美国存托凭证gydF4y2Ba

药物不良反应gydF4y2Ba

CRFgydF4y2Ba

条件随机场gydF4y2Ba

NLPgydF4y2Ba

自然语言处理gydF4y2Ba

神经网络gydF4y2Ba

光学字符识别gydF4y2Ba

本研究得到了富士施乐有限公司的部分资助。我们感谢KT和CK对数据集的注释。gydF4y2Ba

SU, SW, SY和EA设计了研究，分析了结果，并准备了手稿。SU实现了该系统并进行了实验。gydF4y2Ba

没有宣布。gydF4y2Ba

1gydF4y2Ba

世界卫生组织gydF4y2Ba

国际药物监测:医院的作用(世卫组织会议报告)gydF4y2Ba 1960gydF4y2Ba

2020-11-17gydF4y2Ba

瑞士日内瓦gydF4y2Ba

世界卫生组织gydF4y2Ba

https://apps.who.int/iris/bitstream/handle/10665/40747/WHO_TRS_425.pdf?sequence=1&isAllowed=ygydF4y2Ba

2gydF4y2Ba

霍华德gydF4y2Ba

RLgydF4y2Ba

艾弗里gydF4y2Ba

AJgydF4y2Ba

SlavenburggydF4y2Ba

年代gydF4y2Ba

皇家gydF4y2Ba

年代gydF4y2Ba

管gydF4y2Ba

GgydF4y2Ba

LucassengydF4y2Ba

PgydF4y2Ba

PirmohamedgydF4y2Ba

米gydF4y2Ba

哪些药物导致可预防的住院?系统回顾gydF4y2Ba

临床药学杂志gydF4y2Ba 2007gydF4y2Ba 02gydF4y2Ba 63gydF4y2Ba 2gydF4y2Ba 136gydF4y2Ba 47gydF4y2Ba

10.1111 / j.1365-2125.2006.02698.xgydF4y2Ba

16803468gydF4y2Ba

BCP2698gydF4y2Ba

PMC2000562gydF4y2Ba

3.gydF4y2Ba

罗杰斯gydF4y2Ba

作为gydF4y2Ba

药物不良事件:识别和归因gydF4y2Ba

药物情报克林药房gydF4y2Ba 1987gydF4y2Ba 11gydF4y2Ba 21gydF4y2Ba 11gydF4y2Ba 915gydF4y2Ba 20.gydF4y2Ba

3678067gydF4y2Ba

4gydF4y2Ba

托尔伯特gydF4y2Ba

JCCgydF4y2Ba

尼尔森gydF4y2Ba

废话gydF4y2Ba

制药业的药物警戒gydF4y2Ba

临床药学杂志gydF4y2Ba 1998gydF4y2Ba 05gydF4y2Ba 04gydF4y2Ba 45gydF4y2Ba 5gydF4y2Ba 427gydF4y2Ba 31gydF4y2Ba

10.1046 / j.1365-2125.1998.00713.xgydF4y2Ba

9643613gydF4y2Ba

PMC1873545gydF4y2Ba

5gydF4y2Ba

亨利gydF4y2Ba

年代gydF4y2Ba

巴肯gydF4y2Ba

KgydF4y2Ba

FilanninogydF4y2Ba

米gydF4y2Ba

斯塔布斯gydF4y2Ba

一个gydF4y2Ba

UzunergydF4y2Ba

OgydF4y2Ba

2018n2c2电子病历中药物不良事件及药物提取共享任务gydF4y2Ba

美国医学信息协会gydF4y2Ba 2020gydF4y2Ba 01gydF4y2Ba 01gydF4y2Ba 27gydF4y2Ba 1gydF4y2Ba 3.gydF4y2Ba 12gydF4y2Ba

10.1093 /地点/ ocz166gydF4y2Ba

31584655gydF4y2Ba

5581277gydF4y2Ba

6gydF4y2Ba

李gydF4y2Ba

FgydF4y2Ba

刘gydF4y2Ba

WgydF4y2Ba

余gydF4y2Ba

HgydF4y2Ba

从电子健康记录中提取药物不良事件相关信息:基于深度学习的端到端模型设计gydF4y2Ba

JMIR Med InformgydF4y2Ba 2018gydF4y2Ba 11gydF4y2Ba 26gydF4y2Ba 6gydF4y2Ba 4gydF4y2Ba e12159gydF4y2Ba

10.2196/12159gydF4y2Ba

30478023gydF4y2Ba

v6i4e12159gydF4y2Ba

PMC6288593gydF4y2Ba

7gydF4y2Ba

臼井仪人gydF4y2Ba

米gydF4y2Ba

AramakigydF4y2Ba

EgydF4y2Ba

IwaogydF4y2Ba

TgydF4y2Ba

WakamiyagydF4y2Ba

年代gydF4y2Ba

坂本gydF4y2Ba

TgydF4y2Ba

MochizukigydF4y2Ba

米gydF4y2Ba

从药物警戒的电子用药史中提取和标准化患者投诉:日语的自然语言处理分析gydF4y2Ba

JMIR Med InformgydF4y2Ba 2018gydF4y2Ba 09gydF4y2Ba 27gydF4y2Ba 6gydF4y2Ba 3.gydF4y2Ba e11021gydF4y2Ba

10.2196/11021gydF4y2Ba

30262450gydF4y2Ba

v6i3e11021gydF4y2Ba

PMC6231790gydF4y2Ba

8gydF4y2Ba

GurulingappagydF4y2Ba

HgydF4y2Ba

Mateen-RajputgydF4y2Ba

一个gydF4y2Ba

瞬间便gydF4y2Ba

lgydF4y2Ba

从医学病例报告中提取潜在药物不良事件gydF4y2Ba

J生物医学语义gydF4y2Ba 2012gydF4y2Ba 12gydF4y2Ba 20.gydF4y2Ba 3.gydF4y2Ba 1gydF4y2Ba 15gydF4y2Ba

10.1186 / 2041-1480-3-15gydF4y2Ba

23256479gydF4y2Ba

2041-1480-3-15gydF4y2Ba

PMC3599676gydF4y2Ba

9gydF4y2Ba

P TaftigydF4y2Ba

一个gydF4y2Ba

獾gydF4y2Ba

JgydF4y2Ba

的女子gydF4y2Ba

EgydF4y2Ba

ShirzadigydF4y2Ba

EgydF4y2Ba

MahnkegydF4y2Ba

一个gydF4y2Ba

迈耶gydF4y2Ba

JgydF4y2Ba

叶gydF4y2Ba

ZgydF4y2Ba

页面gydF4y2Ba

DgydF4y2Ba

PeissiggydF4y2Ba

PgydF4y2Ba

利用生物医学文献发现药物不良事件:大数据神经网络冒险gydF4y2Ba

JMIR Med InformgydF4y2Ba 2017gydF4y2Ba 12gydF4y2Ba 08gydF4y2Ba 5gydF4y2Ba 4gydF4y2Ba 楼gydF4y2Ba

10.2196 / medinform.9170gydF4y2Ba

29222076gydF4y2Ba

v5i4e51gydF4y2Ba

PMC5741828gydF4y2Ba

10gydF4y2Ba

陈gydF4y2Ba

XgydF4y2Ba

FaviezgydF4y2Ba

CgydF4y2Ba

舒克gydF4y2Ba

年代gydF4y2Ba

Lillo-Le-LouetgydF4y2Ba

一个gydF4y2Ba

TexiergydF4y2Ba

NgydF4y2Ba

DahamnagydF4y2Ba

BgydF4y2Ba

担任gydF4y2Ba

CgydF4y2Ba

FoulquiegydF4y2Ba

PgydF4y2Ba

佩雷拉gydF4y2Ba

年代gydF4y2Ba

LerouxgydF4y2Ba

VgydF4y2Ba

KarapetiantzgydF4y2Ba

PgydF4y2Ba

Guenegou-ArnouxgydF4y2Ba

一个gydF4y2Ba

KatsahiangydF4y2Ba

年代gydF4y2Ba

BousquetgydF4y2Ba

CgydF4y2Ba

BurgungydF4y2Ba

一个gydF4y2Ba

挖掘患者在社交媒体上的叙述以进行药物警戒:哌甲酯的不良反应和滥用gydF4y2Ba

前药物杂志gydF4y2Ba 2018gydF4y2Ba 9gydF4y2Ba 541gydF4y2Ba

10.3389 / fphar.2018.00541gydF4y2Ba

29881351gydF4y2Ba

PMC5978246gydF4y2Ba

11gydF4y2Ba

NikfarjamgydF4y2Ba

一个gydF4y2Ba

衬衣gydF4y2Ba

一个gydF4y2Ba

奥康纳gydF4y2Ba

KgydF4y2Ba

GinngydF4y2Ba

RgydF4y2Ba

冈萨雷斯gydF4y2Ba

GgydF4y2Ba

来自社交媒体的药物警戒:使用具有词嵌入聚类特征的序列标记挖掘药物不良反应提及gydF4y2Ba

美国医学信息协会gydF4y2Ba 2015gydF4y2Ba 05gydF4y2Ba 22gydF4y2Ba 3.gydF4y2Ba 671gydF4y2Ba 81gydF4y2Ba

10.1093 /地点/ ocu041gydF4y2Ba

25755127gydF4y2Ba

ocu041gydF4y2Ba

PMC4457113gydF4y2Ba

12gydF4y2Ba

汉斯gydF4y2Ba

米gydF4y2Ba

古普塔gydF4y2Ba

SKgydF4y2Ba

美国、联合王国、加拿大、印度药物警戒法规的比较评价和全球统一做法的必要性gydF4y2Ba

远景诊所gydF4y2Ba 2018gydF4y2Ba 9gydF4y2Ba 4gydF4y2Ba 170gydF4y2Ba 174gydF4y2Ba

10.4103 / picr.PICR_89_17gydF4y2Ba

30319947gydF4y2Ba

pcr - 9 - 170gydF4y2Ba

PMC6176689gydF4y2Ba

13gydF4y2Ba

美国食品药品监督管理局gydF4y2Ba

人类药物和生物制品的研究性新药安全报告要求和人类生物利用度和生物等效性研究的安全报告要求gydF4y2Ba 2010gydF4y2Ba

2020-11-17gydF4y2Ba

马里兰州银泉市gydF4y2Ba

美国食品药品监督管理局gydF4y2Ba

https://www.govinfo.gov/content/pkg/FR-2010-09-29/pdf/2010-24296.pdfgydF4y2Ba

14gydF4y2Ba

欧洲委员会gydF4y2Ba

欧盟委员会的通讯-人用药品临床试验中产生的不良事件/反应报告的收集、核实和提交的详细指南(“CT-3”)gydF4y2Ba 2011gydF4y2Ba

2020-11-17gydF4y2Ba

比利时布鲁塞尔gydF4y2Ba

欧洲委员会gydF4y2Ba

https://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:C:2011:172:0001:0013:EN:PDFgydF4y2Ba

15gydF4y2Ba

药品和医疗器械管理局gydF4y2Ba

基于《药品和医疗器械法》的副作用、传染病和缺陷报告(适用于医务人员)(日语)gydF4y2Ba 2020-11-17gydF4y2Ba

日本东京gydF4y2Ba

药品和医疗器械管理局gydF4y2Ba

https://www.pmda.go.jp/safety/reports/hcp/pmd-act/0003.htmlgydF4y2Ba

16gydF4y2Ba

NJK公司gydF4y2Ba

WinReader PRO v.15.0gydF4y2Ba 2020-11-17gydF4y2Ba

https://mediadrive.jp/products/wrp/gydF4y2Ba

17gydF4y2Ba

科恩gydF4y2Ba

JgydF4y2Ba

名义比额表的一致系数gydF4y2Ba

教育与心理测量gydF4y2Ba 1960gydF4y2Ba 04gydF4y2Ba 01gydF4y2Ba 20.gydF4y2Ba 1gydF4y2Ba 37gydF4y2Ba 46gydF4y2Ba

10.1177 / 001316446002000104gydF4y2Ba

18gydF4y2Ba

AramakigydF4y2Ba

EgydF4y2Ba

矢野gydF4y2Ba

KgydF4y2Ba

WakamiyagydF4y2Ba

年代gydF4y2Ba

MedEx/J:一种一扫简单快速的日语临床文本NLP工具gydF4y2Ba

Stud健康技术信息gydF4y2Ba 2017gydF4y2Ba 245gydF4y2Ba 285gydF4y2Ba 288gydF4y2Ba

29295100gydF4y2Ba

19gydF4y2Ba

伊藤gydF4y2Ba

KgydF4y2Ba

NagaigydF4y2Ba

HgydF4y2Ba

OkahisagydF4y2Ba

TgydF4y2Ba

WakamiyagydF4y2Ba

年代gydF4y2Ba

IwaogydF4y2Ba

TgydF4y2Ba

AramakigydF4y2Ba

EgydF4y2Ba

J-MeDic:基于真实临床用法的日本疾病名称词典gydF4y2Ba

2018gydF4y2Ba

第十一届语言资源与评价国际会议论文集gydF4y2Ba

2018年5月7日至12日gydF4y2Ba

宫崎骏,日本gydF4y2Ba

20.gydF4y2Ba

奈良科学技术研究所社会计算实验室gydF4y2Ba

HYAKUYAKU字典。gydF4y2Ba 2020-11-17gydF4y2Ba

https://sociocom.naist.jp/hyakuyaku-dic-en/gydF4y2Ba

21gydF4y2Ba

AramakigydF4y2Ba

EgydF4y2Ba

ImaigydF4y2Ba

TgydF4y2Ba

MiyogydF4y2Ba

KgydF4y2Ba

咸宁gydF4y2Ba

KgydF4y2Ba

结合音译概率的正字法消歧义gydF4y2Ba

2008gydF4y2Ba

第三届自然语言处理国际联合会议论文集gydF4y2Ba

2008年1月7日至12日gydF4y2Ba

海德拉巴，特伦加纳，印度gydF4y2Ba

22gydF4y2Ba

BelinkovgydF4y2Ba

YgydF4y2Ba

玻璃gydF4y2Ba

JgydF4y2Ba

神经语言处理中的分析方法综述gydF4y2Ba

计算语言学协会汇刊gydF4y2Ba 2019gydF4y2Ba 11gydF4y2Ba 7gydF4y2Ba 49gydF4y2Ba 72gydF4y2Ba

10.1162 / tacl_a_00254gydF4y2Ba

23gydF4y2Ba

PedregosagydF4y2Ba

FgydF4y2Ba

VaroquauxgydF4y2Ba

GgydF4y2Ba

GramfortgydF4y2Ba

一个gydF4y2Ba

Scikit-learn: Python中的机器学习gydF4y2Ba

J Mach Learn ResgydF4y2Ba 2011gydF4y2Ba 12gydF4y2Ba 85gydF4y2Ba 2825gydF4y2Ba 2830gydF4y2Ba

24gydF4y2Ba

NegigydF4y2Ba

KgydF4y2Ba

PavurigydF4y2Ba

一个gydF4y2Ba

帕特尔gydF4y2Ba

lgydF4y2Ba

耆那教徒的gydF4y2Ba

CgydF4y2Ba

一种利用机器学习提取药物不良事件的新方法gydF4y2Ba

医学信息学解锁gydF4y2Ba 2019gydF4y2Ba 17gydF4y2Ba 100190gydF4y2Ba

10.1016 / j.imu.2019.100190gydF4y2Ba

25gydF4y2Ba

荣誉gydF4y2Ba

TgydF4y2Ba

MeCab:又一个词性和形态分析器gydF4y2Ba 2020-11-17gydF4y2Ba

https://taku910.github.io/mecab/gydF4y2Ba

26gydF4y2Ba

GurulingappagydF4y2Ba

HgydF4y2Ba

拉其普特人gydF4y2Ba

我gydF4y2Ba

罗伯茨gydF4y2Ba

一个gydF4y2Ba

FluckgydF4y2Ba

JgydF4y2Ba

Hofmann-ApitiusgydF4y2Ba

米gydF4y2Ba

瞬间便gydF4y2Ba

lgydF4y2Ba

开发基准语料库，以支持从医疗病例报告中自动提取与药物有关的不良反应gydF4y2Ba

J生物医学信息gydF4y2Ba 2012gydF4y2Ba 10gydF4y2Ba 45gydF4y2Ba 5gydF4y2Ba 885gydF4y2Ba 92gydF4y2Ba

10.1016 / j.jbi.2012.04.008gydF4y2Ba

22554702gydF4y2Ba

s1532 - 0464 (12) 00061 - 5gydF4y2Ba

27gydF4y2Ba

康gydF4y2Ba

NgydF4y2Ba

辛格gydF4y2Ba

BgydF4y2Ba

中方通过gydF4y2Ba

CgydF4y2Ba

阿夫扎尔gydF4y2Ba

ZgydF4y2Ba

范gydF4y2Ba

MEMgydF4y2Ba

KorsgydF4y2Ba

晶澳gydF4y2Ba

基于知识的生物医学文本药物不良事件提取gydF4y2Ba

BMC生物信息学gydF4y2Ba 2014gydF4y2Ba 03gydF4y2Ba 04gydF4y2Ba 15gydF4y2Ba 64gydF4y2Ba

10.1186 / 1471-2105-15-64gydF4y2Ba

24593054gydF4y2Ba

1471-2105-15-64gydF4y2Ba

PMC3973995gydF4y2Ba

28gydF4y2Ba

HenrikssongydF4y2Ba

一个gydF4y2Ba

KvistgydF4y2Ba

米gydF4y2Ba

DalianisgydF4y2Ba

HgydF4y2Ba

DuneldgydF4y2Ba

米gydF4y2Ba

用上下文的分布语义表示识别临床记录中的不良药物事件信息gydF4y2Ba

J生物医学信息gydF4y2Ba 2015gydF4y2Ba 08gydF4y2Ba 17gydF4y2Ba

10.1016 / j.jbi.2015.08.013gydF4y2Ba

26291578gydF4y2Ba

s1532 - 0464 (15) 00180 - xgydF4y2Ba

29gydF4y2Ba

赵gydF4y2Ba

JgydF4y2Ba

HenrikssongydF4y2Ba

一个gydF4y2Ba

发问者gydF4y2Ba

lgydF4y2Ba

博斯特罗姆gydF4y2Ba

HgydF4y2Ba

用于药物不良事件检测的结构化电子健康记录的预测建模gydF4y2Ba

BMC Med Inform Decis markgydF4y2Ba 2015gydF4y2Ba 15补充4gydF4y2Ba S1gydF4y2Ba

10.1186 / 1472 - 6947 - 15 - s4 - s1gydF4y2Ba

26606038gydF4y2Ba

1472 - 6947 - 15 - s4 - s1gydF4y2Ba

PMC4660129gydF4y2Ba

30.gydF4y2Ba

赵gydF4y2Ba

JgydF4y2Ba

HenrikssongydF4y2Ba

一个gydF4y2Ba

发问者gydF4y2Ba

lgydF4y2Ba

博斯特罗姆gydF4y2Ba

HgydF4y2Ba

用临床测量的多种表示来检测药物不良事件gydF4y2Ba

2015gydF4y2Ba

IEEE生物信息学与生物医学国际会议论文集gydF4y2Ba

2014年11月9日至12日gydF4y2Ba

英国贝尔法斯特gydF4y2Ba

华盛顿特区gydF4y2Ba

IEEEgydF4y2Ba

10.1109 / bibm.2014.6999216gydF4y2Ba