发表在10卷, 5号(2022): 5月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/35239,首次出版
基于变形与生成对抗网络的住院中医处方推荐:发展研究

基于变形与生成对抗网络的住院中医处方推荐:发展研究

基于变形与生成对抗网络的住院中医处方推荐:发展研究

原始论文

1中国中医科学院广安门医院,中国北京

2无锡大学电子信息工程学院,江苏无锡

3.医师资格培训,国家中医药管理局中医认证中心,北京,中国

4南京理工大学电子工程与光电技术学院,江苏南京

这些作者的贡献相同

通讯作者:

倪万东博士

医师资格认证课程

中药认证中心

国家中医药管理局

北县葛路5号

西城区

北京,100053

中国

电话:86 13311127900

电子邮件:2592967878 @qq.com


背景:中医在诊断病人时通常遵循四步评估流程:观察、听诊、嗅探、问诊、脉感和触诊。在此过程中收集的信息,以及实验室测试结果和生命体征等其他测量结果,都记录在患者的电子健康记录(EHR)中。事实上,制定治疗计划所需的所有信息都包含在电子病历中;然而,只有经验丰富的中医才能很好地利用这些信息来制定好的治疗方案,因为推理过程非常复杂,医学毕业生需要多年的实践才能掌握推理技能。在这个数字医学时代,随着海量的医疗数据、不断增长的计算能力和更先进的人工神经网络模型,计算机系统模仿中医的决策过程不仅是可取的,而且是容易实现的。

摘要目的:本研究旨在开发一种基于患者临床电子病历预测住院患者处方的辅助工具。

方法:使用包含病史、当前症状和诊断信息的临床健康记录,以相应医生的处方为目标,训练基于变压器的神经网络模型。这是通过从患者的电子病历中提取相关信息来完成的,例如患者当前的疾病、服用的药物、给予的护理、生命体征、检查和实验室结果。然后将获得的信息按时间顺序排序,以产生患者的数据序列。然后将这些时间序列数据作为输入输入到一个改进的变压器网络中,并选择该网络作为处方预测模型。模型的输出是患者的处方。该工具的最终目标是生成与中医专家开出的处方相匹配的处方。为了缓解过拟合问题,使用生成式对抗网络从原始训练样本中生成添加噪声的样本来增强训练样本数据集。

结果:本研究共使用广安门医院住院电子病历21,295份。这些记录是在2017年1月至2018年12月期间生成的,涵盖6352种药物。根据药物的类别关系,将这些药物分为819类第一类药物。测试结果表明,经过充分训练的变压器模型的平均准确率为80.58%,平均召回率为68.49%。

结论:初步试验结果表明,基于变压器的中药处方推荐模型优于现有的常规方法。生成对抗网络生成的额外训练样本有助于克服过拟合问题,从而进一步提高召回率和准确率。

中国生物医学工程学报;2010;31 (5):559 - 559

doi: 10.2196/35239

关键字



电子健康记录(EHR)系统的广泛使用导致了数字化医疗数据的爆炸式增长。随着数据量和复杂性的增长,医疗分析和决策变得越来越耗时和容易出错。在现实中,人类医生不能及时地充分利用他或她所掌握的所有可用信息。因此,利用EHR数据中包含的信息(其中大部分以文本形式)对于推动创新研究、提高医疗质量和降低成本至关重要。自然语言处理(NLP)是将自由文本中的相关信息转换为结构化数据以供进一步计算机化处理的关键。利用电子病历数据开发预测模型的动机是希望为临床卫生保健提供者提供以药物为导向的决策支持工具。为了构建这样的预测模型,我们使用NLP技术将患者的EHR数据转换为表示,然后该表示成为深度学习模型的输入,以预测医疗事件,例如药物订单。

生物医学NLP在过去的30年里取得了巨大的进步[12]并在近年来变得尤为活跃[3.]。以前,电子病历数据的分析使用传统的机器学习和统计技术,如逻辑回归、支持向量机和随机森林[4]。然而,近年来,正如Shickel等人的研究综述[5], Sheikhalishahi等[6],以及Miotto等人[7],许多研究都致力于将深度学习技术应用于临床信息学任务的电子病历数据。自动编码器已被研究人员使用[8来预测一组特定的诊断。长短期记忆(LSTM)序列模型[9经过培训,可以为住院患者提供针对特定患者和特定时间的药物处方预测[10]。使用卷积神经网络(CNN)模型利用入院时可获得的信息预测出院药物[11]。Goldstein等人在研究中调查了许多文章[12关于使用电子病历数据开发风险预测模型。Rajkomar等人的研究报告了将深度学习技术应用于EHR数据以解决各种预测问题的全面研究[13]。利用电子病历数据成功训练递归神经网络来检测医疗事件[14-16]。

近十年来,人工智能在中医领域的应用研究非常活跃[1718]。数据挖掘技术已被用于中医证候建模和糖尿病处方推荐[19]。PageRank算法[20.]被修改并应用于中药处方推荐中[21]。在我们以前的工作中[17],使用CNN预测中医疾病,XGBoost与其他神经网络一起预测中医证候。遵循序列到序列的范式,北京大学的研究人员使用双向门控递归神经网络从症状描述生成中医处方[22]。他们提出了一个覆盖机制和一个软损失函数,作为他们遇到的重复问题的补救措施。然而,将症状描述作为输入的要求阻碍了这种方法的实用性。理想情况下,该模型直接从原始电子病历数据生成中药处方,类似于人类中医医生进行演绎推理的方式。

从原始电子病历数据生成处方通常包括两个部分。第一部分使用生物医学NLP [3.]提取人类医生使用的相关信息以形成特征表示的技术[23]。第二部分使用深度学习技术[7将这个特征表示映射到处方顺序中。

生物医学NLP的主要任务是从以自由格式的文本书写的临床叙述中提取相关信息,并将收集到的信息存储为结构化数据。许多深度学习技术[24-26],如双向LSTM (BiLSTM),已应用于生物医学NLP领域。BiLSTM条件随机场(CRF)和变压器随机场(transformer CRF)已被用于中文电子病历记录的命名实体识别(NER) [2728]。然后将识别的实体形成不同的令牌。然后,患者EHR数据的特征表示变成一个令牌序列。然后使用词嵌入技术将标记转换为实值多维向量[29]。

本研究的目的是开发一种辅助工具,可以根据病人的临床电子病历为住院病人开中医处方。中药处方生成的预测模型是基于一种被称为变压器的序列转导模型[30.]。该模型完全基于注意,用多头自注意取代了编码器-解码器体系结构中最常用的循环层。该预测模型中使用的训练是监督训练,以EHR数据集中包含的人类撰写的处方作为训练目标。此外,生成对抗网络(GAN) [31]模型旨在通过减少过拟合的影响来增强训练集,从而进一步提高系统的整体性能。


本节安排如下:简要介绍系统总体架构;然后,介绍了各个组成子系统,其中可能包括一些功能块;最后,对训练过程进行了描述培训小节,其中使用GAN模型从原始样本中生成添加了噪声的样本。

系统概述

中国的医院和医疗机构正在迅速朝着标准化电子病历的方向发展,以符合中华人民共和国卫生部发布的法规和规范。32-34]。根据患者的情况,一份标准的EHR文档可能包含多达53个部分。这些可能包括以下内容:

  • 第一页记录,包含患者的基本个人信息,如性别、年龄、职业和婚姻状况
  • 一种住院记录,包含病人入院时的病情描述,包括主诉、病史和家族病史
  • 包含检测清单和相应结果的实验室检测记录
  • 一种护理记录,包括护士对病人的病情、接受的治疗和护理、体温和生命体征的记录,以及医生的医嘱
  • 包含整个住院诊断和治疗过程以及患者疾病的任何变化的治疗程序记录

提出的系统的高级框图如图所示图1.该系统包括4个子系统:自然语言处理子系统、特征提取子系统、矢量化子系统和处方预测子系统。NLP子系统对EHR文件进行处理,生成结构化数据,特征提取子系统对结构化数据进行处理,提取相关临床信息,用于处方预测。向量化子系统将用汉字书写的符号序列映射为数字序列,在多维空间中以向量的形式呈现。处方预测子系统是基于变压器的深度学习模型,根据输入向量数据自动生成处方。前3个子系统共同完成了从EHR文件中提取相关信息以形成预测模型输入变量的任务。类似的表征学习操作在我们之前的论文[17]。

简而言之,NLP将原始EHR数据规范化,特征提取器将规范化数据转换为标记序列,向量化子系统将标记映射为实数向量,预测模型执行推理过程以生成处方。

图1所示。处方生成系统框图。EHR:电子健康记录;NLP:自然语言处理。
查看此图

NLP子系统

该子系统负责从原始EHR文档生成结构化数据。子系统内部框图如图所示图2.该子系统有3个功能模块:预处理模块、NER模块和英国医学杂志模块。

预处理块通过删除图片和不可用的组件来清理原始EHR文档。这确保了电子医疗记录的完整性和准确性。信息不完整或不一致的电子病历将被丢弃。

在初始清理之后,EHR文件的内容被划分为不同的部分。例如,入院记录分为主诉、病史和其他部分。然后,对所有生成的部分进行排序、格式化,并随后将其提供给NER块。

EHR文档中只有一小部分采用固定格式,其余部分采用非结构化的自由式叙述。对于固定格式的文本,使用脚本提取命名实体以形成结构化数据。

对于自由式叙述,使用称为实体识别的功能块来提取命名实体以形成结构化数据条目。NER块是使用带有CRF的BiLSTM网络实现的(BiLSTM-CRF) [24]。

然后,提取的命名实体,如症状、疾病、药物、检查和测试,根据英国医学杂志最佳实践知识库的中文版进一步标准化。

图3显示了处理结果的示例,其中原始EHR笔记的入院记录被转换为结构化数据,标记的单词被命名为实体。

图2。命名实体识别子系统的框图。BiLSTM:双向长短期记忆;EMR:电子病历;BiLSTM-CRF:双向长短期记忆-条件随机场;英国医学杂志。
查看此图
图3。将自由式叙述转换为结构化数据的例子。电子健康记录。
查看此图

特征提取子系统

为了有效地模拟由人类医生进行的推理过程,必须正确选择准确和相关的输入变量。这些变量应该代表人类医生在做出治疗决定时应该考虑的全部因素。文本框1总结了中医专家在做出治疗决定时考虑的主要因素。

特征提取子系统从标准化的结构化数据中提取上述关键特征,形成标记序列。图4显示了此特征提取的一个示例,其中从结构化数据生成一系列令牌。

文本类型和要提取的内容。

人口统计学

  • 性别,年龄,身高,体重和BMI

主要的投诉

  • 症状和体征

近期病史

  • 症状、体征和一般信息

既往病史

  • 过去的疾病和服用的药物

目前的疾病

  • 舌苔和舌脉

身体检查

  • 生命体征

处理过程记录

  • 目前病情及治疗方案

医生的命令

  • 处方

护理记录

  • 生命体征和用药记录

检查报告

  • 检查项目及发现

实验室报告

  • 检测项目及定性、定量检测结果
文本框1。文本类型和要提取的内容。
图4。将结构化数据转换为令牌序列的示例。
查看此图

矢量化子系统

概述

在此之前,做出治疗决定所需的所有医学信息都被封装在以汉字表示的文本数据中。要被深度学习网络——转换器——使用,信息必须被映射成一个数字变量。在向量化过程中,将中文单词或短语表示为多维特征空间中的实值向量。本节解释如何通过词嵌入进一步处理标记化的特征。

训练词嵌入模型

该语料库收集了广安门医院和其他医院的102596份电子病历。的Jieba标记器用于执行标记化。开源建模工具Gensim是用来训练word2vec [29]模型,主要参数如下:min_count= 2,vector_size= 100,窗口= 5,sg= 1,海关= 1,时代= 50。

如参数所示,采用Skip-Gram模型。每个单词由100维的实值向量表示。

向量化

一旦单词嵌入模型得到训练,每个标记就由一个100维向量表示。对于输入序列中的每个单词,在分配另一个唯一标识符之前,使用表示为名称-值单元的数字类型值分配一个唯一标识符。一旦所有的记号都转换成向量,这些向量就被连接起来形成一个单一的向量变量,然后作为转换器的输入。

NLP、特征提取和向量化子系统通过将EHR文档转换为多维实值向量来共同完成特征学习的任务。图5展示了一个从EHR文本到词向量的映射示例。

图5。将电子健康记录文本转换为词向量的说明。
查看此图

变压器子系统

变压器子系统负责为每个给定的输入嵌入推荐处方,如图所示图6.该子系统将在以下段落中进行描述。

输入嵌入是的向量max_num_tokens×vector_size维度。例如,max_num_tokens= 759,vector_size= 100如果序列中的令牌数量小于max_num_tokens。反之,如果序列中的令牌数大于max_num_tokens,令牌的数量上限为max_num_tokens通过丢弃与当前处方生成时间相对应的最旧时间戳的令牌。首先将输入嵌入样本添加到相同大小的位置向量中,成为第一编码器的输入。

子系统的主体由两个相同的级联变压器编码器组成。与原变压器的编码器不同[30.],包含6个相同的层,本研究中使用的编码器只有1层和4个子层。第一个是多头自我关注层Multi_heads= 4,head_dim= 8。第二个是100个归一化神经元的残差层。第三个是由2048个神经元组成的简单的、位置相关的、完全连接的前馈网络。第四层是100个归一化神经元的残差层。

第二个编码器后面是线性层、2048个神经元的前馈层、隐藏层和输出层,如图所示图6.输出层由819个神经元组成,具有s型激活函数。819个神经元中的每一个都对应一种草药成分。隐藏层由128个神经元组成,具有退出机制和归一化。辍学率设置为0.4740。这个隐藏层的目的是防止过拟合。

输出层的最终结果是819种药物成分的概率列表,值在0到1之间。然后通过为这些概率设置阈值来获得推荐处方。

图6。变压器子系统。
查看此图

培训

训练变压器

变压器的训练是一个有监督的学习过程。输入是患者EHR的实值向量表示,输出是处方。学习的目标是让机器生成的处方与人类医生开出的医嘱相匹配。

增强训练数据

为了减轻所提出的预测模型的过拟合效应,一种GAN [31]网络用于扩充训练数据集。根据GAN网络的基本思想,训练生成模型G来表示原始训练数据集的分布,训练判别模型D来检测样本是来自原始样本集还是来自生成模型的输出。

在训练阶段,整个系统如图所示图7.对于每个原始训练样本,都有一个添加了噪声的样本。在该系统中使用GAN有效地使训练样本数量增加了一倍。

GAN网络的内部结构设计如图所示图8.Generator G包含2个相同的LSTM层,每个层的大小为279。每个LSTM层后面都有一个带有残余连接的规范化层。鉴别器G的输入可以是原始词嵌入样本,也可以是生成器G生成的加了噪声的样本。鉴别器D包括大小为279的LSTM层、大小为100的残差和归一化层以及大小为256的全连接层。最后,鉴别器D使用一个sigmoid函数输出一个二进制值。

我们遵循了一个典型的GAN网络训练过程[31]来训练GAN子系统,同时训练鉴别器和生成器。鉴别器和生成器交替训练,直到达到纳什均衡。

发电机首先产生abatch_size加入噪声的EHR,嵌入生成器网络随机初始化系数的样本。这些样本与原始的无噪声EHR嵌入样本连接,形成(2xbatch_size)嵌入样例,各带max_num_tokens×vector_size真正的价值。例如,我们可以有batch_size= 500,max_num_tokens= 560,vector_size= 100。这些(2×batch_size)样本作为鉴别器的输入。对于每个输入样本,输出标签表明样本是来自真实的原始嵌入还是来自生成器。以最小化预测误差为目标,采用反向传播算法对鉴别器网络进行训练。当二元交叉熵损失函数停止下降时,鉴别器的训练停止。鉴别器训练然后暂时停止,让位于生成器训练。

为了训练生成器,必须冻结鉴别器的所有网络系数。鉴别器现在在发电机训练期间与发电机串联工作。发电机产生batch_size加入噪声的嵌入样本,对于每个样本,鉴别器输出一个预测。生成器使用基于鉴别器输出的反向传播算法更新其参数。当二元交叉熵损失函数停止增加时,生成器的训练停止。然后,生成器训练暂时停止,以产生鉴别器训练。

上述鉴别器和生成器训练过程共同形成一个训练历元。整个GAN网络的训练是通过几个时代来完成的。当达到纳什均衡时,训练停止。

中包含的Python伪代码演示了整个训练过程多媒体附录1

图7。预测建模系统在训练阶段的框图。EHR:电子健康记录;GAN:生成对抗网络;NLP:自然语言处理。
查看此图
图8。生成对抗网络子系统的内部结构。LSTM:长短期记忆;*该层使用的神经网络的大小。
查看此图

伦理批准

本研究通过广门医院伦理委员会(SQ2017YFGX 060073)机构审查委员会审查。


数据集

本研究以广安门医院2017年1月1日至2018年12月31日的电子病历作为数据集。最初,EHR笔记有27,846份,其中6551份(23.53%)份因质量控制而被丢弃。符合下列条件之一的电子病历记录应被丢弃:

  • 由于缺少几页基本内容,笔记是不完整的。
  • 说明信息不一致。
  • 笔记没有使用标准的描述。
  • 该说明包含特殊的EHR情况,如化疗,手术后,并拆除骨折设置。

评价指标

该数据集包含6352个药物品种。一份完整的中药处方包括药物成分、剂量和汤剂制备说明。对于一台机器来说,要生成如此完整的中药处方,即使不是不可能,也是非常具有挑战性的。在我们目前的研究阶段,我们只关注处方中的药物成分。

鉴于中医的独特性质,判断两种中药方剂是否相同往往并不简单。[35]。通常,两种不同的草药可能有相同的医疗效果。当中医医生开药方时,他或她手上通常有多种草药成分可供选择。因此,两名中医可能会为同一诊断病症的同一患者开不同的草药。因此,有必要有一个统一的方法来评价机器生成的处方。为此,我们需要更高层次的抽象。图9展示了中药组织的一个例子。在本例中,2种中药(消炎散和精方汤)的草药成分不同,但属于同一母药类别,具有相同的医疗效果。在我们的研究中,我们得出的结论是,只要推荐的药物与人类撰写的处方属于同一父类,推荐的药物就应该被认为是正确的推荐。

为了定量评估基于变压器的深度学习模型的性能,我们将机器生成的处方与人类医生开出的处方进行了比较。这里,我们使用的指标是精确率召回率,它基于3个变量。真阳性(TP)定义为医生处方中存在的药物数量,也存在于机器处方中。假阳性(FP)是指在医生处方中不存在但在机器处方中存在的药物数量。假阴性(FN)定义为医生处方中存在但机器处方中没有的药物数量。根据这些定义,我们定义了准确率和召回率如下:

精度率= TP / (TP + FP)(1)
召回率= TP / (TP + FN)(2)
图9。草药分类。
查看此图

使用GridSearchCV进行超参数调优

数据集分为训练集和测试集,其中训练集占数据集的90%,测试集占其余部分。采用10倍交叉验证法对模型进行训练;即将训练集随机分成10个折叠,对模型进行10次训练。在10次训练中的每一次,使用GridSearchCV方法对超参数进行调优。每次训练都会产生一组超参数,最终的超参数是这10组参数的平均值。

变压器网络模型超参数的取值对模型的精度有很大的影响。采用网格搜索法,通过迭代确定这些参数的最优值。将每种类型的稀疏特征嵌入到一个d维嵌入层中。然后,使用一种新的方法对所有向量进行组合:使用自学习权值对相同类型和时间的向量进行平均。

该模型使用最小的对数损失进行了优化。采用了多种正则化方法,如矢量损失率和嵌入层损失率。此外,还采用了小规模的L2权重惩罚,增加了对大权重的惩罚。选择训练批大小为128,将大小相近的句子放入同一批中。每批大约有12000个单词。最后,使用Adam函数处理多标签任务。对于多标签任务,将带有最后一个时间戳的输入与序列嵌入的特殊结束相乘。训练使用Kears框架,在一台带有8个NVIDIA P100图形处理单元的服务器上执行。微调后的超参数及其各自的范围如图所示表1

表1。模型的一些超参数。
Hyperparameters 参数范围
梯度 0.1245 (0.1, 0.5, 1.0, 1.1)
注意头 4 (4, 8)
矢量损失率 0.4410 (0.25, 0.35, 0.5)
隐层损失率 0.4740 (0.25, 0.35, 0.5)
学习速率 0.4375 (0,1)
L2惩罚率 0.000001566 (0, - 0.01)

实验结果

为了直观地解释我们的实验结果,我们从一个具体的例子开始,说明EHR记录如何导致处方订单。这方面的一个例子显示在图10.左边是病人电子病历的快照。右侧是一个表,显示了人工撰写的订单与我们的模型生成的处方之间的并排比较。医生的处方包含12种成分,而模特的处方有11种。前5种食材两面都是一样的。两边的第六种配料是一样的,尽管它们有不同的中文名字。这是因为医生给这种草药起了一个昵称。剩下的成分不仅在名称上不同,而且在实质上也不同。然而,就医疗效果而言,这两种命令仍然被认为是等效的。这是因为在中医术语中,诊断必须以疾病(病症)的名称和证候列表作为结论[17]。在这种特殊情况下,诊断出的疾病是emaciation-thirst,主要症状是肝肾虚次级综合症是湿瘀.前6种草药成分针对的是原发性综合征。每个处方中剩下的成分都是用来治疗次级综合症的湿瘀.由于这两个处方治疗继发性证的成分只是略有不同,因此在我们的研究中它们被视为同一处方。

为了进一步解释这种处方比较,我们给出另一幅图,如图所示图11.医生的医嘱来了芪菊地黄丸,则称为模型的阶数六味地黄丸.它们是属于同一父类中药方剂的第二类方剂滋补肝肾.他们的不同之处在于如何祛湿化痰,以解决继发性综合症。

为了评估基于变压器的预测模型的性能,我们首先只使用原始样本进行模型训练,有目的地排除了添加噪声的样本。结果将在以下段落中描述。

根据时间顺序,系统分别在入院时、入院后24小时、入院后48小时、入院后3天、入院后1周给出处方建议。测试结果见表2

表2,我们首先观察到从训练数据集获得的准确率和召回率高于从测试数据集获得的准确率和召回率。这是可以理解的,因为模型之前已经看到了训练数据集的样本,但没有看到测试数据集的样本。第二个观察结果是,随着时间的推移,准确率和召回率都在提高。入院后,在随后的每次服药时间,收集到的相关信息更多,预测更加准确。虽然98%的患者入院时特征令牌数量<260个,但24小时内增加到296个,48小时内增加到333个,72小时内增加到366个,7天内增加到759个。在实验中,我们设max_num_tokens= 759这意味着当特征令牌的数量<759时,使用零填充,当有>759个特征令牌时使用剪辑。选择适当的值max_num_tokens对于平衡整体系统性能和计算效率之间的权衡非常重要。如果这个值太大,训练和推理将消耗太多的计算能力。如果该值太小,则在入院时收集的一些关键信息将因裁剪而丢失,从而导致在远离入院时间(例如,入院后2周)的时间内处方预测的精度和召回率降低。

使用更多的训练样本对预测模型进行训练,得到第二组实验结果。训练数据集的大小增加了一倍,对于每个训练样本,GAN网络生成一个添加噪声的样本。查准率和查全率见表3

可以看出在表3在美国,准确率和召回率都有明显的提高。结果令人信服地证明,插入GAN模块生成的加噪训练样本可以有效地克服过拟合问题,从而获得更好的预测性能。

图10。医生医嘱和模特医嘱的对比。
查看此图
图11。处方比较:医生处方与模特处方。
查看此图
表2。仅变压器的精确率和召回率。
时间 训练集 测试集

精度(%) 召回率(%) 精度(%) 精度(%)
入学 81.58 69.49 73.82 61.25
24小时内 83.37 71.88 74.56 62.69
48小时内 83.92 71.26 74.81 63.04
3天内 85.16 73.89 76.24 65.38
一周后 87.02 75.17 77.94 67.15
表3。变压器+生成对抗网络的精确率和召回率。
时间 训练集 测试集

精度(%) 召回率(%) 精度(%) 召回率(%)
入学 82.22 70.65 80.58 68.49
24小时内 84.15 72.18 82.37 70.8
48小时内 84.32 72.56 82.92 70.26
3天内 87.04 75.10 85.04 74.38
一周后 88.91 76.79 86.82 76.23

比较研究

为了将我们提出的模型与现有处方生成模型的性能进行比较,我们实现了另外3个模型。基于cnn的模型[11]包括一个词嵌入层、一个包含3个不同大小过滤器的卷积层、一个池化层和一个全连接层。输出层包含819个神经元,相当于规定的草药品种的数量。seq2seq [36]模型包括一个CNN编码器和一个LSTM解码器。MedAR [37模型由词嵌入层、关注层、RethinkNet层组成,完成多标签分类。学习率为0.001,辍学率为0.8,优化函数为Adam。最后的输出层使用sigmoid函数,其中所有其他层使用非线性激活函数ReLU,如果x为负,则输出输入x为零,如果x大于等于零,则输出x本身。表4显示了所讨论的所有4种模型在入场时各自的精度和召回率。结果表明,该模型在准确率和查全率方面具有较好的性能。

表4。不同型号的性能比较。
模型 精度(%) 召回率(%)
卷积神经网络 47.54 31.00
Seq2seq一个 64.02 48.74
MedARb 71.46 53.08
变压器+生成对抗网络 80.58 68.49

一个Seq2seq:序列到序列模型。

bMedAR:医疗数据关注反思网。


主要研究结果

本研究主要完成了以下任务:

  1. 使用深度学习NLP技术将原始中文电子病历文本转换为特征表示。
  2. 本研究的主要贡献是提出了一种基于变压器的预测建模方案,用于从EHR数据的特征表示生成药物订单。
  3. 本研究的第二个贡献是使用GAN来增加训练数据集,导致预测模型的性能显著提高。使用GAN,生成添加噪声的样本,使原始训练样本的数量增加一倍。这有助于缓解过拟合问题,使模型在泛化方面更加健壮。

限制

尽管在诊断和治疗方案建议的许多方面做出了努力,但仍有很大的改进空间。训练数据集仍然比较小,可能会有一些常用的药物没有包括在训练数据集中。中药方剂知识库尚不完善。有些药品没有标准名称,数据库中也没有对应的父药品名称。因此,推荐的药品名称仍为原医院药品名称。对于多标签预测任务,标签数量的增加会增加模型预测的难度,降低预测精度。因此,随着知识库的完善,标签集将得到进一步的优化,从而提高模型的预测精度。

未来的工作

本文报道了基于电子病历文本自动生成中医住院病人用药单的初步研究结果。推荐的药物包括西药和中药。对于中药,只推荐药名。在未来,草药成分的剂量,以及药物制备说明,将包括在建议中。将模型预测精度提高到二类水平也是今后工作的一个方向。未来的工作可以扩展训练数据集来优化模型。

利益冲突

没有宣布。

多媒体附录1

用Keras框架训练生成对抗网络的Python伪代码。

DOCX文件,14kb

  1. Friedman C, Rindflesch TC, Corn M.自然语言处理:技术现状和重大进展的前景,由国家医学图书馆主办的研讨会。中华生物医学杂志,2013;46(5):765-773 [J]免费全文] [CrossRef] [Medline
  2. 王志强,王志强。基于深度学习的临床自然语言处理。见:Consoli S, reforato Recupero D, petkoviki M,编辑。医疗保健数据科学:方法和应用。瑞士Cham:施普林格;2019:147 - 171。
  3. 侯赛因EH,穆罕默德RE,阿里AA。生物医学自然语言处理的机器学习技术:综合综述。IEEE Access 2021 Oct 13;9:140628-140653。(CrossRef
  4. 墨菲KP。机器学习:一个概率的视角。美国麻萨诸塞州剑桥:麻省理工学院出版社;2012.
  5. Shickel B, Tighe PJ, Bihorac A, Rashidi P.深度电子病历(EHR)分析中深度学习技术的最新进展。IEEE生物医学学报,2018;22(5):1589-1604 [J]免费全文] [CrossRef] [Medline
  6. 刘建军,刘建军,刘建军,等。慢性疾病临床记录的自然语言处理研究进展。中华医学杂志2019年4月27日;7(2):e12239 [j]免费全文] [CrossRef] [Medline
  7. 米托荣,王峰,王生,姜鑫,杜德利季涛。医疗保健领域的深度学习:回顾、机遇和挑战。生物通报2018年11月27日;19(6):1236-1246 [j]免费全文] [CrossRef] [Medline
  8. 李立平,李立平,李立平,李立平。深度患者:从电子健康记录中预测患者未来的无监督表示。科学通报2016年5月17日;6:26094 [j]免费全文] [CrossRef] [Medline
  9. 张建军,张建军,张建军,等。神经网络计算1997;11月15日;9(8):1735-1780。(CrossRef] [Medline
  10. Rough K,戴安明,张凯,薛毅,Vardoulakis LM,崔超,等。根据电子健康记录数据预测住院病人的药物订单。中华临床医学杂志;2009;32 (1):449 - 457 [j]免费全文] [CrossRef] [Medline
  11. 杨勇,谢鹏,高翔,程超,李超,张宏,等。基于深度学习的入院时出院药物预测。arXiv(即将)2017 [免费全文
  12. Goldstein BA, Navar AM, Pencina MJ, Ioannidis JP。利用电子健康记录数据开发风险预测模型的机遇与挑战:系统回顾。中华医学杂志,2017,24(1):198-208 [J]免费全文] [CrossRef] [Medline
  13. Rajkomar A, Oren E, Chen K, Dai AM, Hajaj N, Hardt M,等。具有电子健康记录的可扩展和准确的深度学习。中华数字医学杂志2018;1:18 [j]免费全文] [CrossRef] [Medline
  14. 杨建军,于浩。基于双向RNN的电子病历医疗事件检测。Proc Conf 2016 Jun;2016:473-482 [j]免费全文] [CrossRef] [Medline
  15. 崔E, Bahadori MT, Schuetz A, Stewart W, Sun J. AI医生:基于递归神经网络的临床事件预测。JMLR车间会议2016年8月;56:31 -318 [j]免费全文] [Medline
  16. 李建军,李建军,李建军,等。基于神经网络模型的心衰早期诊断。医学信息学报,2017,01;24(2):361-370 [J]免费全文] [CrossRef] [Medline
  17. 张宏,倪伟,李军,张军。基于人工智能的中药辅助诊断系统:验证研究。中华医学杂志,2010;8(6):888 - 888 [j]免费全文] [CrossRef] [Medline
  18. 陈志奎,辛森,郭静,张佳宁,彭丽。基于数据挖掘的中医诊断研究进展。中国中医药杂志2020;38(12):1-9。
  19. 郭勇,马军。数据挖掘技术在糖尿病中医证方研究中的应用。中国人民解放军医学杂志,2015;27:34-38。
  20. 李建军,李建军,李建军,等。基于搜索引擎的网页引用排序研究。参见:第七届万维网国际会议论文集。1998提交于:WWW7 '98;1998;布里斯班,澳大利亚第161-172页。
  21. 张勇,胡华,杨涛,谢军,沈刚。基于复杂网络的肺癌中药处方推荐算法。中医杂志,2019;5:1257-1260 [j]免费全文
  22. 李伟,杨志,孙欣。端到端从症状生成中药方剂的探索。参见:第八届CCF自然语言处理与中文计算国际会议论文集。2019提交于:NLPCC '19;2019年10月9日至14日;敦煌,中国,第486-498页。(CrossRef
  23. 陈建军,陈建军。表征学习的研究进展与展望。通信学报,2013;35(8):1798-1828。(CrossRef] [Medline
  24. 黄忠,徐伟,于凯。双向LSTM-CRF序列标注模型。arXiv 2015 Aug 09 [免费全文] [CrossRef
  25. 张建军,张建军,张建军。基于神经网络的实体识别方法研究。参考文献:计算语言学协会北美分会2016年会议论文集:人类语言技术。2016年发表于:NAACL '16;2016年6月12日至17日;圣地亚哥,加州,美国第260-270页。(CrossRef
  26. Habibi M, Weber L, Neves M, Wiegandt DL, Leser U.基于深度学习的生物医学命名实体识别方法。生物信息学2017年7月15日;33(14):i37-i48 [j]免费全文] [CrossRef] [Medline
  27. 帮派L,熔清P,金米,洁具c实体识别中国的电子医疗记录基于BiLSTM-CRF网络和词典资源。现代医学学报,2020;40(4):3-12。
  28. 李斌,康旭,张宏,王勇,陈勇,白峰。基于变压器- crf的中文电子病历命名实体识别。计算机工程与应用2020;2020(56):153-159。
  29. 陈凯,陈建军,陈建军。基于向量空间的词表示的高效估计。参见:2013年国际学习表征会议论文集。2013年发表于:ICLR '13;2013年5月2日至4日;斯科茨代尔,亚利桑那州,美国
  30. 张建军,张建军,张建军,等。注意力就是你所需的一切arXiv 2017 6月12日[免费全文] [CrossRef
  31. Goodfellow I, Pouget-Abadie J, Mirza M, Xu B, ward - farley D, Ozair S,等。生成对抗网络。参见:第27届神经信息处理系统进展论文集。2014,发表于:NeurIPS '14;2014年12月8-13日;加拿大蒙特利尔。(CrossRef
  32. 李张H,倪W, J,江Y,刘K,马z标准化的中医电子病历的基本数据集。计算方法,程序,生物学报,2019(6):65-70。(CrossRef] [Medline
  33. 卫生信息基本数据集起草规范(WS 445-2014)中华人民共和国卫生部。2014。URL:https://wenku.baidu.com/view/4c17892d760bf78a6529647d27284b73f342365b.html[2022-05-04]访问
  34. 电子病历文件共享规范第1部分:病历摘要(WS/t 5001-2016)中华人民共和国卫生部。2016。URL:https://ishare.iask.sina.com.cn/f/rIcgxKYJb9.html[2022-04-21]访问
  35. 中医:中国制造。Nature 2011 Dec 21;480(7378):S82-S83。(CrossRef] [Medline
  36. 熊洪。基于真实临床数据的中医动态诊疗方案推荐方法研究。北京交通大学,2020。URL:https://www.docin.com/p-2607021734.html[2022-05-04]访问
  37. 肖璐。深度学习在电子病历数据中的应用。厦门大学,2019。URL:https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CMFD&dbname=CMFD202002&filename=1019064889.nh&uniplatform=NZKPT&v= JdsETSDw9TG7mLWRMKxEtYFZWzSE1ntYAQYDF6L2Z3Tl3ccV-citYLrD1g30mRob[2022-04-21]访问


BiLSTM:双向长短期记忆
有线电视新闻网:卷积神经网络
CRF:条件随机场
电子健康档案:电子健康记录
甘:生成对抗网络
LSTM:长短期记忆
尼珥:命名实体识别
NLP:自然语言处理
中医:中医


C·洛维斯编辑;提交27.11.21;由SD Boie同行评审;对作者08.01.22的评论;收到05.03.22修订版本;接受11.04.22;发表31.05.22

版权

©张宏,张家军,倪婉东,蒋友林,刘坤静,孙大英,李静。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 2022年5月31日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到https://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map