发表在gydF4y2Ba在gydF4y2Ba23卷gydF4y2Ba,第12号gydF4y2Ba(2021)gydF4y2Ba: 12月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/27008gydF4y2Ba,首次出版gydF4y2Ba.gydF4y2Ba
一种新的基于深度学习的急诊科电子病历分诊系统:回顾性队列研究gydF4y2Ba

一种新的基于深度学习的急诊科电子病历分诊系统:回顾性队列研究gydF4y2Ba

一种新的基于深度学习的急诊科电子病历分诊系统:回顾性队列研究gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba国立台湾大学计算机科学与信息工程系,台湾台北gydF4y2Ba

2gydF4y2Ba台北市国立台湾大学附属医院、国立台湾大学医学院急诊科gydF4y2Ba

*所有作者贡献均等gydF4y2Ba

通讯作者:gydF4y2Ba

傅立臣博士gydF4y2Ba

计算机科学与信息工程系gydF4y2Ba

国立台湾大学gydF4y2Ba

德天堂gydF4y2Ba

罗斯福道4段1号gydF4y2Ba

台北,10617年gydF4y2Ba

台湾gydF4y2Ba

电话:886 0935545846gydF4y2Ba

电子邮件:gydF4y2Balichen@ntu.edu.twgydF4y2Ba


背景:gydF4y2Ba急诊科(ED)拥挤导致患者治疗延误,已成为一个普遍的卫生保健问题。虽然5级急症严重程度指数等分诊系统在一定程度上提高了急症治疗的流程,但在目前的实践中,仍然严重依赖护士的主观判断,将过多的患者分诊到急症严重程度指数3级。因此,一个能够帮助临床医生准确分诊病人病情的系统势在必行。gydF4y2Ba

摘要目的:gydF4y2Ba本研究旨在开发一个基于深度学习的分诊系统,利用患者的ED电子医疗记录来预测ED治疗后的临床结果。gydF4y2Ba

方法:gydF4y2Ba本研究采用2012 - 2016年全国医院门诊医疗调查的开放数据集和2009 - 2015年台湾大学医院的本地数据集进行回顾性研究。在本研究中,我们将结构化数据转换为文本形式,并使用卷积神经网络结合循环神经网络和注意机制来完成分类任务。我们使用接受者工作特征曲线下面积(AUROC)来评估我们的性能。gydF4y2Ba

结果:gydF4y2Ba本研究共纳入全国医院门诊医疗调查的118602例患者进行住院预测,准确率和AUROC分别为0.83和0.87。另一方面,外部实验是使用我们自己的台大医院745,441例患者的数据集,准确度和AUROC相似,分别为0.83和0.88。此外,为了有效地评估我们提出的系统的预测质量,我们还将该模型应用于其他临床结果,包括死亡率和重症监护病房入院,结果表明,我们提出的方法比其他传统方法的准确率高出约3%至5%。gydF4y2Ba

结论:gydF4y2Ba我们提出的方法比传统方法取得了更好的性能,并且实现相对容易,它包含了常用的变量,更适合现实世界的临床环境。我们未来的工作是通过前瞻性临床试验验证我们新颖的基于深度学习的分诊算法,一旦验证成功,我们希望用它来指导繁忙的急诊科的资源分配。gydF4y2Ba

[J] .中国医学信息学报,2013;23(12):888 - 888gydF4y2Ba

doi: 10.2196/27008gydF4y2Ba

关键字gydF4y2Ba



背景gydF4y2Ba

急诊科(ED)人满为患已经是一个全球性的公共卫生问题,显然也是一个重要的患者安全问题[gydF4y2Ba1gydF4y2Ba]。许多国家,如爱尔兰、美国、加拿大、德国和澳大利亚,急诊科就诊人数持续显著增加[gydF4y2Ba2gydF4y2Ba-gydF4y2Ba7gydF4y2Ba]。在美国,ED访问量估计从2015年的1.369亿增加到2016年的1.456亿,增长了6.4%。10年的人次变化为24.7%,在过去20年共增加61.2%(1996年的急诊科人次估计为9030万人次)[gydF4y2Ba8gydF4y2Ba,gydF4y2Ba9gydF4y2Ba]。在台湾,ED访问量估计从2017年的718万增加到2019年的764万,增长6.4%。回顾过去19年,急诊科的探访人次共增加23.6% [gydF4y2Ba10gydF4y2Ba]。gydF4y2Ba

急诊科就诊人数的增加也造成急诊科和医院资源的周期性供需失衡,从而导致等待时间延长和紧急医疗延误。急诊科拥挤与几种不良临床结果有关,包括更高的死亡率和发病率[gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba]。因此,设计一种方法来正确识别急症患者在急诊科的优先次序是最重要的[gydF4y2Ba13gydF4y2Ba]。gydF4y2Ba

相关工作gydF4y2Ba

一些研究集中于开发一种基于患者ED电子病历(EMR)预测住院情况的系统[gydF4y2Ba14gydF4y2Ba]。在这些研究中,国家医院门诊医疗调查(NHAMCS)数据集[gydF4y2Ba9gydF4y2Ba是要分析的最常见的数据集。尽管使用了NHAMCS的数据集,但这些研究最终可能会取得不同的结果。在这里,我们简要介绍了一些现有的方法和实现结果,然后描述了我们系统使用的概念和方法。gydF4y2Ba

Gligorijevic等[gydF4y2Ba15gydF4y2Ba]开发了一个系统来预测病人需要的资源数量。他们建立了双向长短期记忆(biLSTM)模型,提取连续数据特征和医学文本数据特征,得到了预测精度为0.792、接收者工作特征曲线下面积为0.879的二元模型。此外,他们表明,与仅使用标准的连续和分类数据相比,使用护士笔记可以显著提高预测准确性。gydF4y2Ba

Zhang等[gydF4y2Ba16gydF4y2Ba]构建了一种利用主成分分析和传统自然语言处理(NLP)结合多层神经网络模型和逻辑回归(LR)模型分析患者就诊原因预测住院率的方法。在他们的研究中,他们使用10倍交叉验证方法对模型进行测试,AUROC为0.84。Sun等[gydF4y2Ba17gydF4y2Ba]采用卡方检验选择住院与各种可能的危险因素之间的关联,并将提取的关联特征输入到LR模型中进行训练,建立预测模型,用于预测急诊科患者是否存在住院的需要。涉及的变量包括人口统计学(年龄、性别和种族)、前3个月的急诊科就诊或住院情况、到达方式、急诊科就诊的患者视力类别以及共存的慢性疾病(糖尿病、高血压和血脂异常)。他们研究的AUROC是0.85。gydF4y2Ba

Graham等[gydF4y2Ba18gydF4y2Ba]使用3种机器学习算法创建以下模型:LR、梯度增强机器和决策树;这些模型使用重复5次的10倍交叉验证方法进行验证,其中梯度增强机器模型的最佳结果精度为0.8。事实证明,他们的研究可以帮助临床医生提前规划资源分配,避免患者拥挤的瓶颈。gydF4y2Ba

Wang等[gydF4y2Ba19gydF4y2Ba]开发了一种数据驱动和基于证据的分诊方法,以快速识别急性和重症患者,防止因过度诊断而浪费有限的资源。他们提出了一种基于注意力的biLSTMgydF4y2BaDeepTriagergydF4y2Ba该系统处理来自临床记录的结构化数据和文本数据,以预测急诊科患者的视力水平。该方法不仅可以预测门诊患者的急性程度和严重程度,还可以为临床情况提供可视化和可解释的证据,以支持决策。二元分类(敏锐度1和敏锐度2)的AUROC可以达到0.93,比传统机器学习方法提高0.03。gydF4y2Ba

研究的目标gydF4y2Ba

本研究的目的是建立一个有效且高效的预测患者最终是否需要住院的系统,为医生提前对患者进行治疗优先级排序提供参考。在这个系统中,我们的目标是使用传统的结构化数据和非结构化数据来设计一个二元分类模型,以帮助识别急诊科患者就诊的住院需求。gydF4y2Ba


系统概述gydF4y2Ba

本研究的重点是建立一个有效、快速的预测患者最终是否需要住院的系统,为医生提前确定患者的优先治疗提供参考。此外,为了评估我们的模型在其他临床预测中的有效性,我们还将该模型应用于其他临床结果,并将获得的结果与其他算法的结果进行比较。gydF4y2Ba

中的系统概述gydF4y2Ba图1gydF4y2Ba系统分为两部分:训练部分和预测部分。每个急诊科就诊患者的EMR值被用作输入,患者的住院决定被用作医生的基础真理。模型训练分为三个步骤。第一步是对输入数据进行预处理,如对不可用或缺失的数据进行特征选择和过滤,具体方法将在gydF4y2Ba数据准备gydF4y2Ba部分。接下来,将处理后的数据转换为相应的文本类型。最后,利用转换后的文本和基础真值训练二元分类模型。一旦模型的训练完成,它就会针对未见过的数据进行测试。看不见的数据被转换为文本类型,然后输入到模型中,模型的输出是急诊科患者就诊的住院概率。gydF4y2Ba

‎gydF4y2Ba
图1所示。系统概述。EMR:电子病历;急诊科。gydF4y2Ba
查看此图gydF4y2Ba

数据转换gydF4y2Ba

为了使我们的工作中提出的方法能够更有效地处理上述数据集,我们首先将数据转换为另一种文本类型。将原始数据转换为文本类型的方法见gydF4y2Ba图2gydF4y2Ba.gydF4y2Ba

桌子在gydF4y2Ba图2gydF4y2Ba显示从原始数据集中采样的特征,包括生命体征和其他信息,如年龄、性别、血压、氧气和疼痛指数。的下部gydF4y2Ba图2gydF4y2Ba以英文或中文说明数据转换后的格式。请注意,数据样本的原始格式显示在gydF4y2Ba图2gydF4y2Ba揭示特征及其对应的值。但是,在转换成文本后,所有的特征名仍然是单词,但是它们对应的值也以单词的形式出现,这样数据样本的新格式就变成了一个完整的句子。然后,我们将完整的句子输入到模型中进行训练,并分析特征之间的相关性。gydF4y2Ba

‎gydF4y2Ba
图2。数据变换的方法。gydF4y2Ba
查看此图gydF4y2Ba

分类引擎gydF4y2Ba

概述gydF4y2Ba

在这项工作中,我们的分类引擎由两个不同的部分组成,其中第一部分用于分析短句子(仅卷积神经网络[CNN]类型),第二部分用于分析长句子(仅循环神经网络[RNN]类型)。在测试了分类引擎的两个部分的性能之后,我们进行了实验来验证分类引擎的有效性。我们的分类引擎由2个不同的文本处理模块(即2部分)组成。在下一节中,我们将逐步介绍这两个模块的特点,并详细阐述其设计背后的逻辑。我们提出的分类引擎的网络架构,包括rnn型模块和cnn型模块,如图所示gydF4y2Ba图3gydF4y2Ba.gydF4y2Ba

‎gydF4y2Ba
图3。分类引擎的网络架构。BiGRU:双向门控循环单元;CNN:卷积神经网络;GRU:门控循环单元;RNN:循环神经网络。gydF4y2Ba
查看此图gydF4y2Ba

在我们的系统中,我们使用已转换为文本格式的数据作为输入。由于文本数据包含很多特征,不同特征之间存在一定的关系,如收缩压与舒张压的关系,疼痛指数与疼痛部位的关系,分诊等级与疼痛指数的关系。然而,当特征被转换为高维空间中的静态词嵌入后,这种关系可能已经丢失。因此,为了能够分析整个句子的文本信息,我们采用了RNN结构,这已经被证明是一个非常有用的算法。事实上,RNN架构关注的是一个句子中所有单词之间的关系,它更适合于分析长句子的意义。gydF4y2Ba

此外,由于特征及其对应的值按句子顺序转换为文本,因此特征的名称与值处于相邻关系。为了能够准确有效地分析各个特征之间的关系以及对应的值,短句(3个词之间、4个词之间、5个词之间)的语义非常重要,例如:gydF4y2Ba体温:36.5度gydF4y2Ba,gydF4y2Ba疼痛指数:5gydF4y2Ba,gydF4y2Ba呼吸频率:15次gydF4y2Ba.在这个简短的句子分析中,CNN是一个非常有用的算法。这种架构关注的是每个单词与其相邻主题之间的关系。我们将在后面详细介绍它。gydF4y2Ba

为了有效地利用分诊引擎两部分的两种学习算法的特点,我们关注了如何有效地融合两种神经网络模型的输出,这也是本系统的重点。换句话说,我们将这两部分合并成一个整体模型来完成单一的任务,即住院需求的预测。我们的策略是:首先,基于不同的数据集对2个模型进行单独训练,然后根据各自的损失和相应的参数设置对其参数进行优化。在训练完2个模型后,我们删除了两个模型的输出层,并将最后2个完全连接的层连接起来,它们位于两个模型的输出层和新的输出层之前。然后,我们对2个数据集上的整体分类模型进行微调,并在输出层之前执行dropout。最后,分诊模型的输出预测了每次急诊科就诊的住院概率。gydF4y2Ba

长句子模块(RNN类型)gydF4y2Ba

这部分研究的重点是如何分析文本数据的完整性,其中特征提取的强度是广泛的,因为搜索了不同样本的模式之间的相关性。这种关联不仅涉及时间,也涉及空间。通过从句子序列中学习,生成的模型能够有效地处理每个完整的文本数据,从而具有记忆属性。gydF4y2Ba

该模型的输入是由急诊科就诊的结构化和非结构化数据(EMR)转换而成的文本数据,输出是包含急诊科就诊的住院概率的向量。gydF4y2Ba图4gydF4y2Ba显示了分类引擎的RNN部分的网络架构。gydF4y2Ba

‎gydF4y2Ba
图4。递归神经网络分类引擎的一部分。BiGRU:双向门控循环单元。gydF4y2Ba
查看此图gydF4y2Ba

如gydF4y2Ba图4gydF4y2Ba首先,将EMR变换后的所有单词输入到单词向量层,该层用于将每个单词转换为对应的单词向量。在我们的工作中,预训练的词向量库是FastText [gydF4y2Ba20.gydF4y2Ba,gydF4y2Ba21gydF4y2Ba],这是学习词嵌入和文本分类最流行和有用的库。首先,由于我们的工作处理了两个数据集,一个是来自NHAMCS的英文数据集,另一个是来自国立台湾大学医院(NTUH)的中文数据集,我们决定开发中英文版本的预测模型。其次,将单词向量依次传递给双向门控循环单元(biGRU),在每个时间戳将两个方向的隐藏序列串联起来,形成一个新的隐藏序列。一般来说,biGRU可以更有效地获取文本的特征。因此,将biGRU中的隐藏状态输入到注意层,评估每个隐藏状态的权重,并计算评估的权重值与每个隐藏状态的点积。注意层由2个全连接前馈神经网络组成,采用指数线性单元[gydF4y2Ba22gydF4y2Ba]作为激活函数。对于注意力层的输出,使用Goodfellow等人开发的Softmax [gydF4y2Ba23gydF4y2Ba],作为激活函数。gydF4y2Ba

本工作的注意层用于从每次急诊科就诊记录中找到不同句子中的关键信息内容单元,并评估患者最终是否需要住院治疗。此外,在本研究中使用了两层注意网络,因为它比所有句子中只有一层的注意网络更有效。因此,在整个实验过程中,具有多个关注层的系统对于后续的预测性能评估更为有效。最后,将注意层的输出输入到64个神经元的全连接层中。gydF4y2Ba

短文模块(CNN类型)gydF4y2Ba

这一部分的研究重点是提取文本的局部特征。通过提取文档或句子的关键词作为特征,并基于这些特征训练分类器,可以有效地分析句子中更重要和关键的上下文。gydF4y2Ba

同样的,gydF4y2Ba图5gydF4y2Ba给出了分类引擎CNN部分模块的网络架构。类图像向量,其格式为gydF4y2Ba我gydF4y2Ba∈ℝgydF4y2Baℎ×gydF4y2Ba由原始文本转换后的词向量叠加而成。更具体地说,gydF4y2BahgydF4y2Ba和gydF4y2BawgydF4y2Ba分别表示图像的高度(单词数)和宽度(单词向量的维度)。该方法首先对中文单词进行文本分割处理,然后再传递到嵌入层。然后,使用单词向量对3个不同大小的核进行卷积运算,分别是3、4、5。使用不同的核函数来寻找短词之间的关系,即词之间的各种相关性。gydF4y2Ba

对于卷积运算,我们采用了深度金字塔cnn的概念[gydF4y2Ba24gydF4y2Ba],这是一种用于文本分类的低复杂度CNN架构,可以有效地表示文本中的远程关联。而不是使用原始的CNN进行文本处理[gydF4y2Ba25gydF4y2Ba],我们采用了一种简单的网络架构,在不显著增加计算成本的情况下,通过增加网络深度来获得更好的精度。gydF4y2Ba图6gydF4y2Ba显示了前面提到的金字塔CNN的网络架构。由于退化的问题,我们期望快捷连接能够促进每几个堆叠层更容易地拟合所需的底层映射,这种快捷连接的思想是金字塔CNN架构的关键概念。因此,根据这一思路,我们在工作中使用了不同核尺寸下的深度金字塔CNN。gydF4y2Ba

‎gydF4y2Ba
图5。卷积神经网络分类引擎的一部分。CNN:卷积神经网络。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图6。文本金字塔卷积神经网络结构。gydF4y2Ba
查看此图gydF4y2Ba
2模块集成的模型综合gydF4y2Ba

如图所示gydF4y2Ba图3gydF4y2Ba,我们最终的分类引擎模型是整合2gydF4y2BapseudoenginesgydF4y2Ba所示gydF4y2Ba图4gydF4y2Ba和gydF4y2Ba5gydF4y2Ba.从技术上讲,经过卷积运算后,得到一个相应大小的feature map,每个卷积层后面都有一个相应大小的max pooling层。实现了集成引擎的cnn型部分,进一步将关键词与转换后的句子区分开来。然后,将最大池化层的输出输入到自关注层,该自关注层用于评估关键字向量的权重,并计算评估的权重值与每个关键字向量之间的点积。最后,将3个注意层的输出连接并馈送到具有64个神经元的全连接层。在全连接层应用Softmax激活函数计算住院概率向量,我们将概率表示为:gydF4y2Ba

概率= CNN (kgydF4y2Ba3.gydF4y2Ba(X') + kgydF4y2Ba4gydF4y2Ba(X') + kgydF4y2Ba5gydF4y2Ba(X '))gydF4y2Ba (1)gydF4y2Ba

模型训练gydF4y2Ba

rnn型模块使用Kingma等人开发的优化器Adam以0.00001的学习率进行训练[gydF4y2Ba26gydF4y2Ba],这是一种梯度下降法,广泛应用于计算机视觉和自然语言处理的深度学习应用。将批大小设置为64,迭代次数设置为60,将biGRU的隐藏状态设置为128。对于cnn型模块,学习超参数与RNN型相同。内核的大小设置为3、4和5,步幅设置为1。集成模型的损失函数为预测输出与真实值的交叉熵和,如下所示:gydF4y2Ba

lgydF4y2Ba总计gydF4y2Ba=gydF4y2BalgydF4y2Ba美国有线电视新闻网gydF4y2Ba+gydF4y2BalgydF4y2BarnngydF4y2Ba(gydF4y2Ba2gydF4y2Ba)gydF4y2Ba

在哪里gydF4y2BaygydF4y2Ba我gydF4y2Ba阶级的基本真理是什么gydF4y2Ba我gydF4y2Ba,gydF4y2BaŷgydF4y2Ba我gydF4y2Ba是模型的预测。gydF4y2Ba


概述gydF4y2Ba

为了验证我们的设计,进行了一系列的实验。为了评估模型的有效性,所有实验都采用分层随机抽样的方式进行。以下程序分别对NHAMCS和NTUH数据集进行。为了进行内部比较,将72%的数据用作训练集,8%的数据用作验证集,20%的数据用作hold-out测试集。训练和验证过程重复20次,生成20个模型,在hold-out测试集中选择表现最好的模型作为最终模型。对于外部比较,执行相同的训练和验证程序;然而,只有在训练和验证过程中表现最好的模型在保留测试集上进行测试,以确保公平比较。gydF4y2Ba

实验平台gydF4y2Ba

我们采用Keras (Tensorflow-Graphics Processing Unit)在Nvidia GeForce GTX 1080Ti图形处理单元(11gb RAM)和Intel Core i5中央处理单元(64gb RAM)的计算机上执行所有算法。在损失函数的处理中,我们使用Adam优化器,学习率为0.00001,批大小为64,epoch为60。gydF4y2Ba

数据准备gydF4y2Ba

在本研究中,使用了2个不同的数据集来评估所提出的系统的性能:NHAMCS数据集和NTUH数据集。gydF4y2Ba

NHAMCS数据集gydF4y2Ba

在我们的研究中,使用了2012年至2016年期间收集的118,602例急诊科患者就诊数据。我们选择了37个特性,包括gydF4y2Ba月gydF4y2Ba,gydF4y2Ba周gydF4y2Ba,gydF4y2Ba到达时间gydF4y2Ba,gydF4y2Ba年龄gydF4y2Ba,gydF4y2Ba住宅gydF4y2Ba,gydF4y2Ba性gydF4y2Ba,gydF4y2Ba比赛gydF4y2Ba,gydF4y2Ba他或她是坐救护车来的吗gydF4y2Ba,gydF4y2Ba保险支付gydF4y2Ba,gydF4y2Ba由医疗保险支付gydF4y2Ba,gydF4y2Ba由医疗补助支付gydF4y2Ba,gydF4y2Ba按工作补偿支付gydF4y2Ba,gydF4y2Ba自付gydF4y2Ba,gydF4y2Ba无需支付任何费用gydF4y2Ba,gydF4y2Ba温度gydF4y2Ba,gydF4y2Ba心率gydF4y2Ba,gydF4y2Ba呼吸速率gydF4y2Ba,gydF4y2Ba收缩压gydF4y2Ba,gydF4y2Ba舒张压gydF4y2Ba,gydF4y2Ba脉搏血氧测量gydF4y2Ba,gydF4y2Ba疼痛量表gydF4y2Ba,gydF4y2Ba诊断水平gydF4y2Ba,gydF4y2Ba在过去的72小时内有过急诊gydF4y2Ba,gydF4y2Ba痴呆gydF4y2Ba,gydF4y2Ba癌症gydF4y2Ba,gydF4y2Ba脑血管gydF4y2Ba,gydF4y2Ba慢性阻塞性肺病gydF4y2Ba,gydF4y2Ba心脏衰竭gydF4y2Ba,gydF4y2Ba艾滋病毒gydF4y2Ba,gydF4y2Ba心电图gydF4y2Ba,gydF4y2Bax射线gydF4y2Ba,gydF4y2Ba图中显示gydF4y2Ba,gydF4y2Ba核磁共振成像gydF4y2Ba,gydF4y2Ba超声波gydF4y2Ba,gydF4y2Ba心肺复苏gydF4y2Ba,gydF4y2Ba入住重症监护室gydF4y2Ba,gydF4y2Ba住院gydF4y2Ba.gydF4y2Ba

NTUH数据集gydF4y2Ba

在我们的研究中,使用了2013年至2017年期间收集的745,441例急诊科患者就诊数据。我们选择了31个特性,包括gydF4y2Ba年龄gydF4y2Ba,gydF4y2Ba性gydF4y2Ba,gydF4y2Ba天带gydF4y2Ba,gydF4y2Ba周末gydF4y2Ba,gydF4y2Ba月gydF4y2Ba,gydF4y2Ba他或她发烧了吗?gydF4y2Ba,gydF4y2Ba诊所的gydF4y2Ba,gydF4y2Ba诊所的gydF4y2Ba,gydF4y2Ba是工作?gydF4y2Ba,gydF4y2Ba在工作路上gydF4y2Ba,gydF4y2Ba疼痛的特点gydF4y2Ba,gydF4y2Ba痛苦时期gydF4y2Ba,gydF4y2Ba心肺复苏gydF4y2Ba,gydF4y2Ba加护病房gydF4y2Ba,gydF4y2Ba急性变化gydF4y2Ba,gydF4y2Ba帐号序列号gydF4y2Ba,gydF4y2Ba收缩压gydF4y2Ba,gydF4y2Ba舒张压gydF4y2Ba,gydF4y2Ba脉冲gydF4y2Ba,gydF4y2Ba氧气gydF4y2Ba,gydF4y2Ba呼吸率gydF4y2Ba,gydF4y2Ba体温gydF4y2Ba,gydF4y2Ba痛苦指数gydF4y2Ba,gydF4y2Ba普通中等教育证书考试gydF4y2Ba,gydF4y2BagcsvgydF4y2Ba,gydF4y2BagcsmgydF4y2Ba,gydF4y2Ba诊断水平gydF4y2Ba,gydF4y2Ba疼痛部位gydF4y2Ba,gydF4y2Ba疼痛期描述gydF4y2Ba,gydF4y2Ba判断描述gydF4y2Ba,gydF4y2Ba住院gydF4y2Ba.所有这些特征都是由诺丁汉特伦特大学的医生推荐的。gydF4y2Ba

基于NHAMCS数据集和基线的性能gydF4y2Ba

我们使用NHAMCS数据集验证了我们提出的融合模型,并将结果与模型的两个部分(rnn和cnn)进行了比较。因此,使用所提出的模型,AUROC可以达到0.872。所提出的网络性能的其他指标显示在gydF4y2Ba表1gydF4y2Ba.对于我们的融合模型,最高的准确率和特异性分别可以达到0.828和0.843。gydF4y2Ba

到目前为止,大多数现有的研究都使用了不同的数据集。在这里,为了有效地评估我们模型的预测质量,我们选择了其他研究中常用的传统机器学习算法作为我们的基线进行比较,包括LR、极端梯度增强(XGBoost)和随机森林。此外,我们将我们的模型与来自变压器的双向编码器表示(BERT) [gydF4y2Ba27gydF4y2Ba]模型,被认为是NLP的一个里程碑。然后,我们比较了不同方法在不同指标下得到的不同结果。gydF4y2Ba

表2gydF4y2Ba显示了每种算法的6个指标。可以看出,与其他模型相比,我们提出的模型在特异性、精度、准确度和AUROC等6个指标中,有4个指标得分最高。这些结果表明,我们提出的深度学习算法似乎比传统的机器学习算法更有前途。gydF4y2Ba

表1。不同方法在全国医院门诊医疗调查数据集上的表现。gydF4y2Ba
模型gydF4y2Ba 灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
BiLSTMgydF4y2BabgydF4y2Ba只有gydF4y2Ba 0.756gydF4y2Ba 0.768gydF4y2Ba 0.767gydF4y2Ba 0.850gydF4y2Ba
BiLSTM +丙氨酸gydF4y2BacgydF4y2Ba 0.711gydF4y2Ba 0.822gydF4y2Ba 0.809gydF4y2Ba 0.854gydF4y2Ba
BiLSTM + 2×攻击力gydF4y2Ba 0.745gydF4y2Ba 0.802gydF4y2Ba 0.796gydF4y2Ba 0.856gydF4y2Ba
BiGRUgydF4y2BadgydF4y2Ba只有gydF4y2Ba 0.744gydF4y2Ba 0.78gydF4y2Ba 0.776gydF4y2Ba 0.854gydF4y2Ba
BiGRU +丙氨酸gydF4y2Ba 0.757gydF4y2Ba 0.804gydF4y2Ba 0.798gydF4y2Ba 0.863gydF4y2Ba
BiGRU + 2×攻击力gydF4y2Ba 0.764gydF4y2Ba 0.809gydF4y2Ba 0.801gydF4y2Ba 0.866gydF4y2Ba
美国有线电视新闻网gydF4y2BaegydF4y2Ba(3粒)gydF4y2Ba 0.756gydF4y2Ba 0.768gydF4y2Ba 0.767gydF4y2Ba 0.85gydF4y2Ba
金字塔CNN(3核)gydF4y2Ba 0.727gydF4y2Ba 0.813gydF4y2Ba 0.804gydF4y2Ba 0.855gydF4y2Ba
金字塔CNN(3个核)与注意层gydF4y2Ba 0.731gydF4y2Ba 0.825gydF4y2Ba 0.819gydF4y2Ba 0.862gydF4y2Ba
我们的模型gydF4y2Ba 0.755gydF4y2Ba 0.843gydF4y2BafgydF4y2Ba 0.828gydF4y2Ba 0.872gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaBiLSTM:双向长短期记忆。gydF4y2Ba

cgydF4y2Ba注意层。gydF4y2Ba

dgydF4y2BaBiGRU:双向门控循环单元。gydF4y2Ba

egydF4y2BaCNN:卷积神经网络。gydF4y2Ba

fgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能。gydF4y2Ba

表2。与基线算法在全国医院门诊医疗调查数据集的比较。gydF4y2Ba
模型gydF4y2Ba 灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba F1的分数gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
逻辑回归gydF4y2Ba 0.747gydF4y2Ba 0.741gydF4y2Ba 0.745gydF4y2Ba 0.745gydF4y2Ba 0.744gydF4y2Ba 0.825gydF4y2Ba
XGBoostgydF4y2BabgydF4y2Ba 0.761gydF4y2Ba 0.736gydF4y2Ba 0.749gydF4y2Ba 0.748gydF4y2Ba 0.748gydF4y2Ba 0.834gydF4y2Ba
随机森林gydF4y2Ba 0.781gydF4y2Ba 0.715gydF4y2Ba 0.748gydF4y2Ba 0.747gydF4y2Ba 0.747gydF4y2Ba 0.828gydF4y2Ba
伯特gydF4y2BacgydF4y2Ba 0.789gydF4y2Ba 0.768gydF4y2Ba 0.773gydF4y2Ba 0.781gydF4y2Ba 0.779gydF4y2Ba 0.852gydF4y2Ba
我们的模型gydF4y2Ba 0.755gydF4y2Ba 0.843gydF4y2BadgydF4y2Ba 0.818gydF4y2BadgydF4y2Ba 0.759gydF4y2Ba 0.828gydF4y2Ba 0.872gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaXGBoost:极端梯度增强。gydF4y2Ba

cgydF4y2BaBERT:来自变形金刚的双向编码器表示。gydF4y2Ba

dgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能gydF4y2Ba.gydF4y2Ba

NTUH数据集和基线上的性能gydF4y2Ba

我们还使用NTUH数据集验证了我们提出的融合模型,并将结果与模型的两个部分(rnn和cnn)进行了比较,其中包括10个实验。在RNNs部分,我们使用具有不同注意机制层的biLSTM和biGRU进行了6种不同组合的实验,观察不同组合下4个指标(灵敏度、特异性、准确性和AUROC)的变化。在CNN部分,我们使用传统CNN和金字塔CNN进行了3种不同组合的实验,并添加了注意机制,观察不同组合下4个指标的变化。结果表明,采用本文提出的融合模型,AUROC可以达到0.876 (gydF4y2Ba表3gydF4y2Ba).gydF4y2Ba

同样,为了有效地评估我们模型的预测质量,我们选择了3种常用的传统机器学习算法作为我们的基线——lr、XGBoost和随机森林。此外,我们还将我们的模型与两种常用方法进行了比较,即结构数据的深度神经网络与文本数据的biGRU和BERT [gydF4y2Ba27gydF4y2Ba)模型。然后,我们比较了不同方法之间结果的差异。gydF4y2Ba

表4gydF4y2Ba显示了每种算法的6个指标。可以看出,我们提出的模型优于所有其他算法。与其他传统方法相比,我们提出的模型在预测住院率方面有很大的提高。gydF4y2Ba

表3。不同方法在台大医院数据集上的表现。gydF4y2Ba
方法gydF4y2Ba 灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
BiLSTMgydF4y2BabgydF4y2Ba只有gydF4y2Ba 0.748gydF4y2Ba 0.792gydF4y2Ba 0.77gydF4y2Ba 0.848gydF4y2Ba
BiLSTM +丙氨酸gydF4y2BacgydF4y2Ba 0.74gydF4y2Ba 0.822gydF4y2Ba 0.781gydF4y2Ba 0.862gydF4y2Ba
BiLSTM + 2×攻击力gydF4y2Ba 0.774gydF4y2Ba 0.8gydF4y2Ba 0.785gydF4y2Ba 0.867gydF4y2Ba
BiGRUgydF4y2BadgydF4y2Ba只有gydF4y2Ba 0.768gydF4y2Ba 0.78gydF4y2Ba 0.774gydF4y2Ba 0.855gydF4y2Ba
BiGRU +丙氨酸gydF4y2Ba 0.805gydF4y2Ba 0.767gydF4y2Ba 0.786gydF4y2Ba 0.866gydF4y2Ba
BiGRU + 2×攻击力gydF4y2Ba 0.8gydF4y2Ba 0.785gydF4y2Ba 0.808gydF4y2Ba 0.872gydF4y2Ba
美国有线电视新闻网gydF4y2BaegydF4y2Ba(3粒)gydF4y2Ba 0.78gydF4y2Ba 0.803gydF4y2Ba 0.791gydF4y2Ba 0.868gydF4y2Ba
金字塔CNN(3核)gydF4y2Ba 0.784gydF4y2Ba 0.793gydF4y2Ba 0.798gydF4y2Ba 0.868gydF4y2Ba
金字塔CNN(3个核)与注意层gydF4y2Ba 0.754gydF4y2Ba 0.823gydF4y2Ba 0.788gydF4y2Ba 0.871gydF4y2Ba
我们的模型gydF4y2Ba 0.768gydF4y2Ba 0.819gydF4y2Ba 0.825gydF4y2BafgydF4y2Ba 0.876gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaBiLSTM:双向长短期记忆。gydF4y2Ba

cgydF4y2Ba注意层。gydF4y2Ba

dgydF4y2BaBiGRU:双向门控循环单元。gydF4y2Ba

egydF4y2BaCNN:卷积神经网络。gydF4y2Ba

fgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能。gydF4y2Ba

表4。与台大医院数据集基线算法之比较。gydF4y2Ba
模型gydF4y2Ba 灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba F1的分数gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
逻辑回归gydF4y2Ba 0.705gydF4y2Ba 0.805gydF4y2Ba 0.758gydF4y2Ba 0.755gydF4y2Ba 0.756gydF4y2Ba 0.83gydF4y2Ba
XGBoostgydF4y2BabgydF4y2Ba 0.745gydF4y2Ba 0.785gydF4y2Ba 0.766gydF4y2Ba 0.765gydF4y2Ba 0.765gydF4y2Ba 0.84gydF4y2Ba
随机森林gydF4y2Ba 0.739gydF4y2Ba 0.784gydF4y2Ba 0.762gydF4y2Ba 0.761gydF4y2Ba 0.762gydF4y2Ba 0.84gydF4y2Ba
款gydF4y2BacgydF4y2Ba+ BiGRUgydF4y2BadgydF4y2Ba 0.744gydF4y2Ba 0.775gydF4y2Ba 0.771gydF4y2Ba 0.766gydF4y2Ba 0.771gydF4y2Ba 0.858gydF4y2Ba
伯特gydF4y2BaegydF4y2Ba 0.736gydF4y2Ba 0.789gydF4y2Ba 0.777gydF4y2Ba 0.756gydF4y2Ba 0.763gydF4y2Ba 0.844gydF4y2Ba
我们的模型gydF4y2Ba 0.768gydF4y2BafgydF4y2Ba 0.819gydF4y2Ba 0.81gydF4y2Ba 0.788gydF4y2Ba 0.825gydF4y2Ba 0.876gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaXGBoost:极端梯度增强。gydF4y2Ba

cgydF4y2BaDNN:深度神经网络。gydF4y2Ba

dgydF4y2BaBiGRU:双向门控循环单元。gydF4y2Ba

egydF4y2BaBERT:来自变形金刚的双向编码器表示。gydF4y2Ba

fgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能。gydF4y2Ba


与其他相关研究比较gydF4y2Ba

根据现有的住院预测研究,大多数研究采用特定的特征选择方法结合传统的机器学习算法。如图所示gydF4y2Ba表5gydF4y2Ba,他们的结果在不同的指标上显示出不同的表现。在本节中,为了公平地与其他研究进行比较,只在hold-out测试集中对训练和验证过程中表现最好的模型进行测试。gydF4y2Ba

根据gydF4y2Ba表5gydF4y2Ba在同一开放数据集(即NHAMCS数据集)中进行比较时,我们的模型在AUROC中取得了最高的性能。此外,与私人数据集相比,我们的工作在准确性方面也取得了优异的成绩。gydF4y2Ba

表5所示。不同研究的表现。gydF4y2Ba
研究gydF4y2Ba 方法gydF4y2Ba 数据集gydF4y2Ba 性能gydF4y2Ba



灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
Raita等[gydF4y2Ba28gydF4y2Ba]gydF4y2Ba 款gydF4y2BabgydF4y2Ba NHAMCSgydF4y2BacgydF4y2Ba 0.79gydF4y2Ba 0.71gydF4y2Ba - - - - - -gydF4y2BadgydF4y2Ba 0.82gydF4y2Ba
Zhang等[gydF4y2Ba16gydF4y2Ba]gydF4y2Ba NLPgydF4y2BaegydF4y2Ba+主成分分析gydF4y2BafgydF4y2Ba+ LRgydF4y2BaggydF4y2Ba NHAMCSgydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba 0.846gydF4y2Ba
孙彦等[gydF4y2Ba17gydF4y2Ba]gydF4y2Ba LRgydF4y2Ba 私人gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba 0.849gydF4y2Ba
Graham等[gydF4y2Ba18gydF4y2Ba]gydF4y2Ba “绿带运动”gydF4y2BahgydF4y2Ba 私人gydF4y2Ba 0.535gydF4y2Ba 0.899gydF4y2Ba 0.8gydF4y2Ba 0.859gydF4y2Ba
我们的模型gydF4y2Ba BiGRUgydF4y2Ba我gydF4y2Ba+丙氨酸gydF4y2BajgydF4y2Ba+ PyCNNgydF4y2BakgydF4y2Ba NHAMCSgydF4y2Ba 0.654gydF4y2Ba 0.856gydF4y2BalgydF4y2Ba 0.834gydF4y2Ba 0.856gydF4y2Ba
我们的模型gydF4y2Ba BiGRU+ Att+ PyCNNgydF4y2Ba 台大医院gydF4y2Ba米gydF4y2Ba 0.606gydF4y2Ba 0.852gydF4y2Ba 0.806gydF4y2Ba 0.821gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaDNN:深度神经网络。gydF4y2Ba

cgydF4y2Ba全国医院门诊医疗调查。gydF4y2Ba

dgydF4y2Ba不可用。gydF4y2Ba

egydF4y2BaNLP:自然语言处理。gydF4y2Ba

fgydF4y2Ba主成分分析。gydF4y2Ba

ggydF4y2BaLR:逻辑回归。gydF4y2Ba

hgydF4y2BaGBM:梯度增强机。gydF4y2Ba

我gydF4y2BaBiGRU:双向门控循环单元。gydF4y2Ba

jgydF4y2Ba注意层。gydF4y2Ba

kgydF4y2BaPyCNN:金字塔卷积神经网络。gydF4y2Ba

lgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能。gydF4y2Ba

米gydF4y2Ba国立台湾大学附属医院。gydF4y2Ba

应用于其他临床结果gydF4y2Ba

为了有效评估我们的模型对其他临床结果的预测质量,我们选择了其他常见结果进行测试,并将传统机器学习算法的结果作为我们的基线,然后比较不同方法在各种指标上的结果差异。gydF4y2Ba

死亡率预测gydF4y2Ba

由于死亡率与急诊严重程度指数(ESI) 5级分诊高度相关,我们将该模型应用于NTUH数据集上的死亡率预测,结果见gydF4y2Ba表6gydF4y2Ba.由于死亡患者数量较少,由于收敛问题,我们选择不测试该数据集。gydF4y2Ba

与其他算法,包括3种传统的机器学习算法相比,我们提出的模型除了在gydF4y2Ba灵敏度gydF4y2Ba.gydF4y2Ba

表6所示。死亡率预测在台大医院数据集上的表现。gydF4y2Ba
模型gydF4y2Ba 灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba F1的分数gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
逻辑回归gydF4y2Ba 0.903gydF4y2Ba 0.887gydF4y2Ba 0.895gydF4y2Ba 0.895gydF4y2Ba 0.896gydF4y2Ba 0.954gydF4y2Ba
XGBoostgydF4y2BabgydF4y2Ba 0.926gydF4y2Ba 0.913gydF4y2Ba 0.909gydF4y2Ba 0.919gydF4y2Ba 0.919gydF4y2Ba 0.962gydF4y2Ba
随机森林gydF4y2Ba 0.933gydF4y2Ba 0.898gydF4y2Ba 0.915gydF4y2Ba 0.915gydF4y2Ba 0.916gydF4y2Ba 0.958gydF4y2Ba
我们的模型gydF4y2Ba 0.917gydF4y2Ba 0.941gydF4y2BacgydF4y2Ba 0.939gydF4y2Ba 0.928gydF4y2Ba 0.941gydF4y2Ba 0.983gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaXGBoost:极端梯度增强。gydF4y2Ba

cgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能。gydF4y2Ba

预测重症监护病房入住gydF4y2Ba

在重症监护病房入住概率方面,我们在2个数据集上测试了我们的模型,结果见gydF4y2Ba表7gydF4y2Ba和gydF4y2Ba8gydF4y2Ba.gydF4y2Ba表7gydF4y2Ba图中为4种算法在NHAMCS数据集上的比较gydF4y2Ba表8gydF4y2Ba给出了4种算法在NTUH数据集上的结果。gydF4y2Ba

同样,与其他算法相比,包括3种传统的机器学习算法,我们提出的模型除了在gydF4y2Ba灵敏度gydF4y2Ba.gydF4y2Ba

表7所示。在全国医院门诊医疗调查数据集上预测重症监护病房入院的表现。gydF4y2Ba
模型gydF4y2Ba 灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba F1的分数gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
逻辑回归gydF4y2Ba 0.787gydF4y2Ba 0.734gydF4y2Ba 0.761gydF4y2Ba 0.760gydF4y2Ba 0.761gydF4y2Ba 0.845gydF4y2Ba
XGBoostgydF4y2BabgydF4y2Ba 0.823gydF4y2Ba 0.708gydF4y2Ba 0.769gydF4y2Ba 0.764gydF4y2Ba 0.765gydF4y2Ba 0.849gydF4y2Ba
随机森林gydF4y2Ba 0.876gydF4y2Ba 0.707gydF4y2Ba 0.800gydF4y2Ba 0.790gydF4y2Ba 0.792gydF4y2Ba 0.861gydF4y2Ba
我们的模型gydF4y2Ba 0.805gydF4y2Ba 0.807gydF4y2BacgydF4y2Ba 0.807gydF4y2Ba 0.806gydF4y2Ba 0.824gydF4y2Ba 0.884gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaXGBoost:极端梯度增强。gydF4y2Ba

cgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能。gydF4y2Ba

表8所示。台大医院加护病房入院预测之效能。gydF4y2Ba
模型gydF4y2Ba 灵敏度gydF4y2Ba 特异性gydF4y2Ba 精度gydF4y2Ba F1的分数gydF4y2Ba 精度gydF4y2Ba AUROCgydF4y2Ba一个gydF4y2Ba
逻辑回归gydF4y2Ba 0.811gydF4y2Ba 0.846gydF4y2Ba 0.829gydF4y2Ba 0.828gydF4y2Ba 0.828gydF4y2Ba 0.905gydF4y2Ba
XGBoostgydF4y2BabgydF4y2Ba 0.831gydF4y2Ba 0.831gydF4y2Ba 0.829gydF4y2Ba 0.832gydF4y2Ba 0.830gydF4y2Ba 0.917gydF4y2Ba
随机森林gydF4y2Ba 0.833gydF4y2Ba 0.828gydF4y2Ba 0.831gydF4y2Ba 0.830gydF4y2Ba 0.831gydF4y2Ba 0.911gydF4y2Ba
我们的模型gydF4y2Ba 0.823gydF4y2Ba 0.872gydF4y2BacgydF4y2Ba 0.865gydF4y2Ba 0.843gydF4y2Ba 0.870gydF4y2Ba 0.920gydF4y2Ba

一个gydF4y2BaAUROC:接收机工作特性曲线下的面积。gydF4y2Ba

bgydF4y2BaXGBoost:极端梯度增强。gydF4y2Ba

cgydF4y2Ba斜体表示我们的模型在不同模型的度量中表现出最好的性能。gydF4y2Ba

限制gydF4y2Ba

这项研究有几个局限性。首先,我们实验使用的NTUH数据库属于NTUH,不公开。因此,很难将其与其他研究中开发的模型进行公平比较。然而,NHAMCS数据集是公开可用的,可用于评估跨研究模型的性能。其次,所有的评价都是基于回顾性的数据,需要未来的前瞻性评价。gydF4y2Ba

结论gydF4y2Ba

急诊科拥挤已成为医疗服务中最大的问题之一。许多国家的急诊科患者就诊数量稳步但显著地增加。虽然ESI系统在一定程度上改善了治疗过程,但它仍然依赖于护士的判断,容易出现大多数患者被分类到ESI三级的问题。此外,ESI的主要目的是对患者进行分类,并将更有限的资源保留给那些属于高敏度类别的患者,这些患者可能更迫切需要这些资源。因此,一个能够帮助医生准确诊断病人病情的系统势在必行。在这项工作中,我们提出了一个基于患者急诊室EMR的系统来预测在急诊室完成指定程序后的住院需求。该系统使用cnn和rnn相结合的方法,并结合注意机制进行分类。gydF4y2Ba

我们基于所开发的融合模型在2个数据集上验证了所提出的分类引擎,其中一个数据集来自美国一个包含118,602例ED患者就诊的开放数据集(NHAMCS),其中准确率和AUROC分别为0.83和0.87。另一方面,我们也在台湾本地NTUH数据集上进行了外部验证,该数据集包括745,441例急诊科患者就诊,其中准确率和AUROC分别为0.83和0.88。此外,为了有效地评估我们提出的系统的预测能力,我们还将该模型应用于其他临床结果,包括死亡率和重症监护病房入院。结果表明,我们的方法比其他常见方法(包括3种传统的机器学习算法)的准确率高出约3%至5%。此外,该系统的实施相对容易,包括常用的变量,并且更适合现实世界的临床环境。我们未来的工作是通过前瞻性临床试验验证我们新颖的基于深度学习的分诊算法,一旦验证成功,我们希望用它来指导繁忙的急诊科的资源分配。gydF4y2Ba

这项工作中使用的非结构化数据由护士手动记录。然而,在急诊科临床检查中,文本信息应由急诊科患者直接描述。因此,未来的工作重点可能是利用自动语音识别直接转换和利用急诊科就诊的语音数据。此外,尽管我们的工作包括对短句和长句的分析,但它没有处理全局词的相关性。因此,我们未来的工作可能侧重于在该系统中结合不同类型的深度学习算法,以提供更全面的系统,例如图卷积网络或变压器。gydF4y2Ba

致谢gydF4y2Ba

本研究由台湾科技部人工智能技术与万华医疗联合研究中心(110-2634-F-002-042-、110-2634-F-002-016-、110-2634-F-002-046-和110-2634-F-002-049-)以及国立台湾大学人工智能与先进机器人研究中心支持。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

  1. Pines JM, Griffey r。我们从十年的ED拥挤研究中学到的。中华医学杂志;2015;22(8):985-987 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  2. 孙保林,夏瑞荣,魏瑞杰,Zingmond D,梁磊,韩伟,等。急诊科拥挤对住院病人预后的影响。中国生物医学工程学报(英文版);2009;31 (6):559 - 561 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. 张建军,张建军,李建军,等。急诊拥挤:原因、后果及对策的系统回顾。科学通报,2018;13(8):e0203316 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. 莫雷C, Stankovich J, Peterson G, Kinsman L.未来规划:澳大利亚塔斯马尼亚州急诊科的表现模式。急诊护理2018;38:34-40 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. Guttmann A, Schull MJ, Vermeulen MJ, Stukel TA。从急诊科出院后等待时间与短期死亡率和住院率之间的关系:来自加拿大安大略省的基于人口的队列研究中国生物医学工程学报,2011;33 (2):391 - 391 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  6. Dinh MM, Bein KJ, Latt M, Chalkley D, Muscatello D.年龄先于视力:大悉尼地区急诊科服务需求的驱动因素。中华急诊医学杂志,2015;32(9):708-711。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. Lowthian JA, Curtis AJ, Jolley DJ, Stoelwinder JU, McNeil JJ, Cameron PA。急诊科门口的需求:十年来的演讲趋势。医学杂志2012年2月6日;196:128-132。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. 奥古斯丁·J.最新的急诊科使用率已经出来了。ACEPNow。2019.URL:gydF4y2Bahttps://www.acepnow.com/article/the-latest-emergency-department-utilization-numbers-are-in/gydF4y2Ba[2021-11-26]访问gydF4y2Ba
  9. 芮鹏,康凯,Ashman J.全国医院门诊医疗调查:2016年急诊科汇总表。美国疾病控制与预防中心,2016。URL:gydF4y2Bahttps://www.cdc.gov/nchs/data/nhamcs/web_tables/2016_ed_web_tables.pdfgydF4y2Ba[2021-11-27]访问gydF4y2Ba
  10. 2019年全国医疗机构现状及医院利用情况统计。台湾卫生福利部。URL:gydF4y2Bahttps://www.mohw.gov.tw/lp-4932-2.htmlgydF4y2Ba[2021-11-27]访问gydF4y2Ba
  11. 张建军,张建军,张建军,等。急诊拥挤的国际视角。中华医学杂志,2011;18(12):1358-1370 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  12. Chalfin DB, Trzeciak S, Likourezos A, Baumann BM, Dellinger RP,延迟ed研究小组。危重病人从急诊科延迟转移到重症监护病房的影响。危重医学杂志,2007;35(6):1477-1483。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. Ahsan KB, Alam MR, Morel DG, Karim MA。急诊部门资源优化以提高绩效:综述。工业工程学报,2019,11(1):253-266。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  14. Fernandes M, Vieira SM, Leite F, Palos C, Finkelstein S, Sousa JM。应用智能系统的急诊科分诊临床决策支持系统综述[j] .中国生物医学工程学报,2011;22(2):391 - 391。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. 格里戈里耶维奇D, Stojanovic J, Satz W, Stojkovic I, Schreyer K, Del Portal D,等。急诊病人分诊的深度关注模型。参见:2018年SIAM数据挖掘国际会议论文集(SDM)。2018年发表于:SIAM数据挖掘国际会议(SDM);2018年5月3-5日;加州圣地亚哥,美国。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  16. 张欣,金杰,陈建军,陈建军,陈建军,陈建军,陈建军。基于自然语言处理和神经网络的急诊科住院预测。方法中华医学杂志2017年10月26日;56(5):377-389。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  17. 孙燕,韩宝宝,郑世祥,肖娥。利用日常行政数据预测急诊科分诊住院人数。中华医学杂志;2011;18(8):844-850 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  18. Graham B, Bond R, Quinn M, Mulvenna M.利用数据挖掘预测急诊科住院人数。IEEE Access 2018;6:10458-10469。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  19. 王刚,刘霞,谢凯,陈宁,陈涛。基于电子病历的急诊分诊神经注意模型。摘自:IEEE生物信息学与生物医学国际会议论文集。2019年发表于:IEEE生物信息学与生物医学国际会议(BIBM);2019年11月18日至21日;圣地亚哥,加州,美国。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  20. Joulin A, Grave E, Bojanowski P, Mikolov T.高效文本分类的技巧包。在:计算语言学协会欧洲分会第15届会议论文集。2017提交于:计算语言学协会欧洲分会第15届会议;2017年4月;西班牙瓦伦西亚,第427-431页。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  21. 李建军,李建军,李建军,等。基于子词信息的词向量提取方法。学报(自然科学版)2017年12月5日(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  22. Clevert D, Unterthiner T, Hochreiter S.基于指数线性单元(elu)的快速准确深度网络学习。见:第四届国际学习表征会议论文集,ICLR。2016年出席:第四届国际学习表征会议;2016年5月2日至4日;圣胡安,波多黎各第2-4页gydF4y2Bahttps://arxiv.org/pdf/1511.07289.pdf%5cnhttp://arxiv.org/abs/1511.07289%5cnhttp://arxiv.org/abs/1511.07289.pdfgydF4y2Ba
  23. Goodfellow I, Bengio Y, Courville a。美国剑桥:麻省理工学院出版社;2016.gydF4y2Ba
  24. 张涛。基于深度金字塔卷积神经网络的文本分类。参见:计算语言学协会第55届年会论文集。:计算语言学协会;2017年发表于:计算语言学协会第55届年会上;2017年7月;加拿大温哥华。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  25. 金旸。基于卷积神经网络的句子分类。参见:2014年自然语言处理(EMNLP)经验方法会议论文集。2014年发表于:自然语言处理(EMNLP)经验方法会议;2014年10月;多哈,卡塔尔。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  26. Kingma DP, Ba J. Adam:一种随机优化方法。参见:第三届国际学习表征会议论文集。2015年发表于:第三届国际学习表征会议;2015年5月7-9日;圣地亚哥,加州gydF4y2Bahttps://arxiv.org/abs/1412.6980gydF4y2Ba
  27. Devlin J, Chang MW, Lee K, Toutanova K. BERT:基于深度双向变换的语言理解预训练。2019年在计算语言学协会北美分会会议:人类语言技术上发表于:计算语言学协会北美分会会议:人类语言技术;2019年6月;明尼阿波利斯,明尼苏达州第4171-4186页。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  28. Raita Y, Goto T, Faridi MK, Brown DFM, Camargo CA, Hasegawa K.基于机器学习模型的急诊科分类预测临床结果。重症监护2019年2月22日;23(1):64 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
AUROC:gydF4y2Ba接收机工作特性曲线下的面积gydF4y2Ba
伯特:gydF4y2Ba来自变压器的双向编码器表示gydF4y2Ba
有线电视新闻网:gydF4y2Ba卷积神经网络gydF4y2Ba
艾德:gydF4y2Ba急诊科gydF4y2Ba
EMR:gydF4y2Ba电子病历gydF4y2Ba
应急服务国际公司:gydF4y2Ba紧急程度指数gydF4y2Ba
LR:gydF4y2Ba逻辑回归gydF4y2Ba
NHAMCS:gydF4y2Ba全国医院门诊医疗调查gydF4y2Ba
NLP:gydF4y2Ba自然语言处理gydF4y2Ba
台大医院:gydF4y2Ba台湾大学附属医院gydF4y2Ba
RNN:gydF4y2Ba循环神经网络gydF4y2Ba
XGBoost:gydF4y2Ba极端梯度增压gydF4y2Ba


R库卡夫卡编辑;提交07.01.21;A Teixeira, M Fernandes的同行评审;对作者的评论12.02.21;收到修订版本21.03.21;接受26.10.21;发表27.12.21gydF4y2Ba

版权gydF4y2Ba

©姚利鸿,梁家春,蔡楚林,黄健华,傅丽辰。原发表于《医学互联网研究杂志》(//www.mybigtv.com), 2021年12月27日。gydF4y2Ba

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba


Baidu
map