卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIRgydF4y2Ba

J医疗互联网服务gydF4y2Ba

医学互联网研究杂志gydF4y2Ba

1438 - 8871gydF4y2Ba

卡塔尔世界杯8强波胆分析

加拿大多伦多gydF4y2Ba

v24i8e37486gydF4y2Ba

35921141gydF4y2Ba

10.2196/37486gydF4y2Ba

原始论文gydF4y2Ba

基于电子病历学习的包埋表示提高急性心肌梗死住院患者预后预测性能:开发与验证研究gydF4y2Ba

EysenbachgydF4y2Ba

冈瑟gydF4y2Ba

NuutinengydF4y2Ba

MikkogydF4y2Ba

JormgydF4y2Ba

路易莎gydF4y2Ba

钱gydF4y2Ba

BuyuegydF4y2Ba

黄gydF4y2Ba

YanqungydF4y2Ba

废话gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba

https://orcid.org/0000-0001-8111-6352gydF4y2Ba

郑gydF4y2Ba

ZhimingydF4y2Ba

废话gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba

https://orcid.org/0000-0002-6656-7195gydF4y2Ba

妈gydF4y2Ba

MoxuangydF4y2Ba

女士gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba

https://orcid.org/0000-0002-9941-5569gydF4y2Ba

鑫gydF4y2Ba

女士gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba

https://orcid.org/0000-0002-0315-3518gydF4y2Ba

刘gydF4y2Ba

宏磊gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba

https://orcid.org/0000-0001-5518-4749gydF4y2Ba

范gydF4y2Ba

小路gydF4y2Ba

博士学位gydF4y2Ba 3.gydF4y2Ba

https://orcid.org/0000-0001-7498-0249gydF4y2Ba

魏gydF4y2Ba

局域网gydF4y2Ba

博士学位gydF4y2Ba 3.gydF4y2Ba

https://orcid.org/0000-0003-1128-1314gydF4y2Ba

陈gydF4y2Ba

回族gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

生物医学工程学院gydF4y2Ba 首都医科大学gydF4y2Ba

丰台区友安门西头条10号gydF4y2Ba

北京,100069gydF4y2Ba

中国gydF4y2Ba 86 01083911545gydF4y2Ba chenhui@ccmu.edu.cngydF4y2Ba

2gydF4y2Ba

https://orcid.org/0000-0002-0048-0193gydF4y2Ba

1gydF4y2Ba 生物医学工程学院gydF4y2Ba 首都医科大学gydF4y2Ba

北京gydF4y2Ba

中国gydF4y2Ba 2gydF4y2Ba 临床生物力学基础研究北京市重点实验室gydF4y2Ba 首都医科大学gydF4y2Ba

北京gydF4y2Ba

中国gydF4y2Ba 3.gydF4y2Ba 信息中心gydF4y2Ba 宣武医院gydF4y2Ba 首都医科大学gydF4y2Ba

北京gydF4y2Ba

中国gydF4y2Ba

通讯作者:陈辉gydF4y2Ba chenhui@ccmu.edu.cngydF4y2Ba

8gydF4y2Ba 2022gydF4y2Ba

3.gydF4y2Ba 8gydF4y2Ba 2022gydF4y2Ba

24gydF4y2Ba 8gydF4y2Ba

e37486gydF4y2Ba

22gydF4y2Ba 2gydF4y2Ba 2022gydF4y2Ba 20.gydF4y2Ba 4gydF4y2Ba 2022gydF4y2Ba 2gydF4y2Ba 6gydF4y2Ba 2022gydF4y2Ba 18gydF4y2Ba 7gydF4y2Ba 2022gydF4y2Ba

©黄燕群，郑志敏，马默轩，辛欣，刘红雷，费晓璐，魏兰，陈辉。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2022年3月8日。gydF4y2Ba

2022gydF4y2Ba

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。gydF4y2Ba

背景gydF4y2Ba

电子病历的广泛二次使用促进了医疗质量的提高。表征学习能够自动从EMR数据中提取隐藏信息，已越来越受到人们的关注。gydF4y2Ba

客观的gydF4y2Ba

我们旨在提出一种具有更多特征关联和任务特异性特征重要性的患者表示，以提高急性心肌梗死(AMI)住院患者的预后预测性能。gydF4y2Ba

方法gydF4y2Ba

医学概念，包括患者的年龄、性别、疾病诊断、实验室测试、结构化放射特征、程序和药物，首先使用改进的skip-gram算法嵌入到实值向量中，其中上下文窗口中的概念是由关联规则置信度测量的特征关联强度选择的。然后，将每个患者表示为任务特定特征重要性加权的特征嵌入之和，用于从全局和局部角度进行预测模型预测。最后，我们将所提出的患者表示分别应用于3010名AMI住院患者和1671名AMI住院患者的死亡风险预测，并将其与几种参考表示方法在受试者工作特征曲线下面积(AUROC)、精度-回忆曲线下面积(AUPRC)和f1评分方面进行比较。gydF4y2Ba

结果gydF4y2Ba

与参考方法相比，所提出的基于嵌入式的表示在两个数据集上表现出一致的卓越预测性能，公共和私有数据集的平均auroc分别为0.878和0.973,AUPRCs分别为0.220和0.505,F1-scores分别为0.376和0.674，而参考方法中最大的auroc、AUPRCs和F1-scores分别为0.847和0.939,0.196和0.283，公共和私有数据集的auroc和AUPRCs分别为0.344和0.361。整合在患者表现中的特征重要性反映了在预测任务和临床实践中也至关重要的特征。gydF4y2Ba

结论gydF4y2Ba

特征关联和特征重要性的引入促进了有效的患者表示，并有助于预测性能的改进和模型解释。gydF4y2Ba

表示学习gydF4y2Ba skip-gramgydF4y2Ba 特征关联强度gydF4y2Ba 功能的重要性gydF4y2Ba 死亡风险预测gydF4y2Ba 急性心肌梗死gydF4y2Ba

简介gydF4y2Ba

电子病历(EMRs)包含各种不同的信息，如人口统计数据、疾病诊断、实验室检测、放射学结果、检查和程序以及药物。EMR数据不仅可以反映患者的健康状况和记录治疗轨迹，还可以帮助医生做出临床决策[gydF4y2Ba 1gydF4y2Ba-gydF4y2Ba 6gydF4y2Ba]和提高诊疗效率[gydF4y2Ba 1gydF4y2Ba，gydF4y2Ba 7gydF4y2Ba，gydF4y2Ba 8gydF4y2Ba］．EMR数据二次使用的最普遍和最实际的任务之一是建立模型来预测疾病状况[gydF4y2Ba 8gydF4y2Ba-gydF4y2Ba 10gydF4y2Ba]和治疗结果[gydF4y2Ba 11gydF4y2Ba-gydF4y2Ba 17gydF4y2Ba]，使用机器学习算法。gydF4y2Ba

然而，EMR数据的高维性、稀疏性和异质性[gydF4y2Ba 12gydF4y2Ba，gydF4y2Ba 18gydF4y2Ba]为直接将原始数据输入基于机器学习的预测模型带来了许多障碍。一些手动和数据驱动的特征工程方法[gydF4y2Ba 15gydF4y2Ba，gydF4y2Ba 19gydF4y2Ba]，虽然费时费力，但用于为预测任务选择重要特征或提取有用信息。此外，预测模型的性能在很大程度上依赖于数据的表示。据报道，有效的表示方法可以使下游建模更简单、更灵活，并大大提高预测性能[gydF4y2Ba 18gydF4y2Ba，gydF4y2Ba 20.gydF4y2Ba］．通过将原始特征转换为紧凑向量，表示学习可以在构建预测模型时更容易自动提取有用信息[gydF4y2Ba 16gydF4y2Ba，gydF4y2Ba 21gydF4y2Ba，gydF4y2Ba 22gydF4y2Ba］．EMR数据的一种广泛使用的表示方法是跳图算法[gydF4y2Ba 23gydF4y2Ba]，这是一种分布式嵌入方法，将患者记录视为句子，将医学概念视为单词。跳过图算法中一个不可避免的问题是，与句子中的单词相反，患者记录中的医学概念没有自然顺序，这使得学习具有潜在关联的概念的有意义的表示变得困难。这个问题的一个解决方案是在一个记录中随机洗牌概念，以学习概念嵌入[gydF4y2Ba 12gydF4y2Ba，gydF4y2Ba 24gydF4y2Ba-gydF4y2Ba 26gydF4y2Ba］．它可以在一定程度上减少医学概念的无序属性对算法的影响，但仍未考虑这些概念之间的关联。gydF4y2Ba

急性心肌梗死(AMI)是一种急性缺血性心脏病，是导致死亡的第二大原因。每6例死亡中就有1例死于缺血性心脏病，其中AMI占死亡人数的大多数[gydF4y2Ba 27gydF4y2Ba，gydF4y2Ba 28gydF4y2Ba］．AMI患者死亡风险预测在临床工作中起着至关重要的作用，有助于医生识别潜在的临床因素，及时预警患者不良健康状况，及早采取干预措施，减少相关医疗费用的负担。因此，研究人员[gydF4y2Ba 19gydF4y2Ba，gydF4y2Ba 29gydF4y2Ba-gydF4y2Ba 31gydF4y2Ba]专注于建立用于AMI患者结局预测的机器学习模型，其中大多数使用特定的临床特征，如实验室检测结果(如白蛋白)、合并症(如糖尿病)和人口统计学数据(如性别)。gydF4y2Ba

在本研究中，我们的目标是从EMR数据中提取的各种结构化特征表示为定长嵌入向量，然后用于提高AMI患者死亡风险预测模型的性能。具体来说，我们将关联强度引入到skip-gram算法中，以学习特征的更多信息表示。我们还介绍了Shapley加法解释(SHAP) [gydF4y2Ba 32gydF4y2Ba技术，以促进患者水平的表示，并提高预测模型的可解释性。本文概述了我们所提出的表示学习框架及其应用gydF4y2Ba 图1gydF4y2Ba．gydF4y2Ba

图1gydF4y2Ba

患者死亡风险预测的拟表示学习方法概述。首先，使用自适应上下文窗口的跳过图算法学习特征表示。然后，基于特征重要性加权的特征表征构建患者表征。最后，将所提出的患者表征方法应用于急性心肌梗死住院患者的公共数据集和私人数据集死亡风险预测，并与参考方法进行比较。gydF4y2Ba

方法gydF4y2Ba 基于skip - gram的患者表示gydF4y2Ba

表征在概念、特征和患者三个层次上进行分层学习。在概念层面，我们采用了改进的skip-gram算法[gydF4y2Ba 23gydF4y2Ba]来表示一个概念为嵌入向量。在自然语言处理领域，skip-gram的基本思想是最大化目标词和上下文词在预定义上下文窗口中出现的概率，使出现在同一个上下文窗口中的词在嵌入空间中更接近。与句子中有自然顺序的词语不同，医疗概念在某一住院患者记录中出现了无序现象。这使得很难确定包含与目标概念相关的概念的上下文窗口，特别是当记录中的概念数量远远大于上下文窗口的大小时。因此，对于记录中的概念，我们使用其与同一记录中的候选概念的关联强度来识别相关概念。关联强度定义为以一个候选概念作为唯一前因(或结果)的关联规则的置信度(公式1)。gydF4y2Ba

置信度(C1, C2) = |C1∩C2| / |C1|gydF4y2Ba (1）gydF4y2Ba

其中C1和C2分别是关联规则C1→C2的前项和后项概念，|C1|和|C1∩C2|分别是包含C1和同时包含C1和C2的患者记录的数量。置信度越大，两个概念之间的联系就越强。将置信度最高的前N个关联规则中的前因(或结果)概念纳入目标概念的上下文窗口。我们称之为上下文概念的选择方案gydF4y2Ba antecedent-basedgydF4y2Ba(或gydF4y2Ba consequent-basedgydF4y2Ba)嵌入的。gydF4y2Ba 图2gydF4y2Ba提供基于结果的上下文概念选择方案的示例。gydF4y2Ba

图2gydF4y2Ba

使用关联强度的跳跃式图算法上下文概念选择的示例。所有记录由10个概念(C1, C2， ......和C10)组成。在置信度矩阵中，元素Cij为以Cj为前项，Ci为后项的关联规则置信度。患者1有6个概念(C1、C3、C6、C7、C8和C10)，从5个候选概念中选取C1的4个概念上下文窗口中的概念，其置信度分别为0.66(前项，C10)、0.62 (C3)、0.55 (C6)、0.53 (C8)和0.46 (C7)。因此，选择C10、C3、C6、C8构建C1的上下文窗口。gydF4y2Ba

此外，为了降低大量概念的高维性和稀疏性，同时尽可能保留临床信息，我们根据国际疾病分类第十版(ICD-10)代码和国际疾病分类第九版(ICD-9)代码，在临床专家的帮助下，将疾病诊断和程序概念聚合为几个有临床意义的特征组。如将1型糖尿病和2型糖尿病的疾病诊断归为糖尿病特征组。患者记录中来自同一特征组的所有概念嵌入向量的平均值被视为患者在特征级别的表示。gydF4y2Ba

患者层面的表征是特征层面表征的加权和。特征权重是在预测任务的指导下获得的，表明了患者表现中涉及的每个特征的重要性。在本研究中，我们使用SHAP值作为特征权重。SHAP框架是一种基于博弈论思想的机器学习解释技术。它用一个不同但简单的模型来近似一个训练好的预测模型，该模型可以很容易地以SHAP值的形式计算预测模型中每个特征的贡献，并执行添加性特征归因来解释特征的组合[gydF4y2Ba 32gydF4y2Ba］．SHAP值为正或负表示对预测的影响为正或负。然后，一个特征的重要性被计算为所有样本中其绝对SHAP值的平均值。gydF4y2Ba

实验与评价gydF4y2Ba 数据集与数据预处理gydF4y2Ba

在这项研究中，我们使用了一个公共数据集，即免费访问的重症监护数据库重症监护III医疗信息集市(mimi -III数据集[gydF4y2Ba 33gydF4y2Ba])，以及用于实验的私有数据集。gydF4y2Ba

mimi - iii数据集收集于2001年6月至2012年10月之间，涉及马萨诸塞州波士顿贝斯以色列女执事医疗中心重症监护室收治的46,520名患者。它包括患者的健康信息，如人口统计数据、生命体征、实验室检测结果、药物、程序、诊断代码和临床记录。信息丰富的MIMIC-III数据集被广泛应用于一些医疗机器学习建模和算法评估，为研究人员建立模型和评估算法提供了强有力的数据支持[gydF4y2Ba 14gydF4y2Ba，gydF4y2Ba 18gydF4y2Ba］．gydF4y2Ba

私人数据集来源于2014年1月至2016年12月中国北京首都医科大学宣武医院三级医院EMR系统。患者特征包括入院和出院信息、人口统计数据、疾病诊断、实验室检查、检查和程序、药物、胸部x线或彩色超声检查的放射学报告。gydF4y2Ba

我们分别从公共和私人数据集中提取了3010和1671名AMI患者的记录。通过ICD-9代码410.01至410.91或ICD-10代码I21和I22确认AMI诊断。来自公共和私人数据集的患者中，分别有254例(8.1%)和103例(6.2%)在医院死亡。gydF4y2Ba

我们保留了患者的首次住院数据来评估所提出的方法。两组数据均保留了人口统计学数据(年龄和性别)和以下ami相关特征:至少95%患者进行的ami相关实验室检查项目，从放射报告中提取的ami相关放射特征[gydF4y2Ba 34gydF4y2Ba]， 7种常用处方药，以及所有记录在案的疾病诊断和程序。对于多次进行的实验室检查，只保留第一次检查的结果(通常在入院时)，这可以反映病人的健康状况和病情严重程度。gydF4y2Ba

自自然语言处理领域最初提出以来，跳过图算法被用于训练离散单词或符号的嵌入。因此，要使用跳跃式图算法对结构化数据进行嵌入表示，所有患者特征都应该是分类的，其中每个离散值都被视为一个概念。例如，男性和女性是性别的两个概念。与原始分类特征(如性别、疾病诊断、程序和药物)可能保持不变不同，年龄和实验室检测结果等连续变量必须离散成两个或多个概念。年龄离散为>60岁和≤60岁2个概念。每个实验室检测结果参照临床标准离散为2个概念(正常和异常)。总共识别出3326和1073个医学概念，并进一步在公共和私人数据集中分别聚合到104和108个特征组(gydF4y2Ba 表1gydF4y2Ba)．私有数据集和公共数据集的所有特征组都列在gydF4y2Ba 多媒体附件1gydF4y2Ba而且gydF4y2Ba 多媒体附件2gydF4y2Ba,分别。gydF4y2Ba

表1gydF4y2Ba

公共数据集和私有数据集的概念和特征组。gydF4y2Ba

功能分类gydF4y2Ba	公共数据集gydF4y2Ba			私有数据集gydF4y2Ba			概念的例子gydF4y2Ba
	特征组(n=104)， ngydF4y2Ba	概念(n=3326)， ngydF4y2Ba	特征组(n=108)， ngydF4y2Ba		概念(n=1073)， ngydF4y2Ba
年龄gydF4y2Ba	1gydF4y2Ba	2gydF4y2Ba	1gydF4y2Ba		2gydF4y2Ba	>60年和≤60年gydF4y2Ba
性别gydF4y2Ba	1gydF4y2Ba	2gydF4y2Ba	1gydF4y2Ba		2gydF4y2Ba	男性和女性gydF4y2Ba
实验室测试gydF4y2Ba	19gydF4y2Ba	38gydF4y2Ba	40gydF4y2Ba		80gydF4y2Ba	血清甘油三酯异常，血清肌酐正常gydF4y2Ba
辐射特性gydF4y2Ba	34gydF4y2Ba	34gydF4y2Ba	36gydF4y2Ba		36gydF4y2Ba	心脏图像增大，肋膈角明显gydF4y2Ba
疾病的诊断gydF4y2Ba	24gydF4y2Ba	2600gydF4y2Ba	15gydF4y2Ba		739gydF4y2Ba	高血压和脑干梗塞gydF4y2Ba
程序gydF4y2Ba	18gydF4y2Ba	643gydF4y2Ba	8gydF4y2Ba		207gydF4y2Ba	冠状动脉支架和心包穿刺术gydF4y2Ba
药物gydF4y2Ba	7gydF4y2Ba	7gydF4y2Ba	7gydF4y2Ba		7gydF4y2Ba	血管紧张素转换酶抑制剂和肝素gydF4y2Ba

表现评估gydF4y2Ba

为了评估所提出的表示的有效性和优势，我们使用了另外两种简单的参考表示方法，即带有学习的3层自编码器和不带学习的特征选择方法。gydF4y2Ba 表2gydF4y2Ba描述所提议的和引用的表示方法的细节。gydF4y2Ba

首先在概念层面对所提出的表示方法进行了评估。采用聚类分析将实验室测试概念聚类为2个聚类进行定量评价。经调整的兰德指数[gydF4y2Ba 35gydF4y2Ba](范围从−1到1)用于评估集群解决方案。ARI值越大，对不同真实标签(正常和异常)类别的区分能力越强。我们还应用t分布随机邻域算法将实验室测试概念的嵌入向量投影到二维空间中，以直观地观察嵌入的分布。gydF4y2Ba

提出的表示方法，然后评估在患者水平与下游预测任务使用逻辑回归模型。预测结果为AMI患者住院期间的住院死亡。用于预测的输入是来自中列出的整个特征集的患者表示gydF4y2Ba 表1gydF4y2Ba．我们还从整个特征集中提取了一个无治疗特征子集，将药物和程序排除在外，试图阐明所提议的患者表征的表现与表征中涉及的特征相关，并且与治疗相关的特征在预测患者结局方面发挥着至关重要的作用，即使它们已被表示为嵌入向量。gydF4y2Ba

表2gydF4y2Ba

描述所提出的和引用的表示方法。gydF4y2Ba

表示方法gydF4y2Ba	描述gydF4y2Ba	代表性的例子gydF4y2Ba
混合物gydF4y2Ba	原始离散特征的离散化代码和连续特征的原始值的混合。实验室试验中的缺失值用相应实验室试验的平均值进行插值。gydF4y2Ba	(0,1,1,0,0,0,0,1,12,8.5,3,8)对于有11个特征的患者gydF4y2Ba
离散化gydF4y2Ba	0-1向量，其中数字1表示具有特定疾病、程序、放射学特征和药物的患者，其他为0。年龄1为>60岁，0为≤60岁，性别1为男性，0为女性，实验室检测项目1为异常，0为正常。实验室测试的缺失值由相应的模式内插。gydF4y2Ba	(0,1,1,0,0,0,0,1,1,1,1,1)对于具有11个离散化特征的患者gydF4y2Ba
DIS_FSgydF4y2Ba^{一个gydF4y2Ba}	所选择的具有离散化表征的特征在标记为“死亡”和未标记为“死亡”的患者之间具有统计学差异。gydF4y2Ba	(0,0,1,0,0,1,0,1,0,1)对于具有8个选定特征的患者gydF4y2Ba
DIS_AEgydF4y2Ba^bgydF4y2Ba	以离散化向量作为输入和输出的三层自编码器的隐层向量。隐藏层的维数设置为64。gydF4y2Ba	(0.7,1.9,0.5，−1，−3.1,2.4)对于具有6维向量的患者gydF4y2Ba
RAN_EM_AVEgydF4y2Ba^cgydF4y2Ba	从跳过图算法中学习到的特征嵌入向量的平均值，使用随机选择方法确定上下文窗口。gydF4y2Ba	(1.6，−0.5,1.1,0.1，−1.3,0.6)对于6维嵌入向量的患者gydF4y2Ba
RAN_EM_WGTgydF4y2Ba^dgydF4y2Ba	从跳过图算法学习到的特征嵌入向量的加权和，使用随机选择方法确定上下文窗口。gydF4y2Ba	(1.2， - 0.9,1.3,0.4， - 1.9,1.0)对于6维嵌入向量的患者gydF4y2Ba
ANT_EM_AVEgydF4y2Ba^egydF4y2Ba	以目标概念的置信度为前提，从跳过图算法中学习到的特征嵌入向量的平均值。gydF4y2Ba	(0.9， - 0.6,1.2,1.4， - 1.9,0.6)对于6维嵌入向量的患者gydF4y2Ba
ANT_EM_WGTgydF4y2Ba^fgydF4y2Ba	以目标概念的置信度为前提，从跳过图算法中学习到的特征嵌入向量的加权和。gydF4y2Ba	(1.2，−1.5,1.1,0.1，−0.6,0.6)对于6维嵌入向量的患者gydF4y2Ba
CON_EM_AVEgydF4y2Ba^ggydF4y2Ba	利用目标概念作为结果的置信度，从跳过图算法中学习到的特征嵌入向量的平均值。gydF4y2Ba	(1.6，−0.8,2.1,1.6，−1.4,1.5)对于具有6维嵌入向量的患者gydF4y2Ba
CON_EM_WGTgydF4y2Ba^hgydF4y2Ba	使用目标概念作为结果的置信度，从跳过图算法中学习到的特征嵌入向量的加权和。gydF4y2Ba	(1.1，−0.4，−0.7,1.6，−0.3,0.9)对于具有6维嵌入向量的患者gydF4y2Ba

^{一个gydF4y2Ba}DIS_FS:带有特征选择的离散化表示。gydF4y2Ba

^bgydF4y2BaDIS_AE:基于自编码器表示的隐藏向量。gydF4y2Ba

^cgydF4y2BaRAN_EM_AVE:基于随机选择的嵌入表示的平均值。gydF4y2Ba

^dgydF4y2BaRAN_EM_WGT:基于随机选择的嵌入表示的加权和。gydF4y2Ba

^egydF4y2BaANT_EM_AVE:基于前项的嵌入表示的平均值。gydF4y2Ba

^fgydF4y2BaANT_EM_WGT:基于前项的嵌入表示的加权和。gydF4y2Ba

^ggydF4y2BaCON_EM_AVE:基于结果的嵌入表示的平均值。gydF4y2Ba

^hgydF4y2BaCON_EM_WGT:基于结果的嵌入表示的加权和。gydF4y2Ba

我们将样本按7:3的比例随机分成训练数据集和测试数据集。训练样本首先在离散化向量中表示，并用于构建一个预测模型，用于计算所有特征的SHAP值，以进一步对所有研究样本进行患者嵌入表示。将训练样本和测试样本表示为嵌入向量后，分别用于建立和验证基于逻辑回归的预测模型。受试者工作特征曲线下面积(AUROC)、精确召回曲线下面积(AUPRC)和f1评分是主要评价指标。来自混淆矩阵的其他相关性能指标包括精度、召回率和准确性。为了消除跳过图模型初始化和训练/测试数据集分割带来的性能偏差，我们进行了100次对比实验。在每一轮实验中，重复上述过程。报告了每个性能评估指标的95% CI平均值。gydF4y2Ba

在跳过图算法中，上下文窗口的大小和嵌入向量的维数是通过反复试验确定的。我们在公共数据集上进行了一组预测实验，使用窗口大小为5、10、15和20的可能组合，向量维度为50、100、200和300。实验结果(列于gydF4y2Ba 多媒体gydF4y2Ba)表明，窗口大小为10，向量维数为300的跳跃图算法具有最高的表示性能。因此，上下文窗口的大小和嵌入向量的维数分别设置为10和300。我们采用负抽样机制(本研究中有20个负样本)来加速概念嵌入训练过程。其他参数如下:学习率，0.001;迭代次数，50;批大小为64。梯度计算方法为Adam。我们在Python 3.7和TensorFlow 2.0中实现了表示学习、SHAP值计算和预测建模。在患者表征的步骤中，我们使用L2正则化惩罚和“lilinear”求解器对logistic回归模型进行求解，正则化强度的倒数设为0.1。gydF4y2Ba

伦理批准gydF4y2Ba

本研究经首都医科大学宣武医院人体研究伦理委员会批准(批准文号:临床科研2020-070)。gydF4y2Ba

结果gydF4y2Ba 概念表征评价gydF4y2Ba

实验室测试概念的嵌入向量在平面空间(gydF4y2Ba 图3gydF4y2Ba)．正常和异常实验室测试的概念(gydF4y2Ba 图3gydF4y2Ba)当它们被基于结果的嵌入(gydF4y2Ba 图3gydF4y2BaA和3D)比基于前项的嵌入(gydF4y2Ba 图3gydF4y2BaB和3E)和基于随机选择的嵌入(gydF4y2Ba 图3gydF4y2BaC和3F)。在实验室测试的聚类分析中，基于结果的嵌入比基于前因的嵌入(分别为0.112和0.149)和基于随机选择的嵌入(分别为0.043和0.028)获得了更高的ARIs(在公共和私有数据集上分别为0.317和0.520)。结果嵌入的聚类性能最好，表明结果嵌入可能包含更多的特征关联信息。gydF4y2Ba

图3gydF4y2Ba

在跳过图算法中使用上下文概念的不同选择方案的嵌入实验室测试的可视化(使用t分布随机邻居嵌入算法)。红色和绿色的点分别代表异常和正常的实验室检测结果。对于公共数据集，A到C:目标概念的上下文概念由关联规则中的顺次概念(A)或前项概念(B)或随机选择的概念(C)组成。D到F是私有数据集上A到C的对应。gydF4y2Ba

预测性能gydF4y2Ba

表3gydF4y2Ba而且gydF4y2Ba 多媒体附件4gydF4y2Ba分别列出在私有和公共数据集上使用各种表示方法的预测性能。所提出的表示方法，基于结果的嵌入表示的加权和(CON_EM_WGT)，显示出最高的预测性能，使用公共数据集的所有特征和私有数据集的全部特征集和免处理特征集的最大auroc分别为0.878,0.973和0.926。当用AUPRC和F1-score来衡量性能时，无论数据集和特征集如何，所提出的表示方法都优于所有其他方法。gydF4y2Ba

与参考表示法相比，两个数据集上大多数基于嵌入的表示法都表现出了性能改进。在包含整个特征集的公共数据集上，6种有嵌入的表示方法的平均AUROC、AUPRC和F1-score均大于4种没有嵌入的参考方法(分别为0.855 vs 0.831、0.203 vs 0.185和0.354 vs 0.328)。此外，在基于skip-gram算法的6种表示中，基于关联强度进行算法改进的表示的性能优于未进行算法改进的表示。gydF4y2Ba

当将特征表示组合成患者表示时，组装方法和涉及的特征确实很重要。基于加权和思想的表示优于基于平均思想的表示，无论是在具有整个特征集的公共数据集上(AUROC, 0.863至0.878 vs 0.834至0.850)还是在具有整个特征集的私有数据集上(0.967至0.973 vs 0.948至0.957)。另一方面，与未处理的特征集相比，在整个特征集的两个数据集上都实现了一致的优越预测性能。gydF4y2Ba 多媒体gydF4y2Ba显示患者表示方法在具有和不具有治疗特征集的公共和私有数据集上的平均预测性能。gydF4y2Ba

表3gydF4y2Ba

患者表示方法在私有数据集上的预测性能。gydF4y2Ba

特征集和表示方法gydF4y2Ba				AUROCgydF4y2Ba^{一个gydF4y2Ba}，平均值(95% CI)gydF4y2Ba		AUPRCgydF4y2Ba^bgydF4y2Ba，平均值(95% CI)gydF4y2Ba		f1得分，平均值(95% CI)gydF4y2Ba
整个功能集gydF4y2Ba
	基于嵌入的表示方法gydF4y2Ba
		CON_EM_WGTgydF4y2Ba^cgydF4y2Ba	0.973 (0.951 - -0.995)gydF4y2Ba		0.505 (0.278 - -0.732)gydF4y2Ba		0.674 (0.468 - -0.880)gydF4y2Ba
		CON_EM_AVEgydF4y2Ba^dgydF4y2Ba	0.957 (0.933 - -0.981)gydF4y2Ba		0.312 (0.159 - -0.465)gydF4y2Ba		0.479 (0.301 - -0.657)gydF4y2Ba
		ANT_EM_WGTgydF4y2Ba^egydF4y2Ba	0.972 (0.948 - -0.996)gydF4y2Ba		0.489 (0.258 - -0.720)gydF4y2Ba		0.658 (0.442 - -0.874)gydF4y2Ba
		ANT_EM_AVEgydF4y2Ba^fgydF4y2Ba	0.953 (0.929 - -0.977)gydF4y2Ba		0.310 (0.185 - -0.435)gydF4y2Ba		0.478 (0.329 - -0.627)gydF4y2Ba
		RAN_EM_WGTgydF4y2Ba^ggydF4y2Ba	0.967 (0.942 - -0.992)gydF4y2Ba		0.486 (0.263 - -0.709)gydF4y2Ba		0.660 (0.460 - -0.860)gydF4y2Ba
		RAN_EM_AVEgydF4y2Ba^hgydF4y2Ba	0.948 (0.923 - -0.973)gydF4y2Ba		0.287 (0.167 - -0.407)gydF4y2Ba		0.451 (0.306 - -0.596)gydF4y2Ba
	引用表示方法gydF4y2Ba
		DIS_AEgydF4y2Ba^我gydF4y2Ba	0.884 (0.845 - -0.923)gydF4y2Ba		0.207 (0.144 - -0.270)gydF4y2Ba		0.361 (0.279 - -0.443)gydF4y2Ba
		DIS_FSgydF4y2Ba^jgydF4y2Ba	0.938 (0.907 - -0.969)gydF4y2Ba		0.283 (0.167 - -0.399)gydF4y2Ba		0.452 (0.309 - -0.595)gydF4y2Ba
		离散化gydF4y2Ba	0.939 (0.908 - -0.970)gydF4y2Ba		0.283 (0.165 - -0.401)gydF4y2Ba		0.454 (0.307 - -0.601)gydF4y2Ba
		混合物gydF4y2Ba	0.904 (0.849 - -0.959)gydF4y2Ba		0.251 (0.135 - -0.367)gydF4y2Ba		0.417 (0.264 - -0.570)gydF4y2Ba
免处理功能集gydF4y2Ba
	基于嵌入的表示方法gydF4y2Ba
		CON_EM_WGTgydF4y2Ba	0.926 (0.883 - -0.969)gydF4y2Ba		0.282 (0.139 - -0.425)gydF4y2Ba		0.456 (0.282 - -0.630)gydF4y2Ba
		CON_EM_AVEgydF4y2Ba	0.915 (0.876 - -0.954)gydF4y2Ba		0.248 (0.156 - -0.340)gydF4y2Ba		0.413 (0.297 - -0.529)gydF4y2Ba
		ANT_EM_WGTgydF4y2Ba	0.919 (0.874 - -0.964)gydF4y2Ba		0.278 (0.133 - -0.423)gydF4y2Ba		0.455 (0.275 - -0.635)gydF4y2Ba
		ANT_EM_AVEgydF4y2Ba	0.912 (0.869 - -0.955)gydF4y2Ba		0.256 (0.162 - -0.350)gydF4y2Ba		0.423 (0.307 - -0.539)gydF4y2Ba
		RAN_EM_WGTgydF4y2Ba	0.915 (0.868 - -0.962)gydF4y2Ba		0.248 (0.119 - -0.377)gydF4y2Ba		0.416 (0.238 - -0.594)gydF4y2Ba
		RAN_EM_AVEgydF4y2Ba	0.897 (0.850 - -0.944)gydF4y2Ba		0.225 (0.133 - -0.317)gydF4y2Ba		0.385 (0.265 - -0.505)gydF4y2Ba
	引用表示方法gydF4y2Ba
		DIS_AEgydF4y2Ba	0.884 (0.845 - -0.923)gydF4y2Ba		0.207 (0.144 - -0.270)gydF4y2Ba		0.361 (0.279 - -0.443)gydF4y2Ba
		DIS_FSgydF4y2Ba	0.903 (0.862 - -0.944)gydF4y2Ba		0.214 (0.124 - -0.304)gydF4y2Ba		0.367 (0.236 - -0.498)gydF4y2Ba
		离散化gydF4y2Ba	0.905 (0.862 - -0.948)gydF4y2Ba		0.224 (0.122 - -0.326)gydF4y2Ba		0.381 (0.238 - -0.524)gydF4y2Ba
		混合物gydF4y2Ba	0.867 (0.806 - -0.928)gydF4y2Ba		0.202 (0.116 - -0.288)gydF4y2Ba		0.356 (0.227 - -0.485)gydF4y2Ba

^{一个gydF4y2Ba}AUROC:受试者工作特征曲线下的面积。gydF4y2Ba

^bgydF4y2BaAUPRC:精确召回曲线下的面积。gydF4y2Ba

^cgydF4y2BaCON_EM_WGT:基于结果的嵌入表示的加权和。gydF4y2Ba

^dgydF4y2BaCON_EM_AVE:基于结果的嵌入表示的平均值。gydF4y2Ba

^egydF4y2BaANT_EM_WGT:基于前项的嵌入表示的加权和。gydF4y2Ba

^fgydF4y2BaANT_EM_AVE:基于前项的嵌入表示的平均值。gydF4y2Ba

^ggydF4y2BaRAN_EM_WGT:基于随机选择的嵌入表示的加权和。gydF4y2Ba

^hgydF4y2BaRAN_EM_AVE:基于随机选择的嵌入表示的平均值。gydF4y2Ba

^我gydF4y2BaDIS_AE:带有特征选择的离散化表示。gydF4y2Ba

^jgydF4y2BaDIS_FS:基于自编码器的表示的隐藏向量。gydF4y2Ba

预测模型解释gydF4y2Ba

图4gydF4y2Ba说明了预测住院死亡风险时来自私人数据集中的前20个最重要特征的全球特征归因。治疗相关特征在死亡率预测中发挥了重要作用。这些特征包括其他手术(平均绝对SHAP值:0.413)、诊断性超声(0.279)、造影剂心血管造影(0.197)等(gydF4y2Ba 图4gydF4y2Ba此外，高血压(平均绝对SHAP值:0.252)和心脏病并发症(0.236)等共病以及血清葡萄糖(0.188)和血清乳酸脱氢酶(0.139)等实验室检查与住院死亡有很强的相关性(gydF4y2Ba 图4gydF4y2BaB).公共数据集中特征的SHAP值如gydF4y2Ba 多媒体附件6gydF4y2Ba．gydF4y2Ba

除了特征在特定预测任务中的全局重要性外，SHAP值还有助于区分特征的局部重要性，即对单个样本的重要性。gydF4y2Ba 图5gydF4y2Ba说明了如何用SHAP值预测在住院期间死亡的患者和另一名未死亡的患者的死亡风险。住院期间死亡患者的大多数特征的阳性SHAP值使总SHAP值从平均值−3.739增加到最终值−0.499 (gydF4y2Ba 图5gydF4y2BaA和5C)，这意味着患者的住院死亡风险高于平均水平。在这个增量过程中，性别如女性贡献了+0.21的SHAP值(gydF4y2Ba 图5gydF4y2BaC)。相反，活着出院的患者的大多数特征的阴性SHAP值使总SHAP值从−3.739降低到−6.169 (gydF4y2Ba 图5gydF4y2BaB和5D)，表明死亡风险较低。在此递减过程中，男性贡献的SHAP值为−0.09 (gydF4y2Ba 图5gydF4y2BaD).我们从公共数据集中展示了2个患者的例子gydF4y2Ba 多媒体gydF4y2Ba．gydF4y2Ba

图4gydF4y2Ba

整个特征集(A)和无处理特征集(B)中私有数据集的前20个特征的平均绝对Shapley相加解释(SHAP)值。gydF4y2Ba

图5gydF4y2Ba

Shapley相加解释(SHAP)值为一名在住院期间死亡的患者(a和C)和另一名未死亡的患者(B和D)。这两名患者都是从具有整个特征集的私有数据集中选择的。A和B，所有特征及其SHAP值。C和D, 20个绝对SHAP值最大的特征。蓝色特征倾向于降低患者被分类为阳性(本研究中死亡)的可能性，而红色特征则相反。每个缩写特性名称的含义可以在gydF4y2Ba 多媒体附件1gydF4y2Ba．gydF4y2Ba

讨论gydF4y2Ba 主要研究结果gydF4y2Ba

随着EMR数据在构建基于机器学习的预测模型中的广泛采用，最基本的研究挑战之一是学习适当的患者表示，这可能会捕获医学概念之间隐藏的语义关联[gydF4y2Ba 18gydF4y2Ba］．在本研究中，我们提出了一种改进的基于skip-gram的患者表示方法，该方法融合了医学概念之间的关联强度和任务特定特征的重要性。与其他表示方法相比，所提出的患者表示方法提高了AMI患者死亡风险预测的性能。gydF4y2Ba

在之前的研究中，深度学习模型[gydF4y2Ba 9gydF4y2Ba，gydF4y2Ba 10gydF4y2Ba，gydF4y2Ba 12gydF4y2Ba，gydF4y2Ba 25gydF4y2Ba，gydF4y2Ba 36gydF4y2Ba]被用于训练嵌入医学概念表征，以用于后续的患者表征。在使用skip-gram算法时，与特征相关性无关的医学概念顺序阻碍了算法学习高质量的表示。之前的工作建议对患者记录中的医疗概念进行洗牌机制，以减少乱序特征对算法的影响[gydF4y2Ba 12gydF4y2Ba，gydF4y2Ba 24gydF4y2Ba-gydF4y2Ba 26gydF4y2Ba］．在本研究中，我们引入了两个概念之间的关联强度，将其定义为仅涉及这两个概念的关联规则的置信度。从各个方面的实验表明，这种巧妙的改进可以有效地揭示医学概念之间的潜在关联，并进一步提高下游预测任务的性能。gydF4y2Ba

除了表示算法，用于表示患者的特征也很关键。以前的许多研究集中在原始形式的医疗代码中的一些特征，如疾病诊断、程序和药物[gydF4y2Ba 1gydF4y2Ba，gydF4y2Ba 11gydF4y2Ba，gydF4y2Ba 14gydF4y2Ba，gydF4y2Ba 37gydF4y2Ba］．对于包含大量患者诊断和预后相关信息的实验室检测，我们将实验室检测的正常状态纳入特征集，而不是简单地使用实验室检测和检测共发生的数量[gydF4y2Ba 12gydF4y2Ba，gydF4y2Ba 38gydF4y2Ba］．我们进一步从自由文本的放射报告中提取放射学特征。诚然，更丰富的特征可能会导致具有更多信息的特征表示，即使患者表示的维度保持不变。在这项研究中，使用更多特征来代表患者的预测模型确实反映了更多关于患者的信息，并且比使用较少特征的预测模型表现出更高的性能。我们的发现与其他研究的结果相似[gydF4y2Ba 39gydF4y2Ba，gydF4y2Ba 40gydF4y2Ba］．gydF4y2Ba

先前的研究使用神经网络利用EMR数据训练临床结果的预测模型[gydF4y2Ba 2gydF4y2Ba，gydF4y2Ba 16gydF4y2Ba，gydF4y2Ba 22gydF4y2Ba］．他们专注于建立在大型数据集上的端到端预测模型，其中神经网络的最后一个隐藏层被视为患者表示。虽然基于深度端到端神经网络的患者表示提高了预测精度，但不可忽视的是可解释性的缺乏。一些研究[gydF4y2Ba 26gydF4y2Ba，gydF4y2Ba 41gydF4y2Ba]使用词嵌入方法学习到的概念表征的平均值构建患者表征，没有充分利用不同临床特征对患者的重要性。作为一种高级解释性方法，SHAP值[gydF4y2Ba 32gydF4y2Ba]在之前的一些研究中成功地用于分析和解释预测模型[gydF4y2Ba 40gydF4y2Ba，gydF4y2Ba 42gydF4y2Ba-gydF4y2Ba 44gydF4y2Ba］．我们将SHAP值作为特征重要性引入到患者表征中，并进一步解释了使用SHAP值的预测模型。利用SHAP值不仅可以对预测任务的整体重要性进行排序和确定重要因素，还可以探索预测特定患者死亡风险的关键因素。在我们对AMI患者的预测任务中，由SHAP值确定的最重要特征确实与AMI密切相关[gydF4y2Ba 45gydF4y2Ba-gydF4y2Ba 47gydF4y2Ba]，如血清葡萄糖和血清肌酸激酶，这是临床实践中诊断AMI和预后的两项关键实验室检测。gydF4y2Ba

在我们的预测任务中，采用所提出的患者表征方法所代表的所有可用患者特征作为输入的模型比以往研究中相同任务的其他模型表现出更高的性能(AUROC, 0.973 vs 0.905至0.935 [gydF4y2Ba 19gydF4y2Ba，gydF4y2Ba 29gydF4y2Ba-gydF4y2Ba 31gydF4y2Ba，gydF4y2Ba 48gydF4y2Ba])。这可能是因为嵌入表示包含了从一般EMR系统中提取的大量不同特征，而许多研究人员在临床专家的协助下选择了与ami相关的特征。例如，基本的人口统计学数据和少量的实验室检查，以及AMI的Killip分级和左室射血分数等几个具体特征[gydF4y2Ba 19gydF4y2Ba，gydF4y2Ba 30.gydF4y2Ba]被直接添加到机器学习模型中，以预测死亡风险。此外，与主成分分析等其他简单的特征提取方法相比[gydF4y2Ba 29gydF4y2Ba]和3层自编码器模型，该方法考虑了关联强度和特征重要性，具有较高的预测性能。gydF4y2Ba

限制gydF4y2Ba

这项研究有一些局限性。首先，本研究只纳入患者住院期间的首次实验室检查，而很多患者进行了两次或两次以上的实验室检查。由于时间数据，特别是多个实验室检测，可能反映患者随时间变化的动态健康状态和治疗效果，因此患者表现中缺乏实验室检测的时间特征可能会导致下游任务的性能损失。未来的研究将集中于将这种不均匀和不规则的时间数据整合到当前的患者表现中。其次，采用跳图算法进行概念嵌入训练。该算法在自然语言处理领域很受欢迎，可能在表示结构化和无序EMR数据方面能力有限。基于变压器的训练前模型Med-Bert已被训练为表示最初以ICD-10和ICD-9编码表达的疾病诊断，在心力衰竭和胰腺癌预测任务中表现出更高的性能，auroc分别为85.39%和82.23% [gydF4y2Ba 49gydF4y2Ba］．因此，未来将采用更复杂的深度学习方法，以提供更丰富的患者信息。最后，我们仅对基于所提出的患者表示的预测模型进行了内部验证。高质量的外部验证将更有说服力，并将有助于持续的算法改进。此外，选择的性能比较参考方法是简单的特征选择方法和3层自编码器。需要与最先进的方法进行比较，以评估我们提出的方法的性能和潜在用途。gydF4y2Ba

结论gydF4y2Ba

在本研究中，我们利用医学概念的关联强度和患者特征的重要性来改进基于嵌入的患者表征。经过进一步的训练和微调，基于所提出的患者代表性的模型有望用于辅助AMI住院患者的预后预测。本研究为利用EMR数据开发更有效、更高效的临床预测模型提供了有意义的方向。患者代表学习作为建立临床结果预测模型的重要组成部分是可取的。gydF4y2Ba

多媒体附件1gydF4y2Ba

私有数据集中样本的患者特征。gydF4y2Ba

多媒体附件2gydF4y2Ba

公共MIMIC-III数据集中样本的患者特征。gydF4y2Ba

多媒体gydF4y2Ba

基于skip-gram的嵌入表示的预测性能与上下文窗口的大小和嵌入向量的维度的不同组合。gydF4y2Ba

多媒体附件4gydF4y2Ba

患者表示方法在公共数据集上的预测性能。gydF4y2Ba

多媒体gydF4y2Ba

患者表示方法在公共和私人数据集上的平均预测性能，有和没有治疗特征集。gydF4y2Ba

多媒体附件6gydF4y2Ba

整个特征集(A)和无处理特征集(B)中公共数据集前20个特征的平均绝对Shapley相加解释(SHAP)值。gydF4y2Ba

多媒体gydF4y2Ba

Shapley相加解释(SHAP)值为一个在住院期间死亡的患者(a和C)和另一个没有死亡的患者(B和D)来自具有整个特征集的公共数据集。gydF4y2Ba

缩写gydF4y2Ba

AMIgydF4y2Ba

急性心肌梗死gydF4y2Ba

阿里gydF4y2Ba

调整兰德指数gydF4y2Ba

AUPRCgydF4y2Ba

精度-召回曲线下的面积gydF4y2Ba

AUROCgydF4y2Ba

接收机工作特性曲线下面积gydF4y2Ba

EMRgydF4y2Ba

电子病历gydF4y2Ba

ICDgydF4y2Ba

《国际疾病分类》gydF4y2Ba

世鹏科技电子gydF4y2Ba

Shapley加法解释gydF4y2Ba

国家自然科学基金(No. 81971707)资助。gydF4y2Ba

没有宣布。gydF4y2Ba

1gydF4y2Ba

肖gydF4y2Ba

XgydF4y2Ba

魏gydF4y2Ba

GgydF4y2Ba

周gydF4y2Ba

lgydF4y2Ba

锅gydF4y2Ba

YgydF4y2Ba

京gydF4y2Ba

HgydF4y2Ba

赵gydF4y2Ba

EgydF4y2Ba

元gydF4y2Ba

YgydF4y2Ba

基于EHR映射PPD张量的卷积神经网络增强算法的治疗启动预测gydF4y2Ba

J生物医学信息gydF4y2Ba 2021gydF4y2Ba 08gydF4y2Ba 120gydF4y2Ba 103840gydF4y2Ba

10.1016 / j.jbi.2021.103840gydF4y2Ba

34139331gydF4y2Ba

s1532 - 0464 (21) 00169 - 6gydF4y2Ba

2gydF4y2Ba

李gydF4y2Ba

lgydF4y2Ba

姜gydF4y2Ba

YgydF4y2Ba

黄gydF4y2Ba

BgydF4y2Ba

基于transformer模型的季节性流感时间传播的长期预测gydF4y2Ba

J生物医学信息gydF4y2Ba 2021gydF4y2Ba 10gydF4y2Ba 122gydF4y2Ba 103894gydF4y2Ba

10.1016 / j.jbi.2021.103894gydF4y2Ba

34454080gydF4y2Ba

s1532 - 0464 (21) 00223 - 9gydF4y2Ba

3.gydF4y2Ba

妈gydF4y2Ba

HgydF4y2Ba

盛gydF4y2Ba

WgydF4y2Ba

李gydF4y2Ba

JgydF4y2Ba

侯gydF4y2Ba

lgydF4y2Ba

杨gydF4y2Ba

JgydF4y2Ba

蔡gydF4y2Ba

JgydF4y2Ba

徐gydF4y2Ba

WgydF4y2Ba

张gydF4y2Ba

年代gydF4y2Ba

多科室医院获得性静脉血栓栓塞风险评估的新型分层机器学习模型gydF4y2Ba

J生物医学信息gydF4y2Ba 2021gydF4y2Ba 10gydF4y2Ba 122gydF4y2Ba 103892gydF4y2Ba

10.1016 / j.jbi.2021.103892gydF4y2Ba

34454079gydF4y2Ba

s1532 - 0464 (21) 00221 - 5gydF4y2Ba

4gydF4y2Ba

唐gydF4y2Ba

ZgydF4y2Ba

余gydF4y2Ba

YgydF4y2Ba

NggydF4y2Ba

KgydF4y2Ba

播种gydF4y2Ba

DgydF4y2Ba

胡gydF4y2Ba

JgydF4y2Ba

梅gydF4y2Ba

JgydF4y2Ba

疾病网络描绘心血管疾病的疾病进展概况gydF4y2Ba

J生物医学信息gydF4y2Ba 2021gydF4y2Ba 03gydF4y2Ba 115gydF4y2Ba 103686gydF4y2Ba

10.1016 / j.jbi.2021.103686gydF4y2Ba

33493631gydF4y2Ba

s1532 - 0464 (21) 00015 - 0gydF4y2Ba

5gydF4y2Ba

陈gydF4y2Ba

PgydF4y2Ba

越南盾gydF4y2Ba

WgydF4y2Ba

陆gydF4y2Ba

XgydF4y2Ba

KaymakgydF4y2Ba

UgydF4y2Ba

他gydF4y2Ba

KgydF4y2Ba

黄gydF4y2Ba

ZgydF4y2Ba

基于深度表征学习的电子病历个体化治疗效果评估gydF4y2Ba

J生物医学信息gydF4y2Ba 2019gydF4y2Ba 12gydF4y2Ba One hundred.gydF4y2Ba 103303gydF4y2Ba

10.1016 / j.jbi.2019.103303gydF4y2Ba

31610264gydF4y2Ba

s1532 - 0464 (19) 30222 - 9gydF4y2Ba

6gydF4y2Ba

DligachgydF4y2Ba

DgydF4y2Ba

AfshargydF4y2Ba

米gydF4y2Ba

米勒gydF4y2Ba

TgydF4y2Ba

迈向临床文本编码器:临床自然语言处理应用于药物滥用的预训练gydF4y2Ba

美国医学信息协会gydF4y2Ba 2019gydF4y2Ba 11gydF4y2Ba 01gydF4y2Ba 26gydF4y2Ba 11gydF4y2Ba 1272gydF4y2Ba 1278gydF4y2Ba

10.1093 /地点/ ocz072gydF4y2Ba

31233140gydF4y2Ba

5522436gydF4y2Ba

PMC6798566gydF4y2Ba

7gydF4y2Ba

卡迈勒gydF4y2Ba

SAgydF4y2Ba

阴gydF4y2Ba

CgydF4y2Ba

钱gydF4y2Ba

BgydF4y2Ba

张gydF4y2Ba

PgydF4y2Ba

具有模式关注的可解释医疗风险预测模型gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2020gydF4y2Ba 12gydF4y2Ba 30.gydF4y2Ba 20.gydF4y2Ba 增刊11gydF4y2Ba 307gydF4y2Ba

10.1186 / s12911 - 020 - 01331 - 7gydF4y2Ba

33380322gydF4y2Ba

10.1186 / s12911 - 020 - 01331 - 7gydF4y2Ba

PMC7772928gydF4y2Ba

8gydF4y2Ba

张gydF4y2Ba

XgydF4y2Ba

周gydF4y2Ba

JgydF4y2Ba

梁gydF4y2Ba

JgydF4y2Ba

肖gydF4y2Ba

CgydF4y2Ba

赵gydF4y2Ba

YgydF4y2Ba

SarvagydF4y2Ba

HgydF4y2Ba

HenchcliffegydF4y2Ba

CgydF4y2Ba

王gydF4y2Ba

FgydF4y2Ba

使用纵向临床记录的帕金森病数据驱动分型:一项队列研究gydF4y2Ba

Sci代表gydF4y2Ba 2019gydF4y2Ba 01gydF4y2Ba 28gydF4y2Ba 9gydF4y2Ba 1gydF4y2Ba 797gydF4y2Ba

10.1038 / s41598 - 018 - 37545 - zgydF4y2Ba

30692568gydF4y2Ba

10.1038 / s41598 - 018 - 37545 - zgydF4y2Ba

PMC6349906gydF4y2Ba

9gydF4y2Ba

罗gydF4y2Ba

XgydF4y2Ba

甘地gydF4y2Ba

PgydF4y2Ba

张gydF4y2Ba

ZgydF4y2Ba

邵gydF4y2Ba

WgydF4y2Ba

汉gydF4y2Ba

ZgydF4y2Ba

ChandrasekarangydF4y2Ba

VgydF4y2Ba

TurzhitskygydF4y2Ba

VgydF4y2Ba

巴厘岛gydF4y2Ba

VgydF4y2Ba

罗伯茨gydF4y2Ba

基于“增大化现实”技术gydF4y2Ba

MetzgergydF4y2Ba

米gydF4y2Ba

贝克gydF4y2Ba

JgydF4y2Ba

La RosagydF4y2Ba

CgydF4y2Ba

韦弗gydF4y2Ba

JgydF4y2Ba

德克斯特gydF4y2Ba

PgydF4y2Ba

黄gydF4y2Ba

KgydF4y2Ba

应用可解释的深度学习模型识别慢性咳嗽患者使用电子病历数据gydF4y2Ba

计算方法程序生物医学gydF4y2Ba 2021gydF4y2Ba 10gydF4y2Ba 210gydF4y2Ba 106395gydF4y2Ba

10.1016 / j.cmpb.2021.106395gydF4y2Ba

34525412gydF4y2Ba

s0169 - 2607 (21) 00469 - 7gydF4y2Ba

10gydF4y2Ba

李gydF4y2Ba

ZgydF4y2Ba

罗伯茨gydF4y2Ba

KgydF4y2Ba

姜gydF4y2Ba

XgydF4y2Ba

长gydF4y2Ba

问gydF4y2Ba

来自多个EHR数据库的分布式学习:医疗事件的上下文嵌入模型gydF4y2Ba

J生物医学信息gydF4y2Ba 2019gydF4y2Ba 04gydF4y2Ba 92gydF4y2Ba 103138gydF4y2Ba

10.1016 / j.jbi.2019.103138gydF4y2Ba

30825539gydF4y2Ba

s1532 - 0464 (19) 30056 - 5gydF4y2Ba

PMC6533615gydF4y2Ba

11gydF4y2Ba

巴比里gydF4y2Ba

年代gydF4y2Ba

坎普gydF4y2Ba

JgydF4y2Ba

Perez-ConchagydF4y2Ba

OgydF4y2Ba

警察局长gydF4y2Ba

年代gydF4y2Ba

加拉格尔gydF4y2Ba

米gydF4y2Ba

里奇gydF4y2Ba

一个gydF4y2Ba

JormgydF4y2Ba

lgydF4y2Ba

对深度学习架构进行基准测试，用于预测再入院ICU和描述高危患者gydF4y2Ba

Sci代表gydF4y2Ba 2020gydF4y2Ba 01gydF4y2Ba 24gydF4y2Ba 10gydF4y2Ba 1gydF4y2Ba 1111gydF4y2Ba

10.1038 / s41598 - 020 - 58053 - zgydF4y2Ba

31980704gydF4y2Ba

10.1038 / s41598 - 020 - 58053 - zgydF4y2Ba

PMC6981230gydF4y2Ba

12gydF4y2Ba

斯坦伯格gydF4y2Ba

EgydF4y2Ba

荣格gydF4y2Ba

KgydF4y2Ba

薯条gydF4y2Ba

晶澳gydF4y2Ba

卡宾gydF4y2Ba

CKgydF4y2Ba

PfohlgydF4y2Ba

老gydF4y2Ba

沙阿gydF4y2Ba

NHgydF4y2Ba

语言模型是一种有效的电子病历数据表示学习技术gydF4y2Ba

J生物医学信息gydF4y2Ba 2021gydF4y2Ba 01gydF4y2Ba 113gydF4y2Ba 103637gydF4y2Ba

10.1016 / j.jbi.2020.103637gydF4y2Ba

33290879gydF4y2Ba

s1532 - 0464 (20) 30265 - 3gydF4y2Ba

PMC7863633gydF4y2Ba

13gydF4y2Ba

Carrasco-RibellesgydF4y2Ba

拉gydF4y2Ba

Pardo-MasgydF4y2Ba

小gydF4y2Ba

TortajadagydF4y2Ba

年代gydF4y2Ba

赛斯gydF4y2Ba

CgydF4y2Ba

ValdiviesogydF4y2Ba

BgydF4y2Ba

Garcia-GomezgydF4y2Ba

JMgydF4y2Ba

通过多尺度患者轨迹的局部相似性预测发病率gydF4y2Ba

J生物医学信息gydF4y2Ba 2021gydF4y2Ba 08gydF4y2Ba 120gydF4y2Ba 103837gydF4y2Ba

10.1016 / j.jbi.2021.103837gydF4y2Ba

34119690gydF4y2Ba

s1532 - 0464 (21) 00166 - 0gydF4y2Ba

14gydF4y2Ba

杨gydF4y2Ba

年代gydF4y2Ba

郑gydF4y2Ba

XgydF4y2Ba

霁gydF4y2Ba

CgydF4y2Ba

陈gydF4y2Ba

XgydF4y2Ba

多层表示学习及其在电子病历中的应用gydF4y2Ba

神经过程gydF4y2Ba 2021gydF4y2Ba 53gydF4y2Ba 2gydF4y2Ba 1417gydF4y2Ba 1433gydF4y2Ba

10.1007 / s11063 - 021 - 10449 - 2gydF4y2Ba

33623481gydF4y2Ba

10449gydF4y2Ba

PMC7891814gydF4y2Ba

15gydF4y2Ba

王gydF4y2Ba

ZgydF4y2Ba

王gydF4y2Ba

BgydF4y2Ba

周gydF4y2Ba

YgydF4y2Ba

李gydF4y2Ba

DgydF4y2Ba

阴gydF4y2Ba

YgydF4y2Ba

基于权重的邻域判别约束多重经验核学习在心衰死亡率预测中的应用gydF4y2Ba

J生物医学信息gydF4y2Ba 2020gydF4y2Ba 01gydF4y2Ba 101gydF4y2Ba 103340gydF4y2Ba

10.1016 / j.jbi.2019.103340gydF4y2Ba

31756495gydF4y2Ba

s1532 - 0464 (19) 30259 - xgydF4y2Ba

16gydF4y2Ba

RongaligydF4y2Ba

年代gydF4y2Ba

玫瑰gydF4y2Ba

AJgydF4y2Ba

麦克马纳斯gydF4y2Ba

DDgydF4y2Ba

Bajracharya表示gydF4y2Ba

作为gydF4y2Ba

卡普尔gydF4y2Ba

一个gydF4y2Ba

赛后gydF4y2Ba

EgydF4y2Ba

余gydF4y2Ba

HgydF4y2Ba

学习潜在空间表征以预测患者预后:模型开发和验证gydF4y2Ba

J医疗互联网服务gydF4y2Ba 2020gydF4y2Ba 03gydF4y2Ba 23gydF4y2Ba 22gydF4y2Ba 3.gydF4y2Ba e16374gydF4y2Ba

10.2196/16374gydF4y2Ba

32202503gydF4y2Ba

v22i3e16374gydF4y2Ba

PMC7136840gydF4y2Ba

17gydF4y2Ba

TahayorigydF4y2Ba

BgydF4y2Ba

Chini-ForoushgydF4y2Ba

NgydF4y2Ba

AkhlaghigydF4y2Ba

HgydF4y2Ba

先进的自然语言处理技术，可以根据急诊分诊记录预测病人的性格gydF4y2Ba

新兴的澳大利亚医学gydF4y2Ba 2021gydF4y2Ba 33gydF4y2Ba 3.gydF4y2Ba 480gydF4y2Ba 484gydF4y2Ba

10.1111 / 1742 - 6723.13656gydF4y2Ba

33043570gydF4y2Ba

18gydF4y2Ba

如果gydF4y2Ba

YgydF4y2Ba

杜gydF4y2Ba

JgydF4y2Ba

李gydF4y2Ba

ZgydF4y2Ba

姜gydF4y2Ba

XgydF4y2Ba

米勒gydF4y2Ba

TgydF4y2Ba

王gydF4y2Ba

FgydF4y2Ba

吉姆郑gydF4y2Ba

WgydF4y2Ba

罗伯茨gydF4y2Ba

KgydF4y2Ba

电子健康记录(EHR)中患者数据的深度表示学习:一项系统综述gydF4y2Ba

J生物医学信息gydF4y2Ba 2021gydF4y2Ba 03gydF4y2Ba 115gydF4y2Ba 103671gydF4y2Ba

10.1016 / j.jbi.2020.103671gydF4y2Ba

33387683gydF4y2Ba

s1532 - 0464 (20) 30299 - 9gydF4y2Ba

19gydF4y2Ba

KwongydF4y2Ba

JgydF4y2Ba

宋ydF4y2Ba

KgydF4y2Ba

金gydF4y2Ba

嗯gydF4y2Ba

金gydF4y2Ba

乔丹gydF4y2Ba

LimgydF4y2Ba

年代gydF4y2Ba

金gydF4y2Ba

KgydF4y2Ba

首歌gydF4y2Ba

PSgydF4y2Ba

公园gydF4y2Ba

JgydF4y2Ba

崔gydF4y2Ba

RKgydF4y2Ba

哦gydF4y2Ba

BgydF4y2Ba

基于深度学习的急性心肌梗死患者死亡风险分层gydF4y2Ba

《公共科学图书馆•综合》gydF4y2Ba 2019gydF4y2Ba 14gydF4y2Ba 10gydF4y2Ba e0224502gydF4y2Ba

10.1371 / journal.pone.0224502gydF4y2Ba

31671144gydF4y2Ba

玉米饼- d - 19 - 14012gydF4y2Ba

PMC6822714gydF4y2Ba

20.gydF4y2Ba

阮gydF4y2Ba

TgydF4y2Ba

LeigydF4y2Ba

lgydF4y2Ba

周gydF4y2Ba

YgydF4y2Ba

翟gydF4y2Ba

JgydF4y2Ba

张gydF4y2Ba

lgydF4y2Ba

他gydF4y2Ba

PgydF4y2Ba

高gydF4y2Ba

JgydF4y2Ba

电子病历中临床时间序列预测任务的表征学习gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2019gydF4y2Ba 12gydF4y2Ba 17gydF4y2Ba 19gydF4y2Ba 5 8gydF4y2Ba 259gydF4y2Ba

10.1186 / s12911 - 019 - 0985 - 7gydF4y2Ba

31842854gydF4y2Ba

10.1186 / s12911 - 019 - 0985 - 7gydF4y2Ba

PMC6916209gydF4y2Ba

21gydF4y2Ba

赵gydF4y2Ba

JgydF4y2Ba

PapapetrougydF4y2Ba

PgydF4y2Ba

发问者gydF4y2Ba

lgydF4y2Ba

博斯特罗姆gydF4y2Ba

HgydF4y2Ba

从电子健康记录中的异构时间数据中学习gydF4y2Ba

J生物医学信息gydF4y2Ba 2017gydF4y2Ba 01gydF4y2Ba 65gydF4y2Ba 105gydF4y2Ba 119gydF4y2Ba

10.1016 / j.jbi.2016.11.006gydF4y2Ba

27919732gydF4y2Ba

s1532 - 0464 (16) 30165 - 4gydF4y2Ba

22gydF4y2Ba

MoridgydF4y2Ba

妈gydF4y2Ba

盛gydF4y2Ba

ORLgydF4y2Ba

川gydF4y2Ba

KgydF4y2Ba

AbdelrahmangydF4y2Ba

年代gydF4y2Ba

使用卷积神经网络从患者多元时间序列数据中学习隐藏模式:医疗成本预测的案例研究gydF4y2Ba

J生物医学信息gydF4y2Ba 2020gydF4y2Ba 11gydF4y2Ba 111gydF4y2Ba 103565gydF4y2Ba

10.1016 / j.jbi.2020.103565gydF4y2Ba

32980530gydF4y2Ba

s1532 - 0464 (20) 30193 - 3gydF4y2Ba

23gydF4y2Ba

MikolovgydF4y2Ba

TgydF4y2Ba

SutskevergydF4y2Ba

我gydF4y2Ba

陈gydF4y2Ba

KgydF4y2Ba

柯拉gydF4y2Ba

GgydF4y2Ba

迪安gydF4y2Ba

JgydF4y2Ba

单词和短语及其组合的分布式表示gydF4y2Ba

NIPS'13:第26届神经信息处理系统国际会议论文集-卷2gydF4y2Ba 2013gydF4y2Ba

第26届神经信息处理系统国际会议gydF4y2Ba

2013年12月5-10日gydF4y2Ba

内华达州的太浩湖gydF4y2Ba

3111gydF4y2Ba 3119gydF4y2Ba

10.5555/2999792.2999959gydF4y2Ba

24gydF4y2Ba

GlicksberggydF4y2Ba

废话gydF4y2Ba

MiottogydF4y2Ba

RgydF4y2Ba

约翰逊gydF4y2Ba

千瓦gydF4y2Ba

羞愧gydF4y2Ba

KgydF4y2Ba

李gydF4y2Ba

lgydF4y2Ba

陈gydF4y2Ba

RgydF4y2Ba

达德利gydF4y2Ba

JTgydF4y2Ba

利用电子健康记录中的词嵌入自动选择疾病队列gydF4y2Ba

Pac Symp BiocomputgydF4y2Ba 2018gydF4y2Ba 23gydF4y2Ba 145gydF4y2Ba 156gydF4y2Ba

29218877gydF4y2Ba

9789813235533 _0014gydF4y2Ba

PMC5788312gydF4y2Ba

25gydF4y2Ba

崔gydF4y2Ba

lgydF4y2Ba

谢gydF4y2Ba

XgydF4y2Ba

盛ydF4y2Ba

ZgydF4y2Ba

电子病历中预测任务引导的医疗代码表示学习gydF4y2Ba

J生物医学信息gydF4y2Ba 2018gydF4y2Ba 08gydF4y2Ba 84gydF4y2Ba 1gydF4y2Ba 10gydF4y2Ba

10.1016 / j.jbi.2018.06.013gydF4y2Ba

29928997gydF4y2Ba

s1532 - 0464 (18) 30119 - 9gydF4y2Ba

26gydF4y2Ba

黄gydF4y2Ba

YgydF4y2Ba

王gydF4y2Ba

NgydF4y2Ba

张gydF4y2Ba

ZgydF4y2Ba

刘gydF4y2Ba

HgydF4y2Ba

范gydF4y2Ba

XgydF4y2Ba

魏gydF4y2Ba

lgydF4y2Ba

陈gydF4y2Ba

HgydF4y2Ba

基于嵌入技术的结构化电子病历患者表示:开发和验证研究gydF4y2Ba

JMIR Med InformgydF4y2Ba 2021gydF4y2Ba 07gydF4y2Ba 23gydF4y2Ba 9gydF4y2Ba 7gydF4y2Ba e19905gydF4y2Ba

10.2196/19905gydF4y2Ba

34297000gydF4y2Ba

v9i7e19905gydF4y2Ba

PMC8367145gydF4y2Ba

27gydF4y2Ba

陈gydF4y2Ba

HgydF4y2Ba

史gydF4y2Ba

lgydF4y2Ba

雪gydF4y2Ba

米gydF4y2Ba

王gydF4y2Ba

NgydF4y2Ba

越南盾gydF4y2Ba

XgydF4y2Ba

蔡gydF4y2Ba

YgydF4y2Ba

陈gydF4y2Ba

JgydF4y2Ba

朱gydF4y2Ba

WgydF4y2Ba

徐gydF4y2Ba

HgydF4y2Ba

孟gydF4y2Ba

问gydF4y2Ba

中国急性心肌梗死后住院死亡率和经皮冠状动脉介入治疗的地理差异:一项全国性横断面分析gydF4y2Ba

美国心脏协会gydF4y2Ba 2018gydF4y2Ba 04gydF4y2Ba 17gydF4y2Ba 7gydF4y2Ba 8gydF4y2Ba 52gydF4y2Ba 62gydF4y2Ba

10.1161 / JAHA.117.008131gydF4y2Ba

28gydF4y2Ba

GBD 2013年死亡原因合作者gydF4y2Ba

1990-2013年全球、区域和国家240种死因的按年龄性别划分的全因和按原因划分的死亡率:2013年全球疾病负担研究的系统分析gydF4y2Ba

《柳叶刀》gydF4y2Ba 2015gydF4y2Ba 01gydF4y2Ba 10gydF4y2Ba 385gydF4y2Ba 9963gydF4y2Ba 117gydF4y2Ba 171gydF4y2Ba

10.1016 / s0140 - 6736 (14) 61682 - 2gydF4y2Ba

25530442gydF4y2Ba

s0140 - 6736 (14) 61682 - 2gydF4y2Ba

PMC4340604gydF4y2Ba

29gydF4y2Ba

李gydF4y2Ba

HCgydF4y2Ba

公园gydF4y2Ba

JSgydF4y2Ba

崔书记gydF4y2Ba

JCgydF4y2Ba

安gydF4y2Ba

JHgydF4y2Ba

李gydF4y2Ba

HWgydF4y2Ba

哦gydF4y2Ba

JgydF4y2Ba

崔gydF4y2Ba

JHgydF4y2Ba

查gydF4y2Ba

KSgydF4y2Ba

在香港gydF4y2Ba

TJgydF4y2Ba

宋gydF4y2Ba

MHgydF4y2Ba

韩国急性心肌梗死登记(KAMIR)韩国心肌梗死工作组(KorMI)调查人员gydF4y2Ba

利用机器学习预测急性心肌梗死1年死亡率gydF4y2Ba

Am J CardiolgydF4y2Ba 2020gydF4y2Ba 10gydF4y2Ba 15gydF4y2Ba 133gydF4y2Ba 23gydF4y2Ba 31gydF4y2Ba

10.1016 / j.amjcard.2020.07.048gydF4y2Ba

32811651gydF4y2Ba

s0002 - 9149 (20) 30783 - 9gydF4y2Ba

30.gydF4y2Ba

阿齐兹gydF4y2Ba

FgydF4y2Ba

马列gydF4y2Ba

年代gydF4y2Ba

易卜拉欣gydF4y2Ba

KSgydF4y2Ba

拉贾ShariffgydF4y2Ba

再保险gydF4y2Ba

Wan艾哈迈德gydF4y2Ba

佤邦gydF4y2Ba

阿里gydF4y2Ba

RMgydF4y2Ba

刘gydF4y2Ba

KTgydF4y2Ba

一位gydF4y2Ba

GgydF4y2Ba

KasimgydF4y2Ba

年代gydF4y2Ba

亚洲人急性st段抬高型心肌梗死(STEMI)后的短期和长期死亡率预测:机器学习方法gydF4y2Ba

《公共科学图书馆•综合》gydF4y2Ba 2021gydF4y2Ba 16gydF4y2Ba 8gydF4y2Ba e0254894gydF4y2Ba

10.1371 / journal.pone.0254894gydF4y2Ba

34339432gydF4y2Ba

玉米饼- d - 21 - 01510gydF4y2Ba

PMC8328310gydF4y2Ba

31gydF4y2Ba

王gydF4y2Ba

问gydF4y2Ba

钱gydF4y2Ba

WgydF4y2Ba

太阳gydF4y2Ba

ZgydF4y2Ba

朱gydF4y2Ba

WgydF4y2Ba

刘gydF4y2Ba

YgydF4y2Ba

陈gydF4y2Ba

XgydF4y2Ba

霁gydF4y2Ba

YgydF4y2Ba

太阳gydF4y2Ba

lgydF4y2Ba

基于术前参数的nomogram预测急性心肌梗死患者有创治疗的短期死亡率gydF4y2Ba

老龄化(纽约州奥尔巴尼)gydF4y2Ba 2020gydF4y2Ba 12gydF4y2Ba 11gydF4y2Ba 13gydF4y2Ba 2gydF4y2Ba 2184gydF4y2Ba 2197gydF4y2Ba

10.18632 / aging.202230gydF4y2Ba

33323557gydF4y2Ba

202230gydF4y2Ba

PMC7880403gydF4y2Ba

32gydF4y2Ba

LundberggydF4y2Ba

SMgydF4y2Ba

李gydF4y2Ba

如果gydF4y2Ba

解释模型预测的统一方法gydF4y2Ba

NIPS'17:神经信息处理系统第31届国际会议论文集gydF4y2Ba 2017gydF4y2Ba

第31届神经信息处理系统国际会议gydF4y2Ba

2017年12月4日至9日gydF4y2Ba

加州长滩gydF4y2Ba

4768gydF4y2Ba 4777gydF4y2Ba

10.5555 / 3295222gydF4y2Ba

33gydF4y2Ba

重症监护医疗信息集市gydF4y2Ba 2022-07-23gydF4y2Ba

https://mimic.mit.edu/gydF4y2Ba

34gydF4y2Ba

王gydF4y2Ba

NgydF4y2Ba

王gydF4y2Ba

米gydF4y2Ba

周gydF4y2Ba

YgydF4y2Ba

刘gydF4y2Ba

HgydF4y2Ba

魏gydF4y2Ba

lgydF4y2Ba

范gydF4y2Ba

XgydF4y2Ba

陈gydF4y2Ba

HgydF4y2Ba

基于序贯数据的患者相似度框架用于患者结局预测:算法开发gydF4y2Ba

J医疗互联网服务gydF4y2Ba 2022gydF4y2Ba 01gydF4y2Ba 06gydF4y2Ba 24gydF4y2Ba 1gydF4y2Ba e30720gydF4y2Ba

10.2196/30720gydF4y2Ba

34989682gydF4y2Ba

v24i1e30720gydF4y2Ba

PMC8778569gydF4y2Ba

35gydF4y2Ba

谢gydF4y2Ba

JgydF4y2Ba

高gydF4y2Ba

HgydF4y2Ba

谢gydF4y2Ba

WgydF4y2Ba

刘gydF4y2Ba

XgydF4y2Ba

格兰特gydF4y2Ba

PWgydF4y2Ba

通过检测密度峰值和基于模糊加权k近邻分配点的鲁棒聚类gydF4y2Ba

信息科学gydF4y2Ba 2016gydF4y2Ba 08gydF4y2Ba 354gydF4y2Ba 19gydF4y2Ba 40gydF4y2Ba

10.1016 / j.ins.2016.03.011gydF4y2Ba

36gydF4y2Ba

王gydF4y2Ba

lgydF4y2Ba

王gydF4y2Ba

问gydF4y2Ba

白gydF4y2Ba

HgydF4y2Ba

刘gydF4y2Ba

CgydF4y2Ba

刘gydF4y2Ba

WgydF4y2Ba

张gydF4y2Ba

YgydF4y2Ba

姜gydF4y2Ba

lgydF4y2Ba

徐gydF4y2Ba

HgydF4y2Ba

王gydF4y2Ba

KgydF4y2Ba

周gydF4y2Ba

YgydF4y2Ba

基于自我注意机制的临床病历时间模式医学概念表征学习gydF4y2Ba

麝猫面前gydF4y2Ba 2020gydF4y2Ba 11gydF4y2Ba 630gydF4y2Ba

10.3389 / fgene.2020.00630gydF4y2Ba

32714371gydF4y2Ba

PMC7344186gydF4y2Ba

37gydF4y2Ba

白gydF4y2Ba

TgydF4y2Ba

钱德gydF4y2Ba

正义与发展党gydF4y2Ba

EglestongydF4y2Ba

提单gydF4y2Ba

VuceticgydF4y2Ba

年代gydF4y2Ba

通过联合将医学概念和词汇嵌入统一的向量空间，实现EHR表型gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2018gydF4y2Ba 12gydF4y2Ba 12gydF4y2Ba 18gydF4y2Ba 附加的4gydF4y2Ba 123gydF4y2Ba

10.1186 / s12911 - 018 - 0672 - 0gydF4y2Ba

30537974gydF4y2Ba

10.1186 / s12911 - 018 - 0672 - 0gydF4y2Ba

PMC6290514gydF4y2Ba

38gydF4y2Ba

MiottogydF4y2Ba

RgydF4y2Ba

李gydF4y2Ba

lgydF4y2Ba

基德gydF4y2Ba

英航gydF4y2Ba

达德利gydF4y2Ba

JTgydF4y2Ba

深度患者:从电子健康记录中预测患者未来的无监督表示gydF4y2Ba

Sci代表gydF4y2Ba 2016gydF4y2Ba 05gydF4y2Ba 17gydF4y2Ba 6gydF4y2Ba 26094gydF4y2Ba

10.1038 / srep26094gydF4y2Ba

27185194gydF4y2Ba

srep26094gydF4y2Ba

PMC4869115gydF4y2Ba

39gydF4y2Ba

张gydF4y2Ba

DgydF4y2Ba

阴gydF4y2Ba

CgydF4y2Ba

曾gydF4y2Ba

JgydF4y2Ba

元gydF4y2Ba

XgydF4y2Ba

张gydF4y2Ba

PgydF4y2Ba

为预测模型结合结构化和非结构化数据:一种深度学习方法gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2020gydF4y2Ba 10gydF4y2Ba 29gydF4y2Ba 20.gydF4y2Ba 1gydF4y2Ba 280gydF4y2Ba

10.1186 / s12911 - 020 - 01297 - 6gydF4y2Ba

33121479gydF4y2Ba

10.1186 / s12911 - 020 - 01297 - 6gydF4y2Ba

PMC7596962gydF4y2Ba

40gydF4y2Ba

徐gydF4y2Ba

YgydF4y2Ba

刘gydF4y2Ba

XgydF4y2Ba

锅gydF4y2Ba

lgydF4y2Ba

毛gydF4y2Ba

XgydF4y2Ba

梁gydF4y2Ba

HgydF4y2Ba

王gydF4y2Ba

GgydF4y2Ba

陈gydF4y2Ba

TgydF4y2Ba

可解释的动态多模态变分自编码器用于预测疑似中枢性性早熟患者gydF4y2Ba

IEEE J.生物医学。健康告知gydF4y2Ba 2022gydF4y2Ba 3.gydF4y2Ba 26gydF4y2Ba 3.gydF4y2Ba 1362gydF4y2Ba 1373gydF4y2Ba

10.1109 / jbhi.2021.3103271gydF4y2Ba

41gydF4y2Ba

崔gydF4y2Ba

EgydF4y2Ba

SchuetzgydF4y2Ba

一个gydF4y2Ba

斯图尔特gydF4y2Ba

WFgydF4y2Ba

太阳gydF4y2Ba

JgydF4y2Ba

电子病历医学概念表征学习及其在心力衰竭预测中的应用gydF4y2Ba

arXivgydF4y2Ba 2016gydF4y2Ba

2022-07-19gydF4y2Ba

https://arxiv.org/abs/1602.03686gydF4y2Ba

42gydF4y2Ba

穆勒gydF4y2Ba

米gydF4y2Ba

GromichogydF4y2Ba

米gydF4y2Ba

德·卡瓦略gydF4y2Ba

米gydF4y2Ba

马德拉gydF4y2Ba

SCgydF4y2Ba

ALS疾病进展的可解释模型:使用循环神经网络和深度模型解释从纵向临床数据中学习gydF4y2Ba

生物医学中的计算机方法与程序gydF4y2Ba 2021gydF4y2Ba 1gydF4y2Ba 100018gydF4y2Ba

10.1016 / j.cmpbup.2021.100018gydF4y2Ba

43gydF4y2Ba

LundberggydF4y2Ba

SMgydF4y2Ba

不gydF4y2Ba

GgydF4y2Ba

陈gydF4y2Ba

HgydF4y2Ba

DeGravegydF4y2Ba

一个gydF4y2Ba

PrutkingydF4y2Ba

JMgydF4y2Ba

奈尔gydF4y2Ba

BgydF4y2Ba

卡茨gydF4y2Ba

RgydF4y2Ba

HimmelfarbgydF4y2Ba

JgydF4y2Ba

邦萨尔gydF4y2Ba

NgydF4y2Ba

李gydF4y2Ba

年代gydF4y2Ba

从局部解释到对树木的可解释人工智能的全球理解gydF4y2Ba

Nat Mach intelgydF4y2Ba 2020gydF4y2Ba 01gydF4y2Ba 2gydF4y2Ba 1gydF4y2Ba 56gydF4y2Ba 67gydF4y2Ba

10.1038 / s42256 - 019 - 0138 - 9gydF4y2Ba

32607472gydF4y2Ba

PMC7326367gydF4y2Ba

44gydF4y2Ba

LundberggydF4y2Ba

SMgydF4y2Ba

奈尔gydF4y2Ba

BgydF4y2Ba

VavilalagydF4y2Ba

女士gydF4y2Ba

HoribegydF4y2Ba

米gydF4y2Ba

eisgydF4y2Ba

乔丹gydF4y2Ba

亚当斯gydF4y2Ba

TgydF4y2Ba

利斯顿gydF4y2Ba

德gydF4y2Ba

低gydF4y2Ba

DKWgydF4y2Ba

纽曼gydF4y2Ba

年代gydF4y2Ba

金gydF4y2Ba

JgydF4y2Ba

李gydF4y2Ba

年代gydF4y2Ba

可解释的机器学习预测用于预防手术中低氧血症gydF4y2Ba

Nat Biomed EnggydF4y2Ba 2018gydF4y2Ba 10gydF4y2Ba 2gydF4y2Ba 10gydF4y2Ba 749gydF4y2Ba 760gydF4y2Ba

10.1038 / s41551 - 018 - 0304 - 0gydF4y2Ba

31001455gydF4y2Ba

10.1038 / s41551 - 018 - 0304 - 0gydF4y2Ba

PMC6467492gydF4y2Ba

45gydF4y2Ba

平托gydF4y2Ba

DSgydF4y2Ba

格兰丁gydF4y2Ba

电子战gydF4y2Ba

AMI休克的风险预测:金发女孩和“刚刚好”的寻找gydF4y2Ba

J Am Coll CardiolgydF4y2Ba 2017gydF4y2Ba 04gydF4y2Ba 18gydF4y2Ba 69gydF4y2Ba 15gydF4y2Ba 1921gydF4y2Ba 1923gydF4y2Ba

10.1016 / j.jacc.2017.02.024gydF4y2Ba

28408021gydF4y2Ba

s0735 - 1097 (17) 30674 - 5gydF4y2Ba

46gydF4y2Ba

叶gydF4y2Ba

RWgydF4y2Ba

西德尼gydF4y2Ba

年代gydF4y2Ba

钱德拉gydF4y2Ba

米gydF4y2Ba

雄鹿gydF4y2Ba

米gydF4y2Ba

塞尔比gydF4y2Ba

合资企业gydF4y2Ba

去gydF4y2Ba

作为gydF4y2Ba

急性心肌梗死发病率和转归的人群趋势gydF4y2Ba

N英语J医学gydF4y2Ba 2010gydF4y2Ba 06gydF4y2Ba 10gydF4y2Ba 362gydF4y2Ba 23gydF4y2Ba 2155gydF4y2Ba 2165gydF4y2Ba

10.1056 / nejmoa0908610gydF4y2Ba

47gydF4y2Ba

钱币兑换商gydF4y2Ba

GRgydF4y2Ba

弗雷德里克gydF4y2Ba

PDgydF4y2Ba

赫尔佐格gydF4y2Ba

CAgydF4y2Ba

肾功能衰竭和急性心肌梗死:晚期慢性肾脏疾病、透析和无慢性肾脏疾病患者的临床特征美国肾脏数据系统/国立卫生研究院和国家心肌梗死登记处的合作项目gydF4y2Ba

Am Heart JgydF4y2Ba 2012gydF4y2Ba 03gydF4y2Ba 163gydF4y2Ba 3.gydF4y2Ba 399gydF4y2Ba 406gydF4y2Ba

10.1016 / j.ahj.2011.12.002gydF4y2Ba

22424010gydF4y2Ba

s0002 00883 - 0 - 8703 (11)gydF4y2Ba

PMC3313453gydF4y2Ba

48gydF4y2Ba

D 'AscenzogydF4y2Ba

FgydF4y2Ba

德菲利波gydF4y2Ba

OgydF4y2Ba

GallonegydF4y2Ba

GgydF4y2Ba

MittonegydF4y2Ba

GgydF4y2Ba

DeriugydF4y2Ba

米gydF4y2Ba

IannacconegydF4y2Ba

米gydF4y2Ba

Ariza-SolegydF4y2Ba

一个gydF4y2Ba

LiebetraugydF4y2Ba

CgydF4y2Ba

Manzano-FernandezgydF4y2Ba

年代gydF4y2Ba

表示“四”gydF4y2Ba

GgydF4y2Ba

金奈尔德gydF4y2Ba

TgydF4y2Ba

坎波gydF4y2Ba

GgydF4y2Ba

西芒戴安娜gydF4y2Ba

JgydF4y2Ba

休斯gydF4y2Ba

JgydF4y2Ba

Dominguez-RodriguezgydF4y2Ba

一个gydF4y2Ba

AldinuccigydF4y2Ba

米gydF4y2Ba

MorbiduccigydF4y2Ba

UgydF4y2Ba

帕蒂gydF4y2Ba

GgydF4y2Ba

Raposeiras-RoubingydF4y2Ba

年代gydF4y2Ba

Abu-AssigydF4y2Ba

EgydF4y2Ba

De法拉利gydF4y2Ba

GgydF4y2Ba

PiroligydF4y2Ba

FgydF4y2Ba

SagliettogydF4y2Ba

一个gydF4y2Ba

ConrottogydF4y2Ba

FgydF4y2Ba

OmedegydF4y2Ba

PgydF4y2Ba

MontefuscogydF4y2Ba

一个gydF4y2Ba

PennonegydF4y2Ba

米gydF4y2Ba

布鲁诺gydF4y2Ba

FgydF4y2Ba

BocchinogydF4y2Ba

PgydF4y2Ba

BoccuzzigydF4y2Ba

GgydF4y2Ba

CerratogydF4y2Ba

EgydF4y2Ba

VarbellagydF4y2Ba

FgydF4y2Ba

SpertigydF4y2Ba

米gydF4y2Ba

威尔顿gydF4y2Ba

年代gydF4y2Ba

VelickigydF4y2Ba

lgydF4y2Ba

XanthopoulougydF4y2Ba

我gydF4y2Ba

CequiergydF4y2Ba

一个gydF4y2Ba

Iniguez-RomogydF4y2Ba

一个gydF4y2Ba

穆尼奥斯PousagydF4y2Ba

我gydF4y2Ba

Cespon费尔南德斯gydF4y2Ba

米gydF4y2Ba

Caneiro QueijagydF4y2Ba

BgydF4y2Ba

Cobas-PazgydF4y2Ba

RgydF4y2Ba

Lopez-CuencagydF4y2Ba

一个gydF4y2Ba

浏览完gydF4y2Ba

一个gydF4y2Ba

布兰科gydF4y2Ba

PgydF4y2Ba

RognonigydF4y2Ba

一个gydF4y2Ba

他满ZoccaigydF4y2Ba

GgydF4y2Ba

BiscagliagydF4y2Ba

年代gydF4y2Ba

Nunez-GilgydF4y2Ba

我gydF4y2Ba

藤井裕久gydF4y2Ba

TgydF4y2Ba

杜兰特gydF4y2Ba

一个gydF4y2Ba

首歌gydF4y2Ba

XgydF4y2Ba

KawajigydF4y2Ba

TgydF4y2Ba

AlexopoulosgydF4y2Ba

DgydF4y2Ba

HuczekgydF4y2Ba

ZgydF4y2Ba

冈萨雷斯JuanateygydF4y2Ba

JgydF4y2Ba

聂gydF4y2Ba

年代gydF4y2Ba

KawashirigydF4y2Ba

米gydF4y2Ba

ColonnelligydF4y2Ba

我gydF4y2Ba

坎塔卢波gydF4y2Ba

BgydF4y2Ba

埃斯波西托gydF4y2Ba

RgydF4y2Ba

LeonardigydF4y2Ba

年代gydF4y2Ba

格罗索马拉gydF4y2Ba

WgydF4y2Ba

ChieffogydF4y2Ba

一个gydF4y2Ba

MicheluccigydF4y2Ba

UgydF4y2Ba

PigagydF4y2Ba

DgydF4y2Ba

MalavoltagydF4y2Ba

米gydF4y2Ba

吉利·gydF4y2Ba

年代gydF4y2Ba

MennunigydF4y2Ba

米gydF4y2Ba

MontaltogydF4y2Ba

CgydF4y2Ba

Oltrona维斯孔蒂gydF4y2Ba

lgydF4y2Ba

ArfatgydF4y2Ba

YgydF4y2Ba

基于机器学习的急性冠状动脉综合征(PRAISE)后不良事件预测:汇总数据集的建模研究gydF4y2Ba

《柳叶刀》gydF4y2Ba 2021gydF4y2Ba 01gydF4y2Ba 397gydF4y2Ba 10270gydF4y2Ba 199gydF4y2Ba 207gydF4y2Ba

10.1016 / s0140 - 6736 (20) 32519 - 8gydF4y2Ba

49gydF4y2Ba

RasmygydF4y2Ba

lgydF4y2Ba

香gydF4y2Ba

YgydF4y2Ba

谢gydF4y2Ba

ZgydF4y2Ba

道gydF4y2Ba

CgydF4y2Ba

智gydF4y2Ba

DgydF4y2Ba

Med-BERT:用于疾病预测的大规模结构化电子健康记录的预训练上下文化嵌入gydF4y2Ba

NPJ数字医院gydF4y2Ba 2021gydF4y2Ba 05gydF4y2Ba 20.gydF4y2Ba 4gydF4y2Ba 1gydF4y2Ba 86gydF4y2Ba

10.1038 / s41746 - 021 - 00455 - ygydF4y2Ba

34017034gydF4y2Ba

10.1038 / s41746 - 021 - 00455 - ygydF4y2Ba

PMC8137882gydF4y2Ba