JMIR医学信息学-用最少的电子健康记录数据预测重症监护病房的败血症:一种机器学习方法gydF4y2Ba

原始论文gydF4y2Ba

托马斯DesautelsgydF4y2Ba^1gydF4y2Ba博士gydF4y2Ba ;gydF4y2Ba
雅各布·卡尔弗特gydF4y2Ba^1gydF4y2Ba,废话gydF4y2Ba ;gydF4y2Ba
Jana霍夫曼gydF4y2Ba^1gydF4y2Ba博士gydF4y2Ba ;gydF4y2Ba
梅丽莎·杰gydF4y2Ba^1gydF4y2Ba,废话gydF4y2Ba ;gydF4y2Ba
Yaniv KeremgydF4y2Ba^{2，gydF4y2Ba}^3.gydF4y2Ba医学博士gydF4y2Ba ;gydF4y2Ba
丽莎ShiehgydF4y2Ba^4gydF4y2Ba，医学博士，博士gydF4y2Ba ;gydF4y2Ba
大卫ShimabukurogydF4y2Ba^5gydF4y2Ba医学博士gydF4y2Ba ;gydF4y2Ba
乌里ChettipallygydF4y2Ba^{6，gydF4y2Ba}^7gydF4y2Ba， mph, mdgydF4y2Ba ;gydF4y2Ba
米切尔·D·费尔德曼gydF4y2Ba^8gydF4y2Ba马里兰州，哲学博士gydF4y2Ba ;gydF4y2Ba
克里斯•巴顿gydF4y2Ba^7gydF4y2Ba医学博士gydF4y2Ba ;gydF4y2Ba
大卫·J·威尔士gydF4y2Ba^9gydF4y2Ba谈到gydF4y2Ba ;gydF4y2Ba
Ritankar DasgydF4y2Ba^1gydF4y2Ba,硕士gydF4y2Ba

^1gydF4y2BaDascena, Inc, Hayward, CA, usagydF4y2Ba

^2gydF4y2Ba斯坦福大学医学院临床信息系，美国加州斯坦福gydF4y2Ba

^3.gydF4y2Ba美国加州红木市凯撒永久红木市医疗中心急诊部gydF4y2Ba

^4gydF4y2Ba斯坦福大学医学院医学系，美国加利福尼亚州斯坦福gydF4y2Ba

^5gydF4y2Ba加州大学旧金山分校麻醉与围手术期护理科重症医学部，美国加利福尼亚州旧金山市gydF4y2Ba

^6gydF4y2Ba南旧金山凯撒永久医疗中心急诊部，南旧金山，加利福尼亚州，美国gydF4y2Ba

^7gydF4y2Ba加州大学旧金山分校急诊医学系，美国加利福尼亚州旧金山市gydF4y2Ba

^8gydF4y2Ba加州大学旧金山分校医学系普通内科科，美国加利福尼亚州旧金山市gydF4y2Ba

^9gydF4y2Ba英国剑桥大学化学系gydF4y2Ba

通讯作者:gydF4y2Ba

Jana Hoffman博士gydF4y2Ba

Dascena公司gydF4y2Ba

马丁·路德·金大道1135号gydF4y2Ba

海沃德，加州，94541gydF4y2Ba

美国gydF4y2Ba

电话:1 (872)228 5332gydF4y2Ba

传真:1 (872)228 5332gydF4y2Ba

电子邮件:gydF4y2Bajana@dascena.comgydF4y2Ba

背景:gydF4y2Ba脓毒症是住院病人死亡的主要原因之一。尽管如此，预测脓毒症发病的可靠方法仍然难以捉摸。早期和准确的脓毒症发病预测可以在保持抗菌药物管理的同时进行更积极和有针对性的治疗。现有的检测方法性能低下，而且往往需要耗时的实验室测试结果。gydF4y2Ba

摘要目的:gydF4y2Ba为了研究和验证脓毒症的预测方法，gydF4y2Ba洞察力gydF4y2Ba对于回顾性数据中新的败血症-3定义，使用电子健康记录数据中的最小变量集进行预测，将此方法的性能与现有评分系统进行比较，并调查数据稀疏性对患者的影响gydF4y2Ba洞察力gydF4y2Ba的性能。gydF4y2Ba

方法:gydF4y2Ba我们应用gydF4y2Ba洞察力gydF4y2Ba是一种机器学习分类系统，它使用容易获得的患者数据(生命体征、外周毛细血管氧饱和度、格拉斯哥昏迷评分和年龄)的多变量组合，使用回顾性重症监护多参数智能监测(MIMIC)-III数据集预测败血症，该数据集仅限于15岁或以上的重症监护病房(ICU)患者。根据脓毒症综合征的脓毒症-3定义，我们比较gydF4y2Ba洞察力gydF4y2Ba与快速序期器官衰竭评估(qSOFA)、改良早期预警评分(MEWS)、全身炎症反应综合征(SIRS)、简化急性生理评分(SAPS) II和序期器官衰竭评估(SOFA)相比，确定患者是否会在发病前的固定时间内发生败血症。我们还测试了gydF4y2Ba洞察力gydF4y2Ba系统可以随机删除单个输入的观测值。gydF4y2Ba

结果:gydF4y2Ba在一个脓毒症患病率为11.3%的测试数据集中，gydF4y2Ba洞察力gydF4y2Ba通过受试者工作特征曲线下面积(AUROC)和精确召回率曲线下面积(APR)来衡量，与其他评分相比，产生了更好的分类表现。在脓毒症发病的检测中，gydF4y2Ba洞察力gydF4y2BaAUROC = 0.880 (SD 0.006)， APR = 0.595 (SD 0.016)，均优于SIRS法(AUROC: 0.609);APR: 0.160)， qSOFA (AUROC: 0.772;APR: 0.277)和MEWS (AUROC: 0.803;APR: 0.327)，以及SAPS II (AUROC: 0.700;APR: 0.225)和SOFA (AUROC: 0.725;APR: 0.284)入场时计算(gydF4y2BaPgydF4y2Ba<．001)。在脓毒症发病前1-4小时观察到类似的结果。在大约60%的输入数据被随机删除的实验中，gydF4y2Ba洞察力gydF4y2Ba在脓毒症发病时，AUROC为0.781 (SD 0.013)， APR为0.401 (SD 0.015)。即使有60%的数据丢失，gydF4y2Ba洞察力gydF4y2Ba仍然优于相应的SIRS评分(AUROC和APR)，gydF4y2BaPgydF4y2Ba<.001)， qSOFA评分(gydF4y2BaPgydF4y2Ba= .0095;gydF4y2BaPgydF4y2Ba<.001)，优于入院时计算的SOFA和SAPS II (AUROC和APR，gydF4y2BaPgydF4y2Ba<.001)，其中所有这些比较得分(除了gydF4y2Ba洞察力gydF4y2Ba)，不删除数据。gydF4y2Ba

结论:gydF4y2Ba尽管只使用了生命体征，gydF4y2Ba洞察力gydF4y2Ba是预测脓毒症发作的有效工具，即使随机丢失数据也能很好地发挥作用。gydF4y2Ba

中华医学杂志，2016;4(3):928gydF4y2Ba

doi: 10.2196 / medinform.5909gydF4y2Ba

关键字gydF4y2Ba

脓毒症gydF4y2Ba;gydF4y2Ba 机器学习gydF4y2Ba;gydF4y2Ba 临床决策支持系统gydF4y2Ba;gydF4y2Ba 电子健康记录gydF4y2Ba;gydF4y2Ba 医学信息学gydF4y2Ba

脓毒症及其相关综合征是全世界发病率和死亡率的主要原因之一[gydF4y2Ba1gydF4y2Ba]并给医疗保健系统带来了巨大的成本负担[gydF4y2Ba2gydF4y2Ba]。脓毒症、严重脓毒症和脓毒性休克是广泛而复杂的各种疾病的总称，其特征是宿主对感染性损伤的反应失调。由于可能的感染性损伤的异质性和宿主反应的多样性，这些疾病长期以来一直难以被医生识别和诊断。最近引入了脓毒症的重新定义，目的是在临床和临床前环境中增加对脓毒症患者的准确识别。这个新的定义，败血症-3 [gydF4y2Ba3.gydF4y2Ba]，消除了传统的脓毒症进展的三元分类，从脓毒症，到严重脓毒症，到脓毒症休克，而是采用了与死亡率增加相关的双层识别系统。根据新的定义，“败血症”一词被定义为“由宿主对感染反应失调引起的危及生命的器官功能障碍”。gydF4y2Ba3.gydF4y2Ba]，这与之前对严重败血症的定义最为吻合。器官功能障碍在实践中被定义为顺序器官衰竭评估(SOFA)的增加[gydF4y2Ba4gydF4y2Ba得分至少2分。这些参数与10%以上的住院死亡率相关。Singer等[gydF4y2Ba3.gydF4y2Ba]将“脓毒性休克”定义为脓毒症的一种分类，“其中潜在的循环和细胞代谢异常严重到足以显著增加死亡率”，并建议通过血清乳酸浓度高于2 mmol/L和低血压(需要使用血管加压药物以维持平均动脉压高于65 mm Hg)来识别此类患者。脓毒性休克与40%以上的住院死亡率相关。我们使用这个新提出的脓毒症定义作为实施预测算法的黄金标准，gydF4y2Ba洞察力gydF4y2Ba［gydF4y2Ba5gydF4y2Ba，gydF4y2Ba6gydF4y2Ba]。gydF4y2Ba洞察力gydF4y2Ba仅使用从电子健康记录(EHRs)中获得的8种常见测量值(生命体征和其他易于评估的床边测量值，加上年龄)来预测和检测重症监护病房(ICU)人群的败血症。gydF4y2Ba

在ICU外使用一种新的床边评分系统“qSOFA”(quick SOFA)，已被提出作为一种筛查机制，提示临床医生进一步调查败血症或转移到更高级别的护理[gydF4y2Ba3.gydF4y2Ba]。qSOFA的标准至少为以下2项:呼吸高于22/min，精神状态改变，或收缩压低于100 mm Hg。目前用于确定或预测败血症的其他评分系统包括SOFA评分[gydF4y2Ba4gydF4y2Ba]、修订预警评分(MEWS) [gydF4y2Ba7gydF4y2Ba]、简易急性生理评分(SAPS II) [gydF4y2Ba8gydF4y2Ba]和全身性炎症反应综合征(SIRS)标准[gydF4y2Ba9gydF4y2Ba]。这些方法利用各种患者生命体征和实验室结果的制表来生成风险评分;然而，他们没有分析患者数据的趋势或测量之间的相关性。gydF4y2Ba

本研究的目的是验证gydF4y2Ba洞察力gydF4y2Ba脓毒症预测方法的新脓毒症-3定义使用回顾性数据，包括最小的，常见的电子病历变量，并研究数据稀疏性对其性能的影响。此外,gydF4y2Ba洞察力gydF4y2Ba预测性能将与其他现有分数和系统进行比较。gydF4y2Ba

数据集gydF4y2Ba

这项工作使用了重症监护多参数智能监测(MIMIC)-III版本1.3数据集[gydF4y2Ba10gydF4y2Ba]，由马萨诸塞州波士顿的贝斯以色列女执事医疗中心(BIDMC)于2001年至2012年编制而成。MIMIC-III集包括来自52,000多名ICU住院患者和40,000多名患者的匿名数据。的gydF4y2Ba洞察力gydF4y2Ba算法仅使用MIMIC-III集的ehr输入组件，不需要实时波形数据或自由文本注释的解释。MIMIC-III包括使用CareVue (Philips)和Metavision (iMDSoft) EHR系统记录的数据，这两种系统处理和存储一些不同的信息。这些系统分别于2001年至2008年和2008年至2012年在BIDMC使用。由于最初的MIMIC-III数据收集不会影响患者的安全，并且所有数据都是根据《健康保险可携带性和责任法案》(HIPAA)隐私规则确定的，因此BIDMC的机构审查委员会和麻省理工学院放弃了患者同意的要求。gydF4y2Ba

数据提取与输入gydF4y2Ba

我们从MIMIC-III数据集中收集各种数据来定义脓毒症的发作并计算脓毒症的发生率gydF4y2Ba洞察力gydF4y2Ba，以及MEWS和SOFA等其他评分进行比较。所有数据都是使用自定义PostgreSQL (PostgreSQL Global Development Group)查询从MIMIC-III集合中提取的。这些测量值暂时使用一小时的箱宽进行分类;测量值然后在一个桶内平均。这个过程和所有后续的计算都在MATLAB中进行(The Mathworks, Natick, MA)。缺失的数据是使用“结转”系统来输入的，在这种系统中，最近的bin值被结转到后续的空bin中。为了提供不受不同时间的不同数据可用性影响的比较，在收集任何相应类型的测量值之前的容器被回填为具有测量值的第一个后续容器的值。这些处理过的数据随后用于下游计算。gydF4y2Ba

黄金标准gydF4y2Ba

我们遵循Singer等人对脓毒症的定义[gydF4y2Ba3.gydF4y2Ba]。具体来说，Singer等人将败血症定义为“由宿主对感染反应失调引起的危及生命的器官功能障碍……[以]感染后SOFA总分≥2分的急性变化为标志。”根据Seymour等人的回顾性验证研究[gydF4y2Ba11gydF4y2Ba]，我们回顾性地将怀疑感染等同于在指定窗口内进行培养实验室抽查的命令，以及抗生素剂量(见gydF4y2Ba表1gydF4y2Ba)。由于最新版本的MIMIC-III (v1.3)的限制，阴性培养(血液和其他类型)在数据库中的报告不足。gydF4y2Ba

为了确定SOFA评分的急性变化，我们遵循Seymour等人提出的定义。我们将最早进行培养或使用抗生素的初始时间作为怀疑感染的时间，在此时间之前(受数据可用时间限制)最多48小时，在此时间之后(受离开ICU时间限制)最多24小时。将此窗口开始时的SOFA分数与其在整个窗口中的每小时值进行比较;如果这个小时值比窗口开始时的值高≥2分，我们将第一个小时定义为脓毒症的发生，并将患者指定为脓毒症(1类)。如果患者没有发生这样的事件，我们将其分类为非脓毒症(0类)。如果计算某个SOFA分值所需的数据不存在于输入的数据中，则该分值为0(即“正常”)。我们还使用了SOFA呼吸评分的改进版本[gydF4y2Ba12gydF4y2Ba]，从而避免了需要有关患者机械通气的信息。Seymour等人主要关注的是脓毒症患者的大规模识别，而不是具体的精确定位gydF4y2Ba当gydF4y2Ba这些病人变成了败血症。相反，我们需要这个时间信息因为我们正在研究一个系统gydF4y2Ba预计gydF4y2Ba脓毒症的发作。gydF4y2Ba

表1。疑似感染的窗口期，根据Seymour等人的研究，定义为存在培养和抗生素治疗[gydF4y2Ba11gydF4y2Ba]。gydF4y2Ba

第一个事件gydF4y2Ba	必须在其中发生第二个事件的窗口gydF4y2Ba
抗生素管理gydF4y2Ba	在接下来的72小时内进行培养gydF4y2Ba
文化了gydF4y2Ba	在接下来的24小时内使用抗生素gydF4y2Ba

选择临床测量和患者纳入gydF4y2Ba

的学习方法gydF4y2Ba洞察力gydF4y2Ba对于所使用的患者数据是灵活的。在本工作中，我们选择了收缩压、脉压、心率、呼吸速率、温度、外周毛细血管血氧饱和度(SpO)gydF4y2Ba_2gydF4y2Ba)、年龄和格拉斯哥昏迷评分(GCS)。所有这些特征在床边几乎普遍可用，而不依赖于实验室测试。对于哪些患者测量数据构成生命体征存在分歧，其中最严格的定义仅包括体温、心率、血压和呼吸频率，以及最广泛的定义包括本研究中使用的除年龄外的所有患者数据[gydF4y2Ba13gydF4y2Ba，gydF4y2Ba14gydF4y2Ba]。因此，我们将本研究中使用的测量集合统称为“延长生命周期”。虽然我们在ICU中训练和测试了我们的方法，但我们注意到这些或类似的特征也应该在其他环境中可用。从最小的扩展生命体征集成功预测允许我们的方法的普遍应用。这一特征对于无法使用其他评分系统(如SOFA)进行评估的患者特别有用。如果以下任何情况属实，我们将所有ICU住院排除在考虑范围之外:患者年龄不超过15岁(排除儿科患者);ICU无测量记录;ICU数据记录使用CareVue，而不是Metavision;我们的预测器所需的一项或多项测量在ICU住院期间的任何时间都没有记录;发生上述定义的脓毒症，但在ICU住院超过500小时或不到7小时。 The inclusion diagram is presented as图1gydF4y2Ba15岁及以上患者的人口学分布表示为gydF4y2Ba表2gydF4y2Ba。值得注意的是，所有符合纳入标准的患者的医院总死亡率为6.9%，明显低于仅脓毒症患者的死亡率。这是因为总体的研究人群，详见gydF4y2Ba表2gydF4y2Ba包括所有重症监护室的患者，包括低死亡率环境，如重症监护室。相比之下，MIMIC III期绝大多数(超过75%)的传染病患者在MICU，其住院时间中位数为6.4天，医院死亡率为14.5% [gydF4y2Ba10gydF4y2Ba]。gydF4y2Ba

纳入的患者脓毒症发作时间至少为ICU住院7小时，这是为了明确表现。在操作,gydF4y2Ba洞察力gydF4y2Ba只需要预报时间前2小时的数据。考虑到大多数患者在进入ICU之前将拥有医院单位的电子病历数据(例如，急诊科，住院楼层)，预测器将在进入ICU时激活。值得注意的是，该预测器最迟可在ICU入院2小时后激活。然而，我们证明了我们的方法对各种预测范围的预测性能，即脓毒症发作事件之前的时间长度。为了使这个比较不被不同水平的患者纳入(不同的大小和组成)所混淆，我们采用了一个单一的、一致的、保守的脓毒症发作的纳入标准，至少在ICU住院7小时。脓毒症在500小时(超过20天)内发生的要求是为了便于分析，限制最小;如图所示gydF4y2Ba表2gydF4y2Ba在美国，只有5.1%的患者(1149例)在ICU住院12天及以上。同样，在ICU住院期间，所有选择的测量值都存在的要求也是为了分析方便，排除少于500例患者，并且不需要在实践中严格应用。我们计划在未来的工作中放宽这一限制。gydF4y2Ba

仅使用Metavision患者值得特别讨论。对于使用CareVue系统记录的ICU住院，有关执行程序(即进行培养)的数据不会像使用Metavision记录的ICU住院那样详细和全面地出现在MIMIC-III数据库中。此外，虽然MIMIC-III版本1.3数据集包括来自BIDMC微生物实验室的信息，报告所有患者的阳性培养及其结果，但阴性培养并未一致报告。这些事实的结合意味着CareVue患者的阴性培养被低估了。这反过来意味着，根据培养和抗生素同时发生的定义，怀疑感染在这些ICU住院期间的系统性代表性不足，导致CareVue患者的败血症患病率为3.5%，而Metavision患者的败血症患病率为11.3%。鉴于这种差异，我们选择将CareVue患者排除在我们的分析之外。gydF4y2Ba

我们进行了一项辅助分析，以排除在ICU住院前接受抗生素治疗的患者(23906例Metavision ICU住院患者中的4078例)。这是一种高度敏感的，尽管非特异性的方法去除icu前脓毒症病例。由于无法获得ICU住院开始的确切时间戳，我们将其近似为在临床测量部分列表中任何延长生命体征的初始测量之前60分钟。虽然这里讨论了60分钟的近似，但我们也检查了各种其他时间窗口，并且排除的患者组对所使用的截止时间并不强烈敏感。在ICU前停用抗生素后，剩余的19,828例ICU住院日的筛查与前面描述的相同，留下1840例脓毒症ICU住院日和17,214例非脓毒症ICU住院日(脓毒症患病率为9.66%)。gydF4y2Ba

表2。重症监护多参数智能监测版本III (MIMIC-III)重症监护病房住院的人口统计数据。所有住院病人的年龄都在15岁或以上(21 173例住院)。gydF4y2Ba

人口统计学特征gydF4y2Ba		ICU住院天数n (%)gydF4y2Ba
ICU类型gydF4y2Ba	医疗加护病房gydF4y2Ba	9460 (41.89)gydF4y2Ba
	心脏外科康复室gydF4y2Ba	3345 (14.81)gydF4y2Ba
	外科加护病房gydF4y2Ba	4293 (19.01)gydF4y2Ba
	冠状动脉监护室gydF4y2Ba	2726 (12.07)gydF4y2Ba
	创伤外科重症监护室gydF4y2Ba	2759 (12.22)gydF4y2Ba
性别gydF4y2Ba	女gydF4y2Ba	9902 (43.85)gydF4y2Ba
性别gydF4y2Ba	男性gydF4y2Ba	12681 (56.15)gydF4y2Ba
年龄(年)gydF4y2Ba 中位数65 IQR (53-77)gydF4y2Ba	15 - 17日gydF4y2Ba	25 (0.1)gydF4y2Ba
	~ 29gydF4y2Ba	982 (4.3)gydF4y2Ba
	- 39gydF4y2Ba	1132 (5.01)gydF4y2Ba
	40至49gydF4y2Ba	2176 (9.64)gydF4y2Ba
	50-59gydF4y2Ba	4038 (17.88)gydF4y2Ba
	60 - 69gydF4y2Ba	5159 (22.84)gydF4y2Ba
	70 +gydF4y2Ba	9071 (40.17)gydF4y2Ba
停留时间(天)gydF4y2Ba 中位数2.0 IQRgydF4y2Ba^{一个gydF4y2Ba}(1.2 - -3.8)gydF4y2Ba	0 - 2gydF4y2Ba	15178 (67.21)gydF4y2Ba
	3 - 5gydF4y2Ba	4267 (18.89)gydF4y2Ba
	6 - 8gydF4y2Ba	1340 (5.93)gydF4y2Ba
	9 - 11gydF4y2Ba	649 (2.9)gydF4y2Ba
	12 +gydF4y2Ba	1149 (5.09)gydF4y2Ba
住院期间死亡gydF4y2Ba	是的gydF4y2Ba	1569 (6.95)gydF4y2Ba
住院期间死亡gydF4y2Ba	没有gydF4y2Ba	21014 (93.05)gydF4y2Ba

^{一个gydF4y2Ba}IQR:四分位数范围。gydF4y2Ba

图1所示。包含图。所有符合上述顺序纳入标准的重症监护病房(ICU)住院均包括在训练和测试集中。最终数据集的败血症患病率为11.3%。MIMIC-III:重症监护多参数智能监测版本III。gydF4y2Ba

机器学习方法gydF4y2Ba

培训和测试过程为gydF4y2Ba洞察力gydF4y2Ba预测系统包括4个阶段:数据划分、特征构建、分类器训练和分类器测试。整个培训和测试过程如图所示gydF4y2Ba图2gydF4y2Ba。在第一阶段，数据被分成4个折叠进行交叉验证。每个折叠单独用于测试，而其他3个折叠被连接成相应的训练集。对于每个交叉验证折叠，使用训练集进行特征构建。特征包括在过去2小时内选取的临床(生命体征)变量的值，用x表示gydF4y2Ba_1gydF4y2Ba和xgydF4y2Ba_2gydF4y2Ba;给定单个临床变量x的平滑估计，对脓毒症的每个后验概率(s=1)进行连续的非线性函数逼近gydF4y2Ba_1gydF4y2Ba^我gydF4y2Ba，即P(s=1 | x)gydF4y2Ba_1gydF4y2Ba^我gydF4y2Ba）;类似的连续近似，其中ΔxgydF4y2Ba^我gydF4y2Bax = (gydF4y2Ba_1gydF4y2Ba- xgydF4y2Ba_2gydF4y2Ba）gydF4y2Ba^我gydF4y2Ba为输入，P(s=1 | ΔxgydF4y2Ba^我gydF4y2Ba）;以及脓毒症的后验概率的表格近似，给出2或3个离散版本Δx的组合gydF4y2Ba^我gydF4y2Ba，即P(s=1 | ΔxgydF4y2Ba^我gydF4y2BaΔxgydF4y2Ba^jgydF4y2Ba)或P(s=1 | Δx)gydF4y2Ba^我gydF4y2BaΔxgydF4y2Ba^jgydF4y2BaΔxgydF4y2Ba^kgydF4y2Ba)。所有这些对脓毒症后验概率的近似都是使用训练集计算的。最后的特性集是:gydF4y2Ba

ξ = [x]gydF4y2Ba_{1，gydF4y2Ba}xgydF4y2Ba_{2，gydF4y2Ba}…P(s) =1 | xgydF4y2Ba_1gydF4y2Ba^我gydF4y2Ba)…，…P(s=1 | ΔxgydF4y2Ba^我gydF4y2Ba)…，…P(s=1 | ΔxgydF4y2Ba^我gydF4y2BaΔxgydF4y2Ba^jgydF4y2Ba)…，…P(s=1 | ΔxgydF4y2Ba^我gydF4y2BaΔxgydF4y2Ba^jgydF4y2BaΔxgydF4y2Ba^kgydF4y2Ba)…］gydF4y2Ba

在我们的第一个实验中，我们评估了性能在使用时的变化gydF4y2Ba洞察力gydF4y2Ba预测病人是否会在未来越来越长的时间内变得败血症。的gydF4y2Ba洞察力gydF4y2Ba分类器被赋予构造的特征并进行训练，以预测患者是否会败血症(1类)或不(0类)。这种训练使用弹性网正则化，这在特征权值之间引起了一定程度的稀疏性[gydF4y2Ba15gydF4y2Ba，gydF4y2Ba16gydF4y2Ba]。最后，在不相交测试集上对训练好的分类器进行评估;本文提出的所有性能指标都是在测试集上计算的。整个过程(折叠选择、特征构建、分类器训练和分类器测试)重复进行，将数据独立随机划分为折叠4次(即4次交叉验证)，每次划分测试5个预测层。对于脓毒症发病前0,1,2,3和4小时，我们进行了比较gydF4y2Ba洞察力gydF4y2Ba使用当时计算的qSOFA、MEWS和SIRS，以及ICU入院时计算的SOFA和SAPS II评分。虽然这些风险评分并不都与败血症有关，但它们反映了疾病的严重程度，并代表了表现的重要基准。gydF4y2Ba

在第二个实验中，我们测试了gydF4y2Ba洞察力gydF4y2Ba系统中存在数据稀疏性。通过根据随机选择程序删除个人ehr记录的观察结果来模拟这种情况。我们删除了我们的预测器使用的测量的个人观察:有创和无创血压、心率、呼吸率、温度、SpOgydF4y2Ba_2gydF4y2Ba，以及GCS。在MIMIC-III数据库中记录这些值的频率见gydF4y2Ba表3gydF4y2Ba。这些频率大约是每小时测量一次，接近我们的时间离散频率。在我们的实验中，我们要求保留每个ICU病房的每种类型的第一次测量，但每个ICU病房的所有后续测量可以随机均匀地删除，并具有指定的删除概率。gydF4y2BaPgydF4y2Ba。我们设置gydF4y2BaPgydF4y2Ba={0, 0.1, 0.2, 0.4，和。6}在这个随机的数据删除过程之后，我们重新处理和计算数据。请注意，金标准(脓毒症的存在和发病时间)是使用完整的数据集确定的，因此在所有实验中，每次ICU住院都是一致的。所有后续的培训和测试程序与之前的实验类似。gydF4y2Ba

表3。纳入ICU病房的每小时观察频率(n=22,853)。3例ICU住院时间少于60分钟，从计算中剔除。gydF4y2Ba

测量gydF4y2Ba	平均值(SD) (hgydF4y2Ba^1gydF4y2Ba）gydF4y2Ba	中位数(位差gydF4y2Ba^{一个gydF4y2Ba}) (hgydF4y2Ba^1gydF4y2Ba）gydF4y2Ba	ICU住院天数(FgydF4y2Ba^bgydF4y2Ba）gydF4y2Ba
GCSgydF4y2Ba^cgydF4y2Ba	0.29 (0.16)gydF4y2Ba	0.25 (0.21 - -0.29)gydF4y2Ba	1gydF4y2Ba
心率gydF4y2Ba	1.31 (3.32)gydF4y2Ba	1.07 (1.01 - -1.16)gydF4y2Ba	1gydF4y2Ba
呼吸率gydF4y2Ba	1.30 (3.26)gydF4y2Ba	1.06 (1.00 - -1.16)gydF4y2Ba	1gydF4y2Ba
热点;gydF4y2Ba_2gydF4y2Ba^dgydF4y2Ba	1.27 (3.01)gydF4y2Ba	1.06 (0.99 - -1.17)gydF4y2Ba	1gydF4y2Ba
温度gydF4y2Ba	0.31 (0.21)gydF4y2Ba	0.27 (0.23 - -0.314)gydF4y2Ba	1gydF4y2Ba
NIDiasABPgydF4y2Ba^egydF4y2Ba	0.76 (0.39)gydF4y2Ba	0.88 (0.46 - -1.02)gydF4y2Ba	0.99gydF4y2Ba
NISysABPgydF4y2Ba^fgydF4y2Ba	0.76 (0.39)gydF4y2Ba	0.88 (0.46 - -1.02)gydF4y2Ba	0.99gydF4y2Ba
SysABPgydF4y2Ba^ggydF4y2Ba	0.41 (1.55)gydF4y2Ba	0 (0 - 0.76)gydF4y2Ba	0.43gydF4y2Ba
DiasABPgydF4y2Ba^hgydF4y2Ba	0.41 (1.55)gydF4y2Ba	0 (0 - 0.76)gydF4y2Ba	0.43gydF4y2Ba

^{一个gydF4y2Ba}IQR:四分位数范围。gydF4y2Ba

^bgydF4y2BaF:这些ICU的分数保持至少一种给定类型的测量。gydF4y2Ba

^cgydF4y2BaGCS:格拉斯哥昏迷评分。gydF4y2Ba

^dgydF4y2Ba热点;gydF4y2Ba_2gydF4y2Ba:外周毛细血管血氧饱和度。gydF4y2Ba

^egydF4y2BaNIDiasABP:无创舒张期动脉血压。gydF4y2Ba

^fgydF4y2BaNISysABP:无创动脉收缩压。gydF4y2Ba

^ggydF4y2BaSysABP:侵入性收缩压。gydF4y2Ba

^hgydF4y2BaDiasABP:有创舒张动脉血压。gydF4y2Ba

图2。培训和测试程序。对于将数据划分为交叉验证折叠(4个分区)，对于每个分区中的每个测试交叉验证折叠(4个折叠)，以及每个时间范围(5个时间范围)，过程中最内部的步骤(最右边)都是重复的。ICU:重症监护病房。gydF4y2Ba

的比较gydF4y2Ba洞察力gydF4y2Ba在ICU入院时计算的脓毒症的qSOFA、MEWS和SIRS评分，以及脓毒症发病和发病前时间的SOFA和SAPS II评分的结果以图形形式显示在gydF4y2Ba图3gydF4y2Ba，gydF4y2Ba4gydF4y2Ba,gydF4y2Ba5gydF4y2Ba。其他性能度量出现在gydF4y2Ba表4gydF4y2Ba。在发病时，gydF4y2Ba洞察力gydF4y2BaAUROC (0.8799 [SD 0.0056])和APR优于所有其他测试方法(gydF4y2BaPgydF4y2Ba<．在所有情况下都是001，假设正态性)。这种优势在发病前预测时间较长时仍然存在(gydF4y2BaPgydF4y2Ba<．所有AUROC病例为001,SOFA以外方法的精确召回率为001;gydF4y2BaPgydF4y2Ba<．001年和gydF4y2BaPgydF4y2Ba＝.3.7for APR against SOFA at 1 and 2 hours before onset, inferior to admission SOFA in APR withPgydF4y2Ba＝.001年和gydF4y2BaPgydF4y2Ba＝.009，发病前3和4小时)。gydF4y2Ba

的ROC曲线gydF4y2Ba洞察力gydF4y2Ba比赛的分数显示在gydF4y2Ba图3gydF4y2Ba。作为gydF4y2Ba洞察力gydF4y2Ba被训练为对敏感性和特异性同等重视，ROC曲线倾向于在这两个约束之间表现出平衡。AUROC的优势由gydF4y2Ba洞察力gydF4y2Ba与其他方法(即gydF4y2Ba洞察力gydF4y2Ba与其他曲线上的点相比，ROC曲线通常具有更高的灵敏度或特异性，或两者兼而有之)。gydF4y2Ba

图5gydF4y2Ba显示所有分数的精确召回率曲线下的面积。精确召回率和ROC曲线具有一对一的对应关系，但强调数据的不同方面。虽然ROC曲线对1类疾病(即脓毒症)的患病率不敏感，但精确度值(也称为阳性预测值或PPV)直接受到1类疾病患病率的影响。进一步的性能衡量标准载于gydF4y2Ba表4gydF4y2Ba。gydF4y2Ba洞察力gydF4y2Ba同时获得中等的敏感性和特异性，同时也获得良好的诊断优势比(DOR)值。gydF4y2Ba

我们进行了一项辅助分析，排除了在ICU住院前接受抗生素治疗的患者，结果发现AUROC和模型性能指标与文献中报道的没有显著差异gydF4y2Ba图3gydF4y2Ba和gydF4y2Ba表4gydF4y2Ba。gydF4y2Ba

我们计算了gydF4y2Ba洞察力gydF4y2Ba系统随机观察删除，其中这些发生的概率gydF4y2BaPgydF4y2Ba={0, 0.1, 0.2, 0.4, 0.6}，发病前预测时间分别为0、1、2、4小时。这些实验的结果如下gydF4y2Ba图6gydF4y2Ba，gydF4y2Ba7gydF4y2Ba,gydF4y2Ba8gydF4y2Ba和gydF4y2Ba表5gydF4y2Ba。在我们的患者群体中，原始数据的典型频率(gydF4y2Ba表3gydF4y2Ba)大约每小时一个。由于我们以一小时的间隔离散时间，因此这里研究的随机数据删除处于离散率周围的临界区域，并且应该预期会影响gydF4y2Ba洞察力的gydF4y2Ba的性能。gydF4y2Ba

图6gydF4y2Ba显示了在选定的发病前预测时间和随机退出频率下的ROC曲线。ROC曲线在很大程度上保持了性能，即使删除了一半以上的测量值。事实上，对于提前4小时预测，在60%的测量数据缺失的情况下，gydF4y2Ba洞察力gydF4y2Ba实现了与qSOFA检测相似的性能，没有丢失。ROC下的全面积和精确召回曲线作为发病前时间的函数见gydF4y2Ba图7gydF4y2Ba和gydF4y2Ba8gydF4y2Ba，并在gydF4y2Ba表5gydF4y2Ba。gydF4y2Ba

表4。详细的性能指标gydF4y2Ba洞察力gydF4y2Ba在完整的重症监护多参数智能监测版本III (MIMIC-III)数据集上的竞争得分，选择的工作点使灵敏度接近0.80。请注意，所有快速SOFA的操作点产生的灵敏度远低于0.80。gydF4y2Ba

	洞察力gydF4y2Ba: 0小时gydF4y2Ba	洞察力gydF4y2Ba: 4小时gydF4y2Ba	先生们gydF4y2Ba^{一个gydF4y2Ba}	快速的沙发gydF4y2Ba	喵喵gydF4y2Ba^bgydF4y2Ba	削弱了二世gydF4y2Ba^cgydF4y2Ba	沙发gydF4y2Ba^dgydF4y2Ba
AUROCgydF4y2Ba^egydF4y2Ba	0.88 (sd 0.006)gydF4y2Ba	0.74 (sd 0.010)gydF4y2Ba	0.61gydF4y2Ba	0.77gydF4y2Ba	0.80gydF4y2Ba	0.70gydF4y2Ba	0.73gydF4y2Ba
4月gydF4y2Ba^fgydF4y2Ba	0.60 (sd 0.016)gydF4y2Ba	0.28 (sd 0.013)gydF4y2Ba	0.16gydF4y2Ba	0.28gydF4y2Ba	0.33gydF4y2Ba	0.23gydF4y2Ba	0.28gydF4y2Ba
灵敏度gydF4y2Ba	0.80gydF4y2Ba	0.80gydF4y2Ba	0.72gydF4y2Ba	0.56gydF4y2Ba	0.70gydF4y2Ba	0.75gydF4y2Ba	0.80gydF4y2Ba
特异性gydF4y2Ba	0.80gydF4y2Ba	0.54gydF4y2Ba	0.44gydF4y2Ba	0.84gydF4y2Ba	0.77gydF4y2Ba	0.52gydF4y2Ba	0.48gydF4y2Ba
F1gydF4y2Ba^ggydF4y2Ba	0.47gydF4y2Ba	0.30gydF4y2Ba	0.24gydF4y2Ba	0.39gydF4y2Ba	0.40gydF4y2Ba	0.27gydF4y2Ba	0.27gydF4y2Ba
金龟子gydF4y2Ba^hgydF4y2Ba	15.51gydF4y2Ba	4．75gydF4y2Ba	2.06gydF4y2Ba	6.33gydF4y2Ba	7.85gydF4y2Ba	3.26gydF4y2Ba	3.71gydF4y2Ba
LR +gydF4y2Ba^我gydF4y2Ba	3.90gydF4y2Ba	1.75gydF4y2Ba	1.30gydF4y2Ba	3.37gydF4y2Ba	3.05gydF4y2Ba	1.57gydF4y2Ba	1.55gydF4y2Ba
LR -gydF4y2Ba^jgydF4y2Ba	0.25gydF4y2Ba	0.37gydF4y2Ba	0.63gydF4y2Ba	0.53gydF4y2Ba	0.39gydF4y2Ba	0.48gydF4y2Ba	0.42gydF4y2Ba
精度gydF4y2Ba	0.80gydF4y2Ba	0.57gydF4y2Ba	0.47gydF4y2Ba	0.80gydF4y2Ba	0.76gydF4y2Ba	0.55gydF4y2Ba	0.52gydF4y2Ba

^{一个gydF4y2Ba}全身性炎症反应综合征gydF4y2Ba

^bgydF4y2BaMEWS:修改早期预警评分。gydF4y2Ba

^cgydF4y2BaSAPS II:简化急性生理评分II。gydF4y2Ba

^dgydF4y2BaSOFA:序贯(败血症相关)器官衰竭评估。gydF4y2Ba

^egydF4y2BaAURUC:接收器工作特性曲线下的面积。gydF4y2Ba

^fgydF4y2BaAPR:精密度-召回曲线下面积。gydF4y2Ba

^ggydF4y2BaF1:查准率和查全率的调和平均值。gydF4y2Ba

^hgydF4y2BaDOR:诊断优势比。gydF4y2Ba

^我gydF4y2BaLR+:正似然比。gydF4y2Ba

^jgydF4y2BaLR-:负似然比。gydF4y2Ba

表5所示。详细的表现量度gydF4y2Ba洞察力gydF4y2Ba当使用原始数据进行测试和训练时。手术点的选择程序与gydF4y2Ba表4gydF4y2Ba。gydF4y2Ba

	洞察力gydF4y2Ba0小时，0%辍学率gydF4y2Ba	洞察力gydF4y2Ba，gydF4y2Ba 0小时，10%辍学率gydF4y2Ba	洞察力gydF4y2Ba，gydF4y2Ba 0小时，20%辍学率gydF4y2Ba	洞察力gydF4y2Ba，gydF4y2Ba 0小时，40%辍学率gydF4y2Ba	洞察力gydF4y2Ba，gydF4y2Ba 0小时，60%辍学率gydF4y2Ba	洞察力gydF4y2Ba4小时，0%辍学率gydF4y2Ba	洞察力gydF4y2Ba，gydF4y2Ba 4小时，60%辍学率gydF4y2Ba
AUROCgydF4y2Ba^{一个gydF4y2Ba}	0.89 (sd 0.010)gydF4y2Ba	0.87 (sd 0.006)gydF4y2Ba	0.84 (sd 0.011)gydF4y2Ba	0.83 (sd 0.012)gydF4y2Ba	0.78 (sd 0.013)gydF4y2Ba	0.75 (sd 0.008)gydF4y2Ba	0.73 (sd 0.010)gydF4y2Ba
4月gydF4y2Ba^bgydF4y2Ba	0.60 (sd 0.022)gydF4y2Ba	0.57 (sd 0.015)gydF4y2Ba	0.54 (sd 0.022)gydF4y2Ba	0.49 (sd 0.021)gydF4y2Ba	0.40 (sd 0.015)gydF4y2Ba	0.27 (sd 0.012)gydF4y2Ba	0.27 (sd 0.009)gydF4y2Ba
灵敏度gydF4y2Ba	0.80gydF4y2Ba	0.80gydF4y2Ba	0.80gydF4y2Ba	0.80gydF4y2Ba	0.80gydF4y2Ba	0.80gydF4y2Ba	0.80gydF4y2Ba
特异性gydF4y2Ba	0.82gydF4y2Ba	0.78gydF4y2Ba	0.72gydF4y2Ba	0.68gydF4y2Ba	0.59gydF4y2Ba	0.55gydF4y2Ba	0.52gydF4y2Ba
F1gydF4y2Ba^cgydF4y2Ba	0.49gydF4y2Ba	0.45gydF4y2Ba	0.40gydF4y2Ba	0.37gydF4y2Ba	0.32gydF4y2Ba	0.30gydF4y2Ba	0.29gydF4y2Ba
金龟子gydF4y2Ba^dgydF4y2Ba	17.90gydF4y2Ba	14.14gydF4y2Ba	10.23gydF4y2Ba	8.31gydF4y2Ba	5.76gydF4y2Ba	4.95gydF4y2Ba	4.38gydF4y2Ba
LR +gydF4y2Ba^egydF4y2Ba	4.37gydF4y2Ba	3.62gydF4y2Ba	2.85gydF4y2Ba	2.46gydF4y2Ba	1.95gydF4y2Ba	1.79gydF4y2Ba	1.67gydF4y2Ba
LR -gydF4y2Ba^fgydF4y2Ba	0.24gydF4y2Ba	0.26gydF4y2Ba	0.28gydF4y2Ba	0.30gydF4y2Ba	0.34gydF4y2Ba	0.36gydF4y2Ba	0.38gydF4y2Ba
精度gydF4y2Ba	0.82gydF4y2Ba	0.78gydF4y2Ba	0.73gydF4y2Ba	0.69gydF4y2Ba	0.61gydF4y2Ba	0.58gydF4y2Ba	0.55gydF4y2Ba

^{一个gydF4y2Ba}AUROC:接收机工作特性曲线下的面积。gydF4y2Ba

^bgydF4y2BaAPR:精密度-召回曲线下面积。gydF4y2Ba

^cgydF4y2BaF1:查准率和查全率的调和平均值。gydF4y2Ba

^dgydF4y2BaDOR:诊断优势比。gydF4y2Ba

^egydF4y2BaLR+:正似然比。gydF4y2Ba

^fgydF4y2BaLR-:负似然比。gydF4y2Ba

图3。的接收机工作特性曲线gydF4y2Ba洞察力gydF4y2Ba在发病时间与其他方法比较。MEWS:修正预警评分;SOFA:序贯(败血症相关)器官衰竭评估;qSOFA:快速沙发;SAPS II:简化急性生理评分II;全身性炎症反应综合征。gydF4y2Ba

图4。接收器工作特性曲线下的测试集面积为gydF4y2Ba洞察力gydF4y2Ba竞争的方法是预测潜在败血症发作所需时间的函数。为1个标准差的误差条gydF4y2Ba洞察力gydF4y2Ba，其中使用交叉验证折叠上的性能计算标准偏差。AUROC:受者工作特性曲线下面积;MEWS:修正预警评分;qSOFA:快速沙发;全身性炎症反应综合征。gydF4y2Ba

图5。的精密度召回曲线下的测试集面积gydF4y2Ba洞察力gydF4y2Ba竞争的方法是预测潜在败血症发作所需时间的函数。误差条为±1个标准差gydF4y2Ba洞察力gydF4y2Ba，其中使用交叉验证折叠上的性能计算标准偏差。APR:精密度-召回曲线下面积;MEWS:修正预警评分;qSOFA:快速沙发;全身性炎症反应综合征。gydF4y2Ba

图6。的接收机工作特性曲线gydF4y2Ba洞察力gydF4y2Ba在选定的发病前预测时间和随机退出频率。gydF4y2Ba

图7。的接收机工作特性曲线下面积(AUROC)gydF4y2Ba洞察力gydF4y2Ba对比发病前预测时间。每条线对应于指示的测量差频。所有实验都进行了4次交叉验证，数据重新划分了4次。gydF4y2Ba

图8。精密度-召回曲线(APR)下面积gydF4y2Ba洞察力gydF4y2Ba对比发病前预测时间。每条线对应于指示的测量差频。所有实验都进行了4次交叉验证，数据重新划分了4次。gydF4y2Ba

主要研究结果gydF4y2Ba

我们进行了测试和验证gydF4y2Ba洞察力,gydF4y2Ba一个基于机器学习的系统，用于从灵活和最小的数据预测败血症的发作。使用回顾性MIMIC-III数据集和新的脓毒症-3定义，我们训练该系统来预测脓毒症的发作并测试其性能。gydF4y2Ba洞察力gydF4y2Ba以优于相应的qSOFA、SIRS和MEWS评分的性能对患者进行分类(脓毒症与非脓毒症)，也优于基于AUROC分析的入院时生成的SOFA和SAPS II评分。值得注意的是，MEWS和SAPS II并没有明确设计用于脓毒症相关严重程度的测量或预测。然而，这些标准评分代表了一个重要的和众所周知的比较基准，因为它们通常用于败血症管理在临床设置。gydF4y2Ba洞察力的gydF4y2Ba尽管仅使用年龄和延长的生命体征测量，但仍实现了卓越的性能。所有的扩展生命体征测量(收缩压，脉压，呼吸率，心率，SpOgydF4y2Ba_2gydF4y2Ba体温和GCS)是常见的，并且很容易在床边评估。而gydF4y2Ba洞察力gydF4y2Ba系统不提供手动计算的分数，但它确实在日益集成ehr的医院环境中提供了qSOFA和SIRS分数的令人信服的替代方案。gydF4y2Ba

图3gydF4y2Ba和gydF4y2Ba4gydF4y2Ba的ROC曲线比较gydF4y2Ba洞察力gydF4y2Ba有不同的评分系统。gydF4y2Ba洞察力gydF4y2Ba通常可以获得更好的性能。这个结果意味着，对于几乎任何特定的灵敏度，gydF4y2Ba洞察力gydF4y2Ba提供更好的特异性，反之亦然。根据上述定义的金标准，败血症的患病率为11.3%(2577/22,853)。此外，从分析中剔除接受icu前抗生素治疗的患者并没有显著影响结果。的精确召回率曲线gydF4y2Ba图5gydF4y2Ba，gydF4y2Ba洞察力的gydF4y2BaPPV可以轻松地在0.5以上工作，进行0小时检测。对于提前一个或多个小时的预测，如果可以接受相对较低的灵敏度，则可以获得大约0.4的PPV。这将有可能使针对性较窄的干预措施应用于脓毒症诊断几乎确定的一小部分患者，同时在其即将发生的脓毒症发作变得更加明显时，更及时地识别其余病例。gydF4y2Ba

的详细数值结果gydF4y2Ba表4gydF4y2Ba表明,gydF4y2Ba洞察力gydF4y2Ba与其他替代方案相比，它提供了更好的脓毒症预测指标，这些替代方案往往在所有测量(SAPS II, MEWS, SOFA)中具有平均性能，或者在敏感性和特异性(qSOFA, SIRS)之间存在很大的不平衡。虽然我们可以选择一个不同的警报阈值来匹配或超过qSOFA的灵敏度，但这样做会以牺牲其他指标为代价。相对于竞争对手的分数，……的表现gydF4y2Ba洞察力gydF4y2Ba脱颖而出，一方面是因为它具有较高的DOR，另一方面是因为它在其他性能指标之间取得了平衡，而不会降低其他方面的性能。与准确性不同，DOR与阳性类别的流行程度无关。值得注意的是,gydF4y2Ba洞察力gydF4y2Ba在脓毒症发生前4小时的表现至少与比较方法一样强，如果不是更强的话。gydF4y2Ba

为了提高当前评分系统的性能，gydF4y2Ba洞察力gydF4y2Ba通过机器学习过程学习趋势模式和扩展生命周期之间的相关性。SIRS和qSOFA也将其中一些延长的生命体征与怀疑感染结合使用，以诊断败血症，特别是在ICU环境之外。关联的使用gydF4y2Ba洞察力gydF4y2Ba是MEWS评分系统所使用的方法的延伸，该方法将患者生命体征标准化并汇总结果，从而纳入不同临床变量之间的一些相互关系。APACHE III还纳入了某些变量(如pH和pCO)之间的相互关系gydF4y2Ba_2gydF4y2Ba)查阅资料表。同样，趋势信息的使用gydF4y2Ba洞察力gydF4y2Ba建立在SOFA和APACHE III使用的策略基础上，其中可以使用几个患者测量值的最高日值进行评分计算，这意味着合并了一些时间信息。gydF4y2Ba

洞察力gydF4y2Ba这些实验也表明，相对抵抗性能损失减少的测量可用性。gydF4y2Ba表5gydF4y2Ba在发病前预测时间和随机退出频率的范围内，为预测器提供各种性能数据。gydF4y2Ba洞察力gydF4y2Ba在40%退出频率和脓毒症发作时(gydF4y2Ba表5gydF4y2Ba)在脓毒症发作时的表现优于MEWS (gydF4y2Ba表4gydF4y2Ba)。即使有60%的退出频率，gydF4y2Ba洞察力gydF4y2Ba达到比脓毒症发作前4小时的预测时间稍好的表现。这一结果表明，即使测量频率降低到远低于普遍的时间离散频率，预测是一个比处理测量dropout更困难的任务。gydF4y2Ba图6gydF4y2Ba，显示个体ROC曲线gydF4y2Ba图7gydF4y2Ba和gydF4y2Ba8gydF4y2Ba，显示了整个体系的趋势和褶皱间的变化，也支持了这一结论。gydF4y2Ba

这些实验表明gydF4y2Ba洞察力gydF4y2Ba成为一个有效的，高性能的预测器，使用现成的床边数据进行计算。这种性能是通过将机器学习方法应用于相对简单的生命体征数据来实现的。如方法部分所述，gydF4y2Ba洞察力gydF4y2Ba只使用可以通过无处不在的监测设备(脉搏血氧仪、血压监测仪等)和简单的检查随时获得的数据。与MEWS、SOFA和SAPS II评分系统相比，这是一个显著的差异。此外,由于gydF4y2Ba洞察力gydF4y2Ba是一种机器学习算法，它不局限于这些特定的输入测量。在实现中,gydF4y2Ba洞察力gydF4y2Ba可以在任何给定的设置中使用可用的数据进行训练，并将利用与期望的预测结果最相关的可用测量。当然，性能指标会随着可用输入数据的类型和数量而变化，并且需要对任何新的数据集进行训练和验证。gydF4y2Ba

虽然这是一项回顾性研究，但我们正在计划未来通过电子病历整合的前瞻性研究gydF4y2Ba洞察力gydF4y2Ba在ICU环境下的算法。在这样的背景下，gydF4y2Ba洞察力gydF4y2Ba有可能在患者严重恶化或多器官衰竭之前识别有脓毒症风险的患者。gydF4y2Ba洞察力gydF4y2Ba在脓毒症发病前4小时的预测辨别，正如这项工作所证明的，可能为改变病程的临床干预提供宝贵的时间窗口。此外，与现有脓毒症检测方法相比，敏感性和特异性的提高增加了对其准确性的信心gydF4y2Ba洞察力gydF4y2Ba脓毒症警报，因此可以减少与不准确的警报系统相关的“警报疲劳”[gydF4y2Ba17gydF4y2Ba]。报警疲劳被定义为报警过多导致临床医生反应速度或反应率下降的情况。随着准确性的提高和对即将发生的败血症的预警，gydF4y2Ba洞察力gydF4y2Ba有可能改善对有脓毒症发展风险的患者的监测和治疗，并降低相关的高发病率和死亡率。gydF4y2Ba

许多评分系统用于预测患者预后或治疗指导，尽管尚未为此目的开发(例如SOFA)。我们基于无处不在的生命体征数据，为预测ICU患者的脓毒症发作，提出了一种专门构建的替代系统。在这项研究中，gydF4y2Ba洞察力gydF4y2Ba在各种现实条件下的测试中优于所有其他败血症评分系统。与以前的机器学习系统相比，gydF4y2Ba洞察力gydF4y2Ba达到类似的[gydF4y2Ba18gydF4y2Ba或更好的[gydF4y2Ba19gydF4y2Ba，gydF4y2Ba20.gydF4y2BaAUROC在脓毒症检测中的表现(发病前0小时为0.8799 [SD 0.0056])，并在使用明显更有限的患者数据收集时提供一定的预后能力[gydF4y2Ba21gydF4y2Ba]。gydF4y2Ba

限制gydF4y2Ba

在这项研究中有几个实际的限制。首先，它不是为了“发现”一组可以创建手动评分系统的规则而设计的。gydF4y2Ba洞察力gydF4y2Ba是一个自动的电子病历集成系统。由于它的几个顺序计算，包括将输入数据映射到高维特征空间，gydF4y2Ba洞察力gydF4y2Ba手工计算分数是不可行的。然而，这些计算对于计算机来说是微不足道的，可以在几分之一秒内执行。未来的工作可能会研究gydF4y2Ba洞察力gydF4y2Ba系统可以向临床医生提供清晰的预测解释，包括近似人工计算的公式。黄金标准是基于败血症-3的定义[gydF4y2Ba3.gydF4y2Ba也带来了一些困难。脓毒症的发病是一个定义不清的事件，Singer等人并不想确定发病时间;因此，将它们的定义用于此目的可能会有问题。gydF4y2Ba

我们还选择只使用MIMIC-III (v1.3)数据库中的一小部分患者。由于目前可用的MIMIC-III版本的培养报告不足，特别是对于使用CareVue系统记录的患者，我们选择仅与使用替代Metavision系统记录的患者一起工作，以获得不同部位疑似感染的更完整图像。未来的工作将解决这些限制。gydF4y2Ba

另一个限制是，本研究仅在ICU数据和单一中心进行，这可能限制了我们的结果推广到其他医院和医院系统。而gydF4y2Ba洞察力gydF4y2Ba仅使用非ICU病房通常可用的数据进行操作，本特定研究中关于ICU数据的结果报告不能保证在其他设置中具有相同的性能。gydF4y2Ba

结论gydF4y2Ba

脓毒症的预测是一个具有挑战性的问题，尽管多年的研究和发展努力仍然如此，因为它的表现往往不清楚，直到后期。gydF4y2Ba洞察力gydF4y2Ba是专门为这个挑战设计的机器学习方法。在这项研究中，gydF4y2Ba洞察力gydF4y2Ba被证明是一种有效的预测器，使用简单和容易获得的患者数据进行计算。然而，在我们的实验中，gydF4y2Ba洞察力gydF4y2Ba在ICU入院时计算时，优于复杂的实验室值依赖的SAPS II和SOFA评分，并且与文献中的其他机器学习方法相比，它的表现不需要它们所包含的实验室测试。这些实验也表明gydF4y2Ba洞察力gydF4y2Ba抵抗用于模拟真实世界数据不可用的显著随机数据删除导致的性能下降。gydF4y2Ba洞察力gydF4y2Ba在性能上也优于使用类似数据进行计算的qSOFA和SIRS评分系统。虽然这两个分数的优点是无需计算机辅助即可轻松计算，gydF4y2Ba洞察力gydF4y2Ba很容易在ehr集成环境中自主应用，并且在不需要收集任何额外数据的情况下提供高性能替代方案。gydF4y2Ba

致谢gydF4y2Ba

本材料基于国家科学基金(基金号1549867)资助的工作。资助者在研究的实施中没有任何作用;数据的收集、管理、分析和解释;稿件的准备、审查和批准;并决定投稿发表。gydF4y2Ba

我们感谢Dr. Angela J. Rogers、Samson Mataraso、Nima Shajarian、Jasmine Jan、Adrian Gunawan、Allen Chen和Lauren Song对本文的协助。gydF4y2Ba洞察力gydF4y2Ba。gydF4y2Ba

利益冲突gydF4y2Ba

所有与Dascena (Hayward, CA, USA)有关联的作者都是Dascena的员工。gydF4y2Ba

flischmann C, Scherag A, Adhikari NK, Hartog CS, Tsaganos T, Schlattmann P，国际急症临床医师论坛。医院治疗脓毒症的全球发病率和死亡率评估目前的估计和限制。[J]中华呼吸与急救医学杂志，2016;33(3):259-272。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Angus DC, Linde-Zwirble WT, Lidicker J, Clermont G, Carcillo J, Pinsky MR.美国严重脓毒症的流行病学:发病率、结局和相关护理费用分析。中华危重医学杂志;2001;29(7):1303-1310。［gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Singer M, Deutschman CS, Seymour CW, Shankar-Hari M, Annane D, Bauer M，等。脓毒症和感染性休克第三次国际共识定义(脓毒症-3)。中国医学杂志2016年2月23日;315(8):801-810。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Vincent JL, Moreno R, Takala J, Willatts S, De MA, Bruining H，等。SOFA(败血症相关器官衰竭评估)评分用于描述器官功能障碍/衰竭。代表欧洲重症医学会脓毒症相关问题工作组。重症监护医学1996;22(7):707-710。［gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Calvert JS, Price DA, chetally UK, Barton CW, Feldman MD, Hoffman JL等。早期脓毒症检测的计算方法。中国生物医学工程学报(英文版);2016;44(4):693 - 693。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
李建军，李建军，李建军，等。酒精使用障碍患者感染性休克的高效检测与早期预测。安医外科2016年6月;8:50-55 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
李建军，李建军，李建军，等。生理评分系统在急诊科的应用。中华医学杂志;2006;23(11):841-845 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Le Gall J, Lemeshow S, Saulnier F.基于欧洲/北美多中心研究的简化急性生理评分(SAPS II)。《美国医学会杂志》1993;270(24):2957 - 2963。［gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
RA的踌躇不前。严重败血症和感染性休克。定义、流行病学和临床表现。危重症护理杂志，2000;16(2):179-192。［gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Johnson AE, Pollard TJ, Shen L, Lehman LH, Feng M, Ghassemi M，等。MIMIC-III，一个免费访问的重症监护数据库。Sci Data 2016;3:160035 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Seymour CW, Liu VX, Iwashyna TJ, Brunkhorst FM, Rea TD, Scherag A，等。脓毒症临床标准评估:脓毒症和感染性休克第三次国际共识定义(脓毒症-3)。美国医学杂志2016年2月23日;315(8):762-774。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Jones AE, Trzeciak S, Kline JA。序贯器官衰竭评估评分用于预测严重脓毒症患者的预后，以及在急诊室就诊时出现灌注不足的证据。中华医学杂志;2009;37(5):1649-1654 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
郝建军，刘建军，刘建军，等。人工生命体征对创伤患者生命干预需求的预测。中华创伤杂志2005;59(4):821-8;讨论828年。［gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
克利夫兰诊所。生命体征gydF4y2Bahttp://my.clevelandclinic.org/health/diagnostics/hic_Vital_SignsgydF4y2Ba［gydF4y2BaWebCite缓存gydF4y2Ba］gydF4y2Ba
邹宏，张海涛。基于弹性网的正则化和变量选择。[J] .统计学报，2005;37(2):391 - 391。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Calvert JS, Price DA, Barton CW, chetally UK, Das R.基于稳态分析新技术的流量推荐。J Am Med Inform association 2016年3月28日Epub提前印刷(即将出版)。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
张建军，张建军。警铃疲劳对患者安全的影响。麻醉学杂志，2015;28(6):685-690。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Nachimuthu SK, Haug PJ。动态贝叶斯网络在急诊科败血症早期检测中的应用。安徽农业大学学报(自然科学版);2012;39 - 44 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
李建军，李建军。基于隐马尔可夫模型的新生儿脓毒症早期检测。IEEE生物医学学报;2014;18(5):1560-1570。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
李建军，李建军，李建军，等。一种基于分层开关线性动态系统的新生儿脓毒症监测方法。发表于第30届人工智能不确定性会议论文集(UAI)。2014年7月23日演讲地点:;2014;加拿大魁北克市，第752-761页。gydF4y2Ba
Henry KE, Hager DN, Pronovost PJ, Saria S.一种针对感染性休克的实时预警评分(TREWScore)。中国科学d辑(英文版);2015;7(12):299ra122。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba

‎gydF4y2Ba

4月:gydF4y2Ba精密度-召回曲线下面积gydF4y2Ba

AUROC:gydF4y2Ba接收机工作特性下面积gydF4y2Ba

BIDMC:gydF4y2Ba贝斯以色列女执事医疗中心gydF4y2Ba

情事属实者:gydF4y2Ba冠状动脉监护室gydF4y2Ba

CSRU:gydF4y2Ba心脏外科康复室gydF4y2Ba

DiasABP:gydF4y2Ba侵入性舒张动脉血压gydF4y2Ba

金龟子:gydF4y2Ba诊断优势比gydF4y2Ba

电子健康档案:gydF4y2Ba电子健康记录gydF4y2Ba

外国游客1:gydF4y2Ba查准率和查全率的调和平均值gydF4y2Ba

gc:gydF4y2Ba格拉斯哥昏迷评分gydF4y2Ba

HIPAA:gydF4y2Ba健康保险流通与责任法案gydF4y2Ba

加护病房:gydF4y2Ba加护病房gydF4y2Ba

差:gydF4y2Ba四分位范围gydF4y2Ba

LR +:gydF4y2Ba正似然比gydF4y2Ba

LR -:gydF4y2Ba负似然比gydF4y2Ba

喵喵:gydF4y2Ba修改预警评分gydF4y2Ba

MICU:gydF4y2Ba医疗加护病房gydF4y2Ba

模仿III:gydF4y2Ba重症监护多参数智能监测IIIgydF4y2Ba

NIDiasABP:gydF4y2Ba无创舒张动脉血压gydF4y2Ba

NISysABP:gydF4y2Ba无创动脉收缩压gydF4y2Ba

净现值:gydF4y2Ba负预测值gydF4y2Ba

PPV:gydF4y2Ba阳性预测值gydF4y2Ba

qSOFA:gydF4y2BaquickSOFAgydF4y2Ba

中华民国:gydF4y2Ba接收机工作特性gydF4y2Ba

削弱了II:gydF4y2Ba简化急性生理评分IIgydF4y2Ba

SICU:gydF4y2Ba外科加护病房gydF4y2Ba

先生们:gydF4y2Ba全身炎症反应综合征gydF4y2Ba

沙发:gydF4y2Ba序贯(败血症相关)器官衰竭评估gydF4y2Ba

动脉血氧饱和度:gydF4y2Ba外周毛细血管血氧饱和度gydF4y2Ba

SysABP:gydF4y2Ba侵入性收缩压gydF4y2Ba

TSICU:gydF4y2Ba创伤外科重症监护室gydF4y2Ba

G·艾森巴赫编辑;提交13.07.16;G Bernard, C Coopersmith, JL Vincent的同行评审;对作者04.08.16的评论;收到修订版本12.08.16;接受29.08.16;发表30.09.16gydF4y2Ba

©Thomas Desautels, Jacob Calvert, Jana Hoffman, Melissa Jay, Yaniv Kerem, Lisa Shieh, David Shimabukuro, Uli Chettipally, Mitchell D Feldman, Chris Barton, David J Wales, Ritankar Das。原发表于JMIR医学信息学(http://medinform.www.mybigtv.com)， 2016年9月30日。gydF4y2Ba

这是一篇在知识共享署名许可(http://creativecommons.org/licenses/by/2.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息，到http://medinform.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。gydF4y2Ba

本文内容如下gydF4y2Bae-collection /主题问题:gydF4y2Ba

用最少的电子健康记录数据预测重症监护病房的败血症:一种机器学习方法gydF4y2Ba

用最少的电子健康记录数据预测重症监护病房的败血症:一种机器学习方法gydF4y2Ba

原始论文gydF4y2Ba

通讯作者:gydF4y2Ba

摘要gydF4y2Ba

关键字gydF4y2Ba

介绍gydF4y2Ba

方法gydF4y2Ba