医学互联网研究杂志——基于机器学习的儿童心脏手术后急性肾损伤预测:模型开发和验证研究

原始论文

¹中南大学湘雅第二医院肾内科，长沙，中国

²中南大学湘雅第二医院心血管外科，长沙，中国

^3.中南大学湘雅第二医院信息中心，长沙，中国

⁴中南大学湘雅第三医院肾内科，长沙，中国

⁵中南大学湘雅医院心血管外科，长沙，中国

⁶中南大学湘雅医院儿科，长沙，中国

*这些作者贡献相同

通讯作者:

段少斌，医学博士

肾内科

中南大学湘雅第二医院

人民路139号

长沙,410011

中国

电话:86 731 85295100

电子邮件:duansb528@csu.edu.cn

背景:心脏手术相关的急性肾损伤(CSA-AKI)是儿童心脏手术后的主要并发症，与发病率和死亡率的增加有关。术前及术后早期预测CSA-AKI可显著提高围手术期预防和治疗策略的实施。然而，关于如何识别CSA-AKI高危儿科患者的临床信息有限。

摘要目的:该研究旨在开发和验证机器学习模型，以预测儿科人群中CSA-AKI的发展。

方法:本回顾性队列研究招募了在中国中南大学3个医学中心接受心脏手术和体外循环的1个月至18岁的患者。CSA-AKI是根据2012年肾脏疾病:改善全球预后标准定义的。特征选择分别应用于两个数据集:术前数据集和术前和术中合并数据集。测试了多种机器学习算法，包括k近邻、朴素贝叶斯、支持向量机、随机森林、极限梯度增强(XGBoost)和神经网络。通过使用受试者工作特征曲线(AUROC)下的面积进行交叉验证，确定了性能最佳的模型。模型解释采用Shapley加性解释(SHAP)方法生成。

结果:来自其中一个中心的3278例患者被用于模型推导，而来自另外两个中心的585例患者被用作外部验证队列。衍生队列中564例(17.2%)患者发生CSA-AKI，外部验证队列中51例(8.7%)患者发生CSA-AKI。在考虑的机器学习模型中，XGBoost模型在交叉验证中取得了最好的预测性能。仅使用术前变量的XGBoost模型的AUROC在推导队列中为0.890 (95% CI 0.876-0.906)，在外部验证队列中为0.857 (95% CI 0.800-0.903)。纳入术中变量后，2组AUROC分别上升至0.912 (95% CI 0.899-0.924)和0.889 (95% CI 0.844-0.920)。SHAP法显示基线血肌酐水平、灌注时间、体长、手术时间、术中出血量是CSA-AKI的前5个预测因素。

结论:可解释的XGBoost模型为CSA-AKI的早期预测提供了实用工具，对儿科心脏手术患者的风险分层和围手术期管理有价值。

中国医学杂志，2017;25:e41142

doi: 10.2196/41142

关键字

心脏手术；急性肾损伤；儿科；机器学习

全世界每年有越来越多的儿童患者因各种原因接受心脏手术，包括先天性心脏病和获得性心脏病[1］．心脏手术相关的急性肾损伤(CSA-AKI)是儿童心脏手术后的主要并发症，以肾功能突然下降为特征。据报道，在接受心脏手术的儿童患者中，CSA-AKI的发生率为5%至42% [2］．重要的是，CSA-AKI与发病率和死亡率显著增加、住院时间延长和慢性肾脏疾病风险增加有关[3.-5］．

早期预测CSA-AKI可显著提高围手术期预防和治疗策略的实施。术前预测有助于手术风险评估和预防CSA-AKI，术后早期预测有助于早期发现CSA-AKI，进行积极干预[6］．因此，建立精确的CSA-AKI预测模型，识别高危患者，优化小儿心脏手术患者围手术期管理，具有重要的临床意义。最近，一些结合生物标志物和临床变量的预测模型已经建立，目的是预测儿童人群中CSA-AKI的发展[7-9］．然而，这些模型受到样本量小、缺乏内部和外部验证以及由于使用新型生物标志物而造成的额外经济负担的限制。

广泛使用机器学习来分析来自电子健康记录的临床数据，为建立预测模型提供了相当大的优势。机器学习是一门科学学科，它使用计算机算法，从数据中学习，很少有人干预。10］．先进的机器学习算法可以建模非线性关系，分析复杂的高阶相互作用，并稳健地处理预测变量之间的多重共线性。机器学习的应用在各个医疗领域都取得了重大突破，如急诊分诊[11]，诱导后低血压的预测[12]，以及对比后急性肾损伤的风险分层[13］．机器学习方法在成人CSA-AKI的早期预测中也显示出良好的表现[14-19]，但它们在儿科人群中对CSA-AKI的预测性能尚未得到测试。小儿CSA-AKI的原发疾病、基础病理生理及危险因素与成人患者有显著差异[20.-22］．因此，现有的成人CSA-AKI预测模型不适用于儿科患者。本研究的目的是开发和验证机器学习模型，以预测接受心脏手术的儿童患者CSA-AKI的发展。

研究设计

本研究包括来自中国中南大学3个不同医学中心的患者。衍生队列包括2015年1月至2022年3月在湘雅第二医院住院的患者。外部验证队列包括2016年1月至2021年12月在湘雅医院住院的患者和2015年1月至2021年12月在湘雅第三医院住院的患者。

伦理批准

本研究遵循赫尔辛基宣言和个体预后或诊断声明的多变量预测模型的透明报告[23］．本研究方案经中南大学湘雅第二医院医学伦理委员会批准(2022-K031)。由于本研究的回顾性性质和最低风险，放弃了知情同意的要求。

研究参与者

本研究包括所有年龄在1个月至18岁之间接受心脏手术并进行体外循环的儿科患者。我们纳入术前至少有一次血清肌酐(SCr)测量和术后7天内另一次血清肌酐(SCr)测量的患者。我们排除了先天性肾畸形患者，术前估计肾小球滤过率(eGFR)为15 mL/min/1.73 m²或者更低，或者7天内多次手术。我们使用修正Schwartz方程计算eGFR，如果体长缺失，则使用全年龄谱方程[24，25］．关于在推导和外部验证队列中选择患者的细节在图1．

预测变量

潜在的预测因素包括那些被认为与CSA-AKI发展相关的临床因素和电子健康记录中可用的预测因素，其中不到30%的此类观察缺失。潜在的预测因素分为术前和术中变量。术前变量包括患者人口统计、术前情况、实验室检查和药物。根据入院诊断、术前诊断及术前麻醉面谈记录确定术前条件。最近的术前测量用于实验室变量。根据解剖治疗化学分类系统对药物进行分类，包括手术前7天内给药的药物[26］．术中数据从麻醉、体外循环、手术记录中提取。手术的复杂性由先天性心脏手术风险调整-1 (RACHS-1)评分决定，RACHS-1评分是一种基于共识的工具，用于评估基于所执行手术类型的短期死亡风险[27］．失血量计算为术野失血量、泵内残留血量以及其他途径的任何额外失血量之和。总液体平衡计算为总液体输入和总液体输出之间的差值，并根据体重进行校正。

结果测量

主要结果是CSA-AKI的发展，这是根据2012年肾脏疾病:改善全球结果(KDIGO)临床实践指南确定的[28］．CSA-AKI定义为术后48小时内SCr水平与基线相比至少增加0.3 mg/dL或术后7天内SCr水平增加50%。以术前90天内最近的SCr值为基线。次要结局包括CSA-AKI 2-3期(由KDIGO标准定义)、住院死亡率、重症监护病房住院时间和术后住院时间。

统计分析

描述性统计数据以连续变量的中位数和四分位间距表示，以分类变量的数字和百分比表示。数据分布采用Mann-Whitney进行比较U连续变量检验和分类变量卡方检验。对分类变量进行单热编码，将分类变量预处理为二进制变量。缺失数据采用随机森林方法，使用R[中的missForest包。29］．数据类型的描述和每个变量的缺失值可以在表S1中找到多媒体附件1．

特征选择

方差接近于零的预测变量，即那些唯一值的百分比小于5%的预测变量，从分析中删除。随后，使用4种特征选择方法获取预测变量的子集，用于进一步的模型开发。该方法包括最小绝对收缩选择算子、Boruta算法、随机森林递归特征消除和随机森林滤波。对4种方法的结果进行综合评价，最终选取4种方法中出现次数超过3次的预测变量建立模型。特征选择进行了两次，第一次只包括术前变量，然后结合术前和术中变量。使用R中的glmnet、Boruta和插入包进行特征选择。

模型开发和验证

为了模型开发，以下机器学习算法应用于仅术前和推导队列的组合数据集:k最近邻、朴素贝叶斯、支持向量机、随机森林、极端梯度增强(XGBoost)和神经网络。我们进行了5次随机5次交叉验证，以确保对模型性能进行无偏倚评估，并为每个模型确定最优超参数。基于5×5迭代中受试者工作特征曲线(auroc)下的平均面积评估模型性能。之后，为每个数据集选择性能最好的机器学习模型。R中的插入包用于模型开发。的表S2中提供了每种机器学习算法使用的函数、包和调优参数的详细信息多媒体附件2．

最终预测模型的性能在外部验证队列中进一步评估。模型性能的指标包括AUROC，精度召回曲线下的面积(AUPRC)和校准图。AUROC被用作主要绩效指标，因为它独立于班级不平衡设置中的阈值。众所周知，AUPRC对于类不平衡预测任务的信息量更大，因为它对假阳性预测数量的变化很敏感[30.］．此外，将最终的机器学习模型的性能与传统的逻辑回归模型进行了比较。的模型建立框架如图S1所示多媒体．

模型的解释

采用Shapley相加解释(SHAP)方法对最终预测模型的可解释性进行了探讨。SHAP是解释模型预测的统一方法，它为预测模型中的每个特征提供一致和局部准确的归因值，即SHAP值[31］．较高的SHAP值表明CSA-AKI的概率增加。预测变量对CSA-AKI的贡献可以解释为变量归因对每次观测的整个输出风险的累积效应。

敏感性分析

进行敏感性分析，以检验模型对CSA-AKI阶段2-3的预测能力。模型性能也在亚组中进行了评估，重点关注不同年龄组的患者(婴儿:1个月至1岁;童年:2-10岁;青春期:11-18岁)[32]和不同手术复杂性的患者(RACHS-1评分为2分或更低;RACHS-1分3分以上)。此外，为了将预测模型转化为临床风险分层工具，我们确定了预测概率的低和高风险临界值。分析包括敏感性、特异性、阳性和阴性预测值、阳性和阴性似然比。最后，为了评估不平衡结果对模型性能的影响，我们应用上抽样或下抽样来生成一个平衡的推导队列用于模型训练。所有统计分析均采用R 4.1.2 [33］．一个2-tailedP的值。05被认为有统计学意义。

病人的特点

本研究共纳入3863名参与者，即衍生队列3278人，外部验证队列585人。衍生和外部验证队列中患者的基线特征和结果显示在表1．在衍生队列中，564例(17.2%)患者发生CSA-AKI，其中356例(10.9%)为1期，142例(4.3%)为2期，66例(2%)为3期。在外部验证队列中，51例(8.7%)患者发生CSA-AKI，其中25例(4.3%)为1期，14例(2.4%)为2期，12例(2.1%)为3期。的表S3和表S4提供了根据CSA-AKI发展的基线特征和结果的比较多媒体附件4．

表1。推导和外部验证队列中患者的基线特征和结果。

变量		衍生队列(n=3278)	外部验证队列(n=585)
人口统计资料
	年龄(年)，中位数(IQR)	1 (0.5 - 4)	4 (1 - 8)
	性别(男性)，n (%)	1709 (52.1)	288 (49.2)
	体长(cm)，中位数(IQR)	79年(65 - 105)	100年(80 - 128)
	体重(kg)，中位数(IQR)	9.5 (6.0 - -16.0)	15.0 (10.0 - -22.5)
ABO血型，n (%)
	输入一个	1100 (33.6)	200 (34.4)
	B型	744 (22.7)	134 (23)
	O型	1182 (36.1)	197 (33.8)
	AB型	252 (7.7)	51 (8.8)
术前条件
	青色心脏病，n (%)	740 (22.6)	113 (19.3)
	肺动脉高压，n (%)	1763 (53.8)	241 (41.2)
	肺部感染，n (%)	293 (8.9)	30 (5.1)
	感染性心内膜炎n (%)	44 (1.3)	9 (1.5)
	既往心脏手术史，n (%)	181 (5.5)	21日(3.6)
	遗传疾病，n (%)	72 (2.2)	12 (2.1)
	非心脏畸形，n (%)	111 (3.4)	15 (2.6)
	术前重症监护，n (%)	168 (5.1)	10 (1.7)
	术前住院时间(天)，中位(IQR)	4(2 - 7日)	6 (3 - 7)
美国麻醉医师协会物理状态，n (%)
	Ⅰ	21日(0.6)	0 (0)
	Ⅱ	589 (18)	120 (21.2)
	Ⅲ	1978 (60.6)	339 (59.8)
	Ⅳ	665 (20.4)	108 (19)
	V	12 (0.4)	0 (0)
实验室测试
	基线肌酐(µmol/L)，中位数(IQR)	25.3 (20.4 - -33.5)	44.0 (36.0 - -53.0)
	基线估计肾小球滤过率(mL/min/1.73 m2)，中位数(IQR)	118.0 (99.5 - -138.0)	85.0 (72.4 - -97.1)
	左室射血分数(%)，中位数(IQR)	69年(66 - 73)	66年(62 - 70)
	血红蛋白(g/L)，中位数(IQR)	119年(107 - 129)	125年(117 - 135)
	红细胞分布宽度(%)，中位数(IQR)	13.4 (12.7 - -14.7)	13.6 (12.9 - -14.7)
	白细胞(×10⁹/L)，中位数(IQR)	8.0 (6.5 - -9.8)	7.6 (6.3 - -9.5)
	血小板(×10⁹/L)，中位数(IQR)	314年(253 - 383)	271年(223 - 326)
	试纸白蛋白尿n (%)	57 (2.1)	4 (0.8)
	血尿素氮(mmol/L)，中位数(IQR)	4.08 (2.96 - -5.12)	4.16 (3.22 - -5.05)
	总胆红素(µmol/L)，中位数(IQR)	7.4 (5.1 - -10.9)	7.3 (5.1 - -11.0)
	丙氨酸转氨酶(U/L)，中位数(IQR)	16.4 (11.7 - -25.3)	14.2 (11.1 - -19.0)
	天冬氨酸转氨酶(U/L)，中位数(IQR)	34.9 (27.4 - -45.4)	31.4 (25.6 - -39.1)
	白蛋白(g/L)，中位数(IQR)	40.3 (38.2 - -42.3)	43.1 (41.0 - -45.4)
	钾(mmol/L)，中位数(IQR)	4.80 (4.46 - -5.12)	4.45 (4.19 - -4.73)
	钠(mmol/L)，中位数(IQR)	138.3 (137.0 - -139.7)	140.0 (138.7 - -141.1)
	氯化物(mmol/L)，中位数(IQR)	103.2 (101.6 - -104.7)	104.1 (102.7 - -105.5)
	钙(mmol/L)，中位数(IQR)	2.40 (2.32 - -2.49)	2.46 (2.37 - -2.54)
术前用药，n (%)
	碘造影剂	411 (12.5)	73 (12.5)
	地高辛	104 (3.2)	11 (1.9)
	利尿剂	316 (9.6)	38 (6.5)
	非甾体类抗炎药	54 (1.6)	12 (2.1)
	血管紧张素转换酶抑制剂/血管紧张素Ⅱ受体阻滞剂	61 (1.9)	4 (0.7)
	对肾脏有害处的抗生素	61 (1.9)	1 (0.2)
	抗病毒药物	163 (5)	1 (0.2)
术中变量
	急诊手术n (%)	168 (5.1)	14 (2.4)
	操作时间(min)，中位数(IQR)	155年(129 - 197)	190年(165 - 230)
	灌注时间(min)，中位数(IQR)	58 (44 - 84)	63 (46 - 90)
	十字夹紧时间(min)，中位数(IQR)	33 (23-51)	37 (23-55)
	心脏复律，n (%)	279 (8.5)	73 (12.5)
	最低平均动脉压(mmHg)，中位数(IQR)	35 (31-40)	38(31 - 45岁)
	最低核心温度(°C)，中位数(IQR)	33.3 (31.8 - -34.4)	33.3 (31.7 - -34.7)
	术中出血量(mL/kg)，中位(IQR)	21.4 (14.8 - -31.3)	20.0 (15.4 - -26.2)
	术中液平衡(%)，中位数(IQR)	-0.7(-1.9到0.1)	1.6(-0.2到2.9)
先天性心脏手术风险调整-1分，n (%)
	1	480 (14.9)	92 (16.2)
	2	2032 (63)	386 (67.8)
	3.	653 (20.3)	84 (14.8)
	4	59 (1.8)	7 (1.2)
结果
	急性肾损伤n (%)	564 (17.2)	51 (8.7)
	急性肾损伤2-3期n (%)	208 (6.3)	26日(4.4)
	住院死亡率，n (%)	38 (1.2)	5 (0.9)
	重症监护病房住院天数(天)，中位数(IQR)	2 (1 - 3)	1 (1 - 2)
	住院天数(天)，中位数(IQR)	8 (7 - 13)	8 (7 - 9)

预测变量

4种特征选择方法共选取25个术前变量作为CSA-AKI的预测因子，纳入机器学习模型(表S5)多媒体)．术前和术中变量合并时，共纳入27个变量;其中术前变量20个，术中变量7个(表S6)多媒体)．

模型的性能

在考虑的机器学习模型中，XGBoost模型在术前和合并数据集上的表现最好，交叉验证的平均AUROC分别为0.795和0.832(表S7)多媒体附件6)．术中变量的加入提高了所有考虑的机器学习模型的预测能力。XGBoost和传统逻辑回归模型的auroc如图所示图2．仅包含术前变量的XGBoost模型在推导队列中AUROC为0.890 (95% CI 0.876-0.906)，在外部验证队列中AUROC为0.857 (95% CI 0.800-0.903)。纳入术中变量后，推导组XGBoost模型AUROC上升至0.912 (95% CI 0.899-0.924)，外部验证组AUROC上升至0.889 (95% CI 0.844-0.920)。对于推导和外部验证队列，XGBoost算法都比传统逻辑回归获得了更高的auroc。的图S2和S3提供了其他性能指标的详细信息，包括auprc和校准图多媒体．由于CSA-AKI患者和非CSA-AKI患者比例不平衡，使用联合数据集的XGBoost模型的AUPRC在推导队列中为0.747，在外部验证队列中为0.476。在推导组和外部验证组中，XGBoost模型对合并数据集的Brier评分分别为0.085和0.060。最终的XGBoost模型可以在LuoXiaoqin123/pediatric-CSA-AKI (GitHub)上访问[34］．

图2。极端梯度增强与传统逻辑回归模型的受试者工作特征曲线。(A-B) (A)推导组和(B)外部验证组只有术前变量时模型的受试者工作特征曲线。(C-D)在(C)推导组和(D)外部验证组中，模型与术前和术中变量的受试者工作特征曲线。AUC:曲线下面积;XGBoost:极端梯度增强。

模型的解释

XGBoost模型的SHAP汇总图显示在图3，说明了每个特性的高值和低值与SHAP值的关系。这些图表还确定了对模型预测影响最大的特征。基线SCr、灌注时间、体长、手术时间和术中出血量是XGBoost模型中与CSA-AKI相关的前5个预测变量。合并数据集的XGBoost模型的SHAP依赖图如图S4所示多媒体附件8，显示了预测因子与CSA-AKI风险之间的非线性关联。这些图表显示了单个特征的变化如何影响模型输出。

图3。心脏手术相关急性肾损伤的极端梯度增强模型的Shapley相加解释总结图。(A)只有术前变量的极端梯度增强模型的Shapley相加解释总结图。(B)极端梯度增强模型与术前和术中变量的Shapley相加解释总结图。在计算每个观察的输出风险时，为每个特征属性创建一个点。ALT:丙氨酸转氨酶;ASA:美国麻醉医师学会;AST:天门冬氨酸转氨酶;eGFR:估计肾小球滤过率;MAP:平均动脉压; RACHS: Risk Adjustment for Congenital Heart Surgery; RDW: red blood cell distribution width; SHAP: Shapley additive explanations.

敏感性分析

XGBoost模型对CSA-AKI分期2-3表现出良好的预测性能，推导组和外部验证组的auroc分别高于0.85(图S5)多媒体)．当模型应用于不同年龄组或不同手术复杂性的患者时，模型的性能保持稳定(图S6-S10)多媒体附录10)．为了便于XGBoost模型的临床应用，确定了低、高危临界值。模型在低、高风险截点处的诊断试验特征如图所示表2．例如，应用于组合数据集的XGBoost模型产生以下临床相关阈值。低风险临界值为0.099，敏感性为95%，阴性预测值为98.3%;这个值涵盖了绝大多数CSA-AKI患者，仅遗漏了一小部分假阴性患者。高危临界值0.374特异性为95%，阳性似然比为12.12。因此，低风险临界值适用于低水平干预，而高风险临界值可用于识别需要更密集干预的CSA-AKI高风险患者。此外，当我们使用上采样或下采样的平衡推导队列来训练模型时，模型仍然取得了很好的预测性能(图S11和S12)多媒体附件11)．

表2。极端梯度增强模型在低、高风险截断点的诊断试验特征。

模型组				截断值		灵敏度(%)		特异性(%)		阳性预测值(%)		阴性预测值(%)		正似然比		负似然比
只有术前变量的模型
	推导队列
		低风险截止	0.103		95		52.7		29.4		98.1		2.01		0.09
		高风险截止	0.365		55.3		95		69.8		91.1		11.12		0.47
	外部验证队列
		低风险截止	0.103		84.3		80.1		28.9		98.2		4.25		0.20
		高风险截止	0.365		7.8		99.8		80		91.9		41.88		0.92
术前和术中变量模型
	推导队列
		低风险截止	0.099		95		58.3		32.2		98.3		2.28		0.09
		高风险截止	0.374		60.3		95		71.6		92		12.12		0.42
	外部验证队列
		低风险截止	0.099		80.4		80.5		28.3		97.7		4.13		0.24
		高风险截止	0.374		27.5		98.7		66.7		93.4		20.94		0.74

主要研究结果

在这项多中心回顾性研究中，我们使用机器学习方法开发了儿科CSA-AKI的预测模型，并进行了外部验证。在模型开发过程中测试了多种机器学习算法，最终确定XGBoost算法具有最强的辨别能力。此外，XGBoost模型在术前和合并数据集上都显示出有希望的预测性能，证明了它们在预测儿科CSA-AKI方面的潜在有用性。据我们所知，我们的研究是第一个在儿科人群中建立CSA-AKI的机器学习模型，对风险分层和临床决策有价值。

先前的研究表明，机器学习算法在预测成人CSA-AKI方面具有优势[14-19］．李等[14]首次应用机器学习方法预测成人CSA-AKI的所有阶段。他们的研究表明，XGBoost在预测CSA-AKI方面比传统的逻辑回归或风险评分表现得更好。开发了基于机器学习算法的其他预测模型，以预测中国成年人群的CSA-AKI [18］．另一项研究建立了机器学习模型，结合术中时间序列和其他特征来预测成人CSA-AKI。在该研究中，集成模型(随机森林+ XGBoost)的预测性能最好[19］．然而，儿童人群的原发疾病、共病状况和肾脏生理与成人人群有显著差异，这使得成人预测模型不适用于预测儿科患者的CSA-AKI [35］．到目前为止，还没有为婴儿和儿童建立具有机器学习技术前瞻性应用的CSA-AKI预测模型。在这项研究中，使用XGBoost算法的模型在考虑的机器学习模型中具有最强的预测能力。XGBoost模型使用外部验证队列进一步验证，它们对儿科CSA-AKI表现出一致的预测性能。此外，敏感性分析表明，XGBoost模型在大多数按年龄或手术复杂性分组的患者亚组中显示出类似的预测性能。总的来说，结果证明了XGBoost模型在接受心脏手术的儿童患者中的稳健性和适用性。

术前和术中因素均可预测术后AKI。曾等人[19]强调了术中特征的价值，这些特征反映了与成人CSA-AKI预测相关的术中快速生理变化。另一项回顾性研究发现，通过整合术前和术中特征，术后AKI模型可以将40%的假阴性患者从术前模型中重新分类[36］．我们的研究表明，结合术前和术中变量的XGBoost模型比仅使用术前变量的预测效果更好。尽管如此，这两种模型都表现出足够的预测能力和对小儿CSA-AKI术前或术后早期预测的潜在效用。术前预测可以帮助医生评估手术风险，支持预防策略的实施。术后早期预测有助于优化术后管理和护理计划，如持续评估肾功能、血流动力学监测、避免肾毒素或肾替代治疗。

使用SHAP方法来揭开XGBoost模型的黑箱。该方法是一种模型不可知的解释技术，已被广泛用于解释预测因子对模型输出的贡献[37，38］．与最新的系统综述一致，我们发现较低的基线SCr、较长的灌注时间、较长的手术时间、较高的基线eGFR、较年轻和较低的体重与儿科CSA-AKI的发生有关[3.，39］．我们还发现体长、术中失血量、血清钾和血清钙是CSA-AKI的重要预测因素。值得注意的是，前5个重要预测因子中有3个是术中变量，这表明手术本身对CSA-AKI的发生有显著影响。在心脏手术过程中，可能发生明显的病理生理改变，如缺血-再灌注损伤、炎症反应或凝血通路激活等，可能导致肾脏损伤和功能障碍[40］．此外，以往研究中使用的传统逻辑回归仅限于揭示预测因子与CSA-AKI之间的线性关系[41-43］．相比之下，我们研究中的SHAP依赖图反映了复杂的非线性关系，这有助于理解预测变量的变化与CSA-AKI风险之间的关系。

我们的发现具有重要的临床意义。首先，确定低高危临界值，促进XGBoost模型的临床应用。这将使护理团队能够识别CSA-AKI高危患者，并制定最佳的围手术期管理策略。其次，我们的模型使用了临床实践中常规收集的术前和术中变量，因此没有给标准临床护理程序增加额外的实验室测试或经济负担。第三，发现可修改的预测因子可能促进早期干预以减轻CSA-AKI的风险。

限制

我们的研究有几个局限性。首先，从电子健康记录中回顾性收集数据。其次，研究人群仅限于三级医疗机构，因为中国的初级医疗机构通常不提供儿童心脏手术。因此，我们的预测模型的适用性需要在不同的人群中进一步验证。第三，不使用排尿标准来定义CSA-AKI，因为大多数患者没有每小时的排尿数据。然而，由于术中和术后常规使用利尿剂以维持尿量，本研究很少遗漏CSA-AKI患者。最后，预测因子与CSA-AKI之间的因果关系有待进一步探讨。需要进行随机对照试验来验证某些预测因子的修改是否可以预防CSA-AKI的发生。

结论

我们的研究证明了机器学习方法在儿科人群中预测CSA-AKI发展的适用性。XGBoost模型在推导和外部验证队列中具有一致的临床应用性能，表明其稳健性和可扩展性。此外，结合术前和术中因素，模型的性能得到改善，证明了这些因素对术前和术中因素的预测价值。最终，我们的模型将被证明在协助医生进行风险分层和儿科心脏手术患者的临床决策方面是有用的。

致谢

作者感谢马瑞雪(中南大学湘雅医院)和吴琼琼(中南大学湘雅第二医院)在数据收集方面的帮助。作者想对EditSprings提供的专家语言服务表示感谢。

作者的贡献

SBD设计并监督了这项研究，并修改了这篇手稿。XQL和YXK进行数据提取，分析和解释数据，并起草手稿。PY和GBS对数据进行了解释，并对手稿进行了批判性的修改。NYZ、SKY、JXL和HZ进行了数据提取，并对重要的知识内容进行了批判性的修改。所有作者都阅读并批准了最终的手稿。

利益冲突

没有宣布。

‎

多媒体附件1

感兴趣的变量的数据类型和缺失值。

PDF档案(adobepdf档案)，182 KB

‎

多媒体附件2

每个机器学习算法使用的函数、包和调优参数。

PDF档案(adobepdf档案)，169 KB

‎

多媒体

模型建立的框架说明。

PDF档案(adobepdf档案)，587 KB

‎

多媒体附件4

在推导和外部验证队列中，有和没有心脏手术相关急性肾损伤患者的基线特征和结局。

PDF档案(adobepdf档案)，318 KB

‎

多媒体

4种特征选择方法选择的预测变量。

PDF档案(adobepdf档案)，174kb

‎

多媒体附件6

机器学习模型在交叉验证中的表现。

PDF档案(adobepdf档案)，178kb

‎

多媒体

极端梯度增强模型在心脏手术相关急性肾损伤中的应用。

PDF档案(adobepdf档案)，477 KB

‎

多媒体附件8

预测因子与心脏手术相关的急性肾损伤之间的Shapley附加解释依赖图。

PDF档案(adobepdf档案)，455 KB

‎

多媒体

心脏手术相关急性肾损伤2-3期极端梯度增强模型的受试者工作特征曲线。

PDF档案(adobepdf档案)，340 KB

‎

多媒体附录10

亚组中心脏手术相关急性肾损伤极端梯度增强模型的受者工作特征曲线。

PDF档案(adobepdf档案)，1041 KB

‎

多媒体附件11

在平衡推导队列上训练心脏手术相关急性肾损伤极端梯度增强模型的受试者工作特征曲线。

PDF档案(adobepdf档案)，493 KB

小儿心脏外科:长远的观点。循环2015年1月27日;131(4):328-330。［CrossRef] [Medline］
Sharma A, Chakraborty R, Sharma K, Sethi SK, Raina R.儿童心脏手术后急性肾损伤的发展。肾Res临床实践2020年9月30日;39(3):259-268 [免费全文] [CrossRef] [Medline］
Li S, Krawczeski CD, Zappitelli M, Devarajan P, Thiessen-Philbrook H, Coca SG, TRIBE-AKI Consortium。儿童心脏手术后急性肾损伤的发生率、危险因素和结局:一项前瞻性多中心研究重症监护医学2011年6月;39(6):1493-1499 [免费全文] [CrossRef] [Medline］
Madsen NL, Goldstein SL, Frøslev T, Christiansen CF, Olsen M.先天性心脏病患者心脏手术与急性肾损伤和慢性肾脏疾病风险相关。肾脏综合检查2017 Sep;92(3):751-756 [免费全文] [CrossRef] [Medline］
Van den Eynde J, Rotbi H, Gewillig M, Kutty S, Allegaert K, Mekahli D.儿童心脏手术后急性肾损伤的院内预后:一项荟萃分析。前儿科2021;9:733744 [免费全文] [CrossRef] [Medline］
Nadim MK, Forni LG, Bihorac A, Hobson C, Koyner JL, Shaw A，等。心脏和血管手术相关的急性肾损伤:ADQI(急性疾病质量倡议)小组第20届国际共识会议J Am心脏协会2018年6月01日;7:11 [免费全文] [CrossRef] [Medline］
Parikh CR, Devarajan P, Zappitelli M, Sint K, Thiessen-Philbrook H, Li S, TRIBE-AKI财团。术后生物标志物可预测儿童心脏手术后急性肾损伤和不良预后。J Am Soc Nephrol 2011年9月;22(9):1737-1747 [免费全文] [CrossRef] [Medline］
de Melo Bezerra Cavalcante CT, Castelo Branco KM, Pinto Júnior VC, Meneses GC, de Oliveira Neves FM, de Souza NMG，等。Syndecan-1改善小儿心脏手术后严重急性肾损伤的预测。中华胸心外科杂志2016年7月版;52(1):178-186。e2 (免费全文] [CrossRef] [Medline］
董玲，马强，马志勇，王晓明。细胞周期阻滞的泌尿生物标志物是儿童体外循环后急性肾损伤的延迟预测因子。儿科肾脏杂志2017 Dec;32(12):2351-2360 [免费全文] [CrossRef] [Medline］
托RC。医学中的机器学习。发行量2015年11月17日;132(20):1920-1930 [免费全文] [CrossRef] [Medline］
Raita Y, Goto T, Faridi MK, Brown DFM, Camargo CA, Hasegawa K.使用机器学习模型对急诊科临床结果进行分类预测。重症监护2019 2月22日;23(1):64 [免费全文] [CrossRef] [Medline］
王杰，王晓明，王晓明，王晓明。基于监督式机器学习预测分析的诱导后低血压预测。麻醉学2018 Oct;129(4):675-688 [免费全文] [CrossRef] [Medline］
闫萍，段珊珊，罗小强，张妮，邓玉华。慢性肾病住院患者静脉注射碘造影剂后急性肾损伤的基于深度神经网络模型的开发和验证:一项多队列分析Nephrol Dial Transplant预印本于2022年2月26日在线发布。［CrossRef] [Medline］
李浩，尹浩，南K，赵玉杰，金志明，金卫华，等。预测心脏手术后急性肾损伤的机器学习方法的推导和验证。J临床医学2018年10月03日;7:10 [免费全文] [CrossRef] [Medline］
彭妮-迪米瑞JC，伯格梅尔C，里德CM，威廉姆斯-斯宾塞J，科克伦AD，史密斯JA。心脏手术相关急性肾损伤的机器学习算法预测和风险分析。中华胸心外科杂志2021;33(3):735-745。［CrossRef] [Medline］
李勇，徐娟，王勇，张勇，姜伟，沈波，等。一种新的机器学习算法，贝叶斯网络模型，预测心脏手术相关急性肾损伤高危患者。临床心血管2020七月;43(7):752-761 [免费全文] [CrossRef] [Medline］
Thongprayoon C, Hansrivijit P, Bathini T, Vallabhajosyula S, Mekraksakit P, Kaewput W，等。用机器学习方法预测心脏手术后急性肾损伤。J临床医学2020年6月07;9:6 [免费全文] [CrossRef] [Medline］
张华，王震，唐勇，陈晓，尤东，吴勇，等。心脏手术后急性肾损伤预测:基于中国电子健康记录数据集的模型开发J Transl Med 2022 Apr 09;20(1):166 [免费全文] [CrossRef] [Medline］
曾鹏，陈勇，王超，赵坤，彭勇，徐松，等。通过机器学习预测心脏手术后急性肾损伤的发展。重症监护2020年7月31日;24(1):478 [免费全文] [CrossRef] [Medline］
Li S, Krawczeski CD, Zappitelli M, Devarajan P, Thiessen-Philbrook H, Coca SG, TRIBE-AKI Consortium。儿童心脏手术后急性肾损伤的发生率、危险因素和结局:一项前瞻性多中心研究重症监护医学2011年6月;39(6):1493-1499 [免费全文] [CrossRef] [Medline］
Bowdish ME, D'Agostino RS, Thourani VH, Schwann TA, Krohn C, Desai N，等。STS成人心脏手术数据库:2021年结果、质量和研究更新。Ann Thorac外科2021年6月;111(6):1770-1780。［CrossRef] [Medline］
Van den Eynde J, Delpire B, Jacquemyn X, Pardi I, Rotbi H, Gewillig M，等。儿童心脏手术后急性肾损伤的危险因素:荟萃分析。儿科肾脏杂志2022 Mar;37(3):509-519。［CrossRef] [Medline］
Collins GS, Reitsma JB, Altman DG, Moons KGM。透明报告个人预后或诊断的多变量预测模型(TRIPOD): TRIPOD声明。Ann Intern Med 2015 Jan 06;162(1):55-63 [免费全文] [CrossRef] [Medline］
Schwartz GJ, Muñoz A, Schneider MF, Mak RH, Kaskel F, Warady BA，等。估算CKD患儿GFR的新方程。J Am Soc Nephrol 2009 Mar;20(3):629-637 [免费全文] [CrossRef] [Medline］
Pottel H, Dubourg L, Goffin K, Delanaye P.床边Schwartz方程估计儿童肾小球滤过率的替代方案。Adv慢性肾脏疾病2018年1月;25(1):57-66。［CrossRef] [Medline］
徐旭，聂松，张安，毛军，刘红，夏红，等。中国住院儿童的急性肾损伤临床临床杂志2018年12月07日;13(12):1791-1800 [免费全文] [CrossRef] [Medline］
Jenkins KJ, Gauvreau K, Newburger JW, Spray TL, Moller JH, Iezzoni LI。先天性心脏病手术风险调整的共识方法。中华胸心外科杂志2002 1月23日(1):1 -11。［CrossRef] [Medline］
肾脏疾病:改善全球预后(KDIGO)急性肾损伤工作组。急性肾损伤KDIGO临床实践指南。肾内科杂志2012年1月;2(1):1-138。［CrossRef] [Medline］
Stekhoven DJ, Bühlmann P. MissForest—混合类型数据的非参数缺失值imputation。生物信息学2012 Jan 01;28(1):112-118。［CrossRef] [Medline］
Saito T, Rehmsmeier M.在不平衡数据集上评估二元分类器时，精度-召回图比ROC图更有信息。PLoS One 2015;10(3):e0118432 [免费全文] [CrossRef] [Medline］
伦德伯格，李思。解释模型预测的统一方法。25发表于:第31届神经信息处理系统会议(NIPS 2017);12月4日;长滩，加州，美国。［CrossRef］
Ingelfinger JR, Kalantar-Zadeh K, Schaefer F，世界肾脏日指导委员会。避免肾脏疾病的遗留:关注儿童。肾移植2016年3月31日(3):327-331。［CrossRef] [Medline］
综合R档案网络。URL:https://cran.r-project.org[2022-11-11]访问
基于机器学习的儿科CSA-AKI预测模型。GitHub。URL:https://github.com/LuoXiaoqin123/pediatric-CSA-AKI[2022-11-11]访问
李文杰，张文杰，张文杰，等。小儿先天性心脏手术后全身炎症反应综合征:发生率、危险因素和临床结果。J Card surgery 2017 Feb;32(2):116-125。［CrossRef] [Medline］
Adhikari L, Ozrazgat-Baslanti T, Ruppert M, Madushani RWMA, Paliwal S, Hashemighouchani H，等。用IDEA改进的急性肾损伤预测模型:术中数据嵌入分析。PLoS One 2019;14(4):e0214904 [免费全文] [CrossRef] [Medline］
Thorsen-Meyer H, Nielsen AB, Nielsen AP, Kaas-Hansen BS, Toft P, Schierbeck J，等。重症监护病房患者死亡率的动态和可解释的机器学习预测:电子患者记录中高频数据的回顾性研究。《柳叶刀》数字健康2020年4月;2(4):e179-e191 [免费全文] [CrossRef] [Medline］
吕震，崔峰，邹强，张玲，徐玲。基于深度表示学习特征的抗癌肽预测。Brief Bioinform 2021年9月02日;22:5。［CrossRef] [Medline］
Van den Eynde J, Delpire B, Jacquemyn X, Pardi I, Rotbi H, Gewillig M，等。儿童心脏手术后急性肾损伤的危险因素:荟萃分析。儿科肾脏杂志2022 Mar;37(3):509-519。［CrossRef] [Medline］
心肺旁路诱导的炎症反应:病理生理学和治疗。儿科重症监护医学2016年8月;17(8增刊1):S272-S278。［CrossRef] [Medline］
马志刚，李志刚，李志刚，等。小儿心脏手术围手术期蛋白尿和预测急性肾损伤的临床模型。儿科肾脏杂志2022 Apr;37(4):881-890 [免费全文] [CrossRef] [Medline］
Grieshaber P, Möller S, Arneth B, Roth P, Niemann B, Renz H，等。结合临床风险评分和泌尿生物标志物预测心脏手术相关的急性肾损伤中华心血管外科杂志2020年8月;68(5):389-400。［CrossRef] [Medline］
范德里斯特，朱斯特，史勇，崔林，戴高轩，希尔，等。儿科心脏手术患者术后早期对乙酰氨基酚暴露与急性肾损伤之间的关系。美国医学会儿科杂志2018 july 01;172(7):655-663 [免费全文] [CrossRef] [Medline］

‎

AUPRC:精度-召回曲线下的面积

AUROC:接收机工作特性曲线下面积

CSA-AKI:心脏手术相关急性肾损伤

表皮生长因子受体:估计肾小球滤过率

KDIGO:肾脏疾病:改善全球结果

RACHS-1:先天性心脏手术的风险调整-1

可控硅:血清肌酐

世鹏科技电子:Shapley加法解释

XGBoost:极端梯度增强

G·艾森巴赫(G Eysenbach)编辑;提交17.07.22;同行评议作者:赵颖，孙宏;对作者21.10.22的评论;修订本收到日期为11.11.22;接受15.11.22;发表05.01.23

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

基于机器学习的儿童心脏手术后急性肾损伤预测:模型开发和验证研究

基于机器学习的儿童心脏手术后急性肾损伤预测:模型开发和验证研究

原始论文

通讯作者:

摘要

关键字

简介

方法

研究设计

伦理批准

研究参与者

预测变量

结果测量

统计分析

特征选择

模型开发和验证

模型的解释

敏感性分析

结果

病人的特点

预测变量

模型的性能

模型的解释

敏感性分析

讨论

主要研究结果

限制

结论

致谢

作者的贡献

利益冲突

参考文献

缩写