这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,https://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
研究表明,半数以上心衰合并急性肾损伤(AKI)患者为新发AKI,且在住院期间肾功能评价指标如肾小球滤过率估计值通常未重复检测。作为一个独立的危险因素,AKI识别延迟已被证明与HF患者的不良事件有关,如慢性肾脏疾病和死亡。gydF4y2Ba
本研究的目的是开发和评估一种无监督机器学习模型,该模型可以识别肾功能正常但易患新生AKI的心衰患者。gydF4y2Ba
我们分析了一个电子健康记录数据集,其中包括5075名肾功能正常的心衰患者,使用称为k -均值聚类的无监督机器学习算法对其中的2个表型进行分类。然后,我们通过生存分析、AKI预测和风险比检验来确定推断的表型指数是否有可能成为必要的风险指标。gydF4y2Ba
生成表型2的AKI发生率显著高于表型1(组1:106/2823,3.75%;第2组:259/2252,11.50%;gydF4y2Ba
根据对电子健康记录数据的机器学习分析,肾功能正常的心衰患者被聚为与不同的新生AKI风险水平相关的单独表型组。我们的研究表明,在高危患者的识别具有挑战性的临床环境中,使用机器学习可以促进患者分组和分层。gydF4y2Ba
急性肾损伤(AKI)是心力衰竭(HF)患者的常见疾病,在心内科报道的发病率在7%至38%不等[gydF4y2Ba
虽然一些特定的临床标志物(如估计肾小球滤过率[eGFR])已被用于评估心衰患者的肾功能,从而可以识别出AKI的高危人群,但这些标志物缺乏筛查入院时肾功能正常的新生AKI患者的能力[gydF4y2Ba
最近进行的心血管研究表明,无监督机器学习方法能够模拟包含预后信息的变量之间的相关性,并将内聚性患者聚为1个相同的表型组[gydF4y2Ba
这项回顾性研究使用了来自中国人民解放军总医院(PLAGH) EHR系统的真实数据集。该数据集记录了1998年至2018年PLAGH中29699名被诊断为心衰患者的84,705例住院治疗的常规医疗信息。心力衰竭且肾功能正常的成年患者(eGFR >60 mL/min/1.73mgydF4y2Ba2gydF4y2Ba根据慢性肾脏疾病流行病学合作组织(CKD-EPI)方程的血清肌酐[SCr]版本计算[gydF4y2Ba
PLAGH数据集的预处理过程。CKD:慢性肾脏疾病;eGFR:估计肾小球滤过率;HF:心力衰竭;解放军总医院。gydF4y2Ba
浙江大学卫生机构审查委员会(No. 1)批准了该研究方案,并在危害最小和总体不可行性的基础上放弃了同意。zju - 2021 - 27)。gydF4y2Ba
在本研究中,可能与AKI相关的58个变量,包括人口统计学、生命体征测量、药物、实验室、手术和超声心动图检查,以及住院入院阶段的ehr常规记录,被视为分析的候选变量。为了确保选择了信息量最大的变量,并稀释变量之间的相关性,我们排除了缺失率大于30%或Pearson相关系数为>0.6或在原始EHR数据集中记录次数少于100次的变量。结果,队列中包括39个变量。为了便于无监督机器学习模型,将所有连续变量转换为标准正态分布(表S1,gydF4y2Ba
我们采用了一种简单而有效的无监督机器学习模型,称为K-means聚类,将患者分为不同的表型组[gydF4y2Ba
主要转归为AKI发生率,根据肾脏疾病:改善全球转归(KDIGO)标准定义[gydF4y2Ba
一旦心衰患者被分为不同的表型组,我们测量不同组变量的差异。连续变量报告为中位数和IQR(四分位间距)。分类变量以频率和计数的形式报告。组间差异采用单向方差分析、Kruskal-Wallis检验或卡方检验。一个gydF4y2Ba
我们通过以下3个实验验证K-means聚类生成的表型指数是否与利益结果相关。首先,采用Kaplan-Meier估计法进行对数秩检验,分析不同表型组的时间-事件特征。其次,我们比较了AKI和住院死亡率的预测性能,以检查推断的表型指数是否是感兴趣结果的有效风险预测指标。具体来说,我们使用Akaike信息准则的前向逐步策略选择了排名靠前的10个变量,然后开发了5个逻辑回归(LR)模型来预测感兴趣的结果。模型1使用表型组指数作为单变量预测因子。模型2使用排名靠前的10个变量作为预测因子。模型3采用排名靠前的10个变量和表型组指数。模型4使用了所有39个变量。模型5使用了所有39个变量和表型组指数。所有模型都使用PLAGH数据集中70%的数据进行训练,并使用剩余30%的数据进行测试。 Third, to evaluate whether the phenogroup index could achieve the competitive discriminative performance compared to the original variables with respect to the primary and secondary outcomes, we applied unadjusted Cox proportional hazard regression to examine hazard ratios (HRs), 95% CIs, and
我们在一个著名的开源数据库——重症监护医疗信息集市(MIMIC)-III上对我们的模型进行了外部验证[gydF4y2Ba
在本研究中,统计和机器学习分析基于sklearn,生命线,scipy包[gydF4y2Ba
预处理后,5075例住院和39个变量(gydF4y2Ba
包括用于聚类的变量。gydF4y2Ba
域gydF4y2Ba | 特性gydF4y2Ba |
人口gydF4y2Ba | 年龄、性别gydF4y2Ba |
疾病gydF4y2Ba | 急性/慢性心衰、心房颤动、心肌病、冠心病、糖尿病、中风、瓣膜性心脏病gydF4y2Ba |
药物治疗gydF4y2Ba | 血管紧张素转换酶抑制剂/血管紧张素受体阻滞剂,抗凝血剂,抗血小板,-阻滞剂,钙通道阻滞剂,利尿剂,正性肌力药物,血管扩张剂gydF4y2Ba |
超声心动图gydF4y2Ba | 左室射血功能gydF4y2Ba |
实验结果gydF4y2Ba | 丙氨酸转氨酶、天门冬氨酸转氨酶、估计肾小球滤过率、γ -谷氨酰转移酶、血红蛋白、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、n端脑钠前体肽、血清钙、血清钾、血清钠、血清尿素、总胆红素、总血清蛋白、甘油三酯、肌钙蛋白TgydF4y2Ba |
操作gydF4y2Ba | 经皮冠状动脉介入造影术gydF4y2Ba |
生命体征gydF4y2Ba | BMI,舒张压,收缩压gydF4y2Ba |
一个gydF4y2Ba仅纳入入院后48小时内使用的药物,以确保药物使用情况能反映患者入院状态。gydF4y2Ba
从…中可以看出gydF4y2Ba
解放军总医院数据集和生成的表型的基线特征。gydF4y2Ba
功能gydF4y2Ba | 人口(N = 5075)gydF4y2Ba | 表型1 (n=2823)gydF4y2Ba | 表型2 (n=2252)gydF4y2Ba |
|
||
|
||||||
|
阿基gydF4y2Ba一个gydF4y2Ba | 365 (7.19)gydF4y2Ba | 106 (3.75)gydF4y2Ba | 259 (11.50)gydF4y2Ba | <措施gydF4y2Ba | |
|
住院死亡率,gydF4y2Ba | 139 (2.74)gydF4y2Ba | 21日(0.74)gydF4y2Ba | 118 (5.24)gydF4y2Ba | <措施gydF4y2Ba | |
|
||||||
|
年龄(年),中位数(IQR)gydF4y2Ba | 61 (51 - 70)gydF4y2Ba | 58 (48 - 67)gydF4y2Ba | 65 (55 - 75)gydF4y2Ba | <措施gydF4y2Ba | |
|
BMI(公斤/米gydF4y2Ba2gydF4y2Ba),中位数(IQR)gydF4y2Ba | 24.60 (22.46 - -27.08)gydF4y2Ba | 25.88 (23.87 - -28.08)gydF4y2Ba | 23.05 (20.95 - -25.01)gydF4y2Ba | <措施gydF4y2Ba | |
|
菲律宾gydF4y2BabgydF4y2Ba(mmHg),中位数(IQR)gydF4y2Ba | 74年(67 - 81)gydF4y2Ba | 77年(70 - 85)gydF4y2Ba | 70年(64 - 78)gydF4y2Ba | <措施gydF4y2Ba | |
|
SBPgydF4y2BacgydF4y2Ba(mmHg),中位数(IQR)gydF4y2Ba | 125年(113 - 138)gydF4y2Ba | 130年(119 - 143)gydF4y2Ba | 118年(106 - 130)gydF4y2Ba | <措施gydF4y2Ba | |
|
男性,n (%)gydF4y2Ba | 3431 (67.61)gydF4y2Ba | 1943 (68.83)gydF4y2Ba | 1488 (66.07)gydF4y2Ba | <措施gydF4y2Ba | |
|
||||||
|
|
|||||
|
|
急性心力衰竭gydF4y2Ba | 1723 (33.95)gydF4y2Ba | 738 (26.14)gydF4y2Ba | 985例(43.73%)gydF4y2Ba | <措施gydF4y2Ba |
|
|
慢性心力衰竭gydF4y2Ba | 3352 (66.05)gydF4y2Ba | 2075 (73.86)gydF4y2Ba | 1267例(56.26%)gydF4y2Ba | <措施gydF4y2Ba |
|
房颤gydF4y2BaegydF4y2Ba | 1121 (22.09)gydF4y2Ba | 526 (18.63)gydF4y2Ba | 595 (26.42)gydF4y2Ba | <措施gydF4y2Ba | |
|
心肌病gydF4y2Ba | 941 (18.54)gydF4y2Ba | 497 (17.61)gydF4y2Ba | 444 (19.71)gydF4y2Ba | <措施gydF4y2Ba | |
|
冠心病gydF4y2BafgydF4y2Ba | 2928 (57.69)gydF4y2Ba | 1660 (58.80)gydF4y2Ba | 1268 (56.30)gydF4y2Ba | 07gydF4y2Ba | |
|
糖尿病gydF4y2Ba | 2002 (39.44)gydF4y2Ba | 1041 (36.88)gydF4y2Ba | 961 (42.67)gydF4y2Ba | <措施gydF4y2Ba | |
|
中风gydF4y2Ba | 485 (9.56)gydF4y2Ba | 282 (9.99)gydF4y2Ba | 233 (10.35)gydF4y2Ba | .09点gydF4y2Ba | |
|
VHDgydF4y2BaggydF4y2Ba | 616 (12.13)gydF4y2Ba | 336 (11.90)gydF4y2Ba | 280 (12.43)gydF4y2Ba | .57gydF4y2Ba | |
|
||||||
|
ACEI / ARBgydF4y2BahgydF4y2Ba | 2547 (50.18)gydF4y2Ba | 1531 (54.23)gydF4y2Ba | 1016 (45.11)gydF4y2Ba | <措施gydF4y2Ba | |
|
抗凝剂gydF4y2Ba | 1927 (37.97)gydF4y2Ba | 989 (35.03)gydF4y2Ba | 938 (41.65)gydF4y2Ba | <措施gydF4y2Ba | |
|
抗血小板gydF4y2Ba | 3298 (64.99)gydF4y2Ba | 1914 (67.80)gydF4y2Ba | 1384 (61.45)gydF4y2Ba | <措施gydF4y2Ba | |
|
β-受体阻滞药gydF4y2Ba | 3428 (67.54)gydF4y2Ba | 1981 (70.17)gydF4y2Ba | 1447 (64.25)gydF4y2Ba | <措施gydF4y2Ba | |
|
建行gydF4y2Ba我gydF4y2Ba | 1110 (21.87)gydF4y2Ba | 789 (27.95)gydF4y2Ba | 321 (14.25)gydF4y2Ba | <措施gydF4y2Ba | |
|
利尿剂gydF4y2Ba | 3407 (67.13)gydF4y2Ba | 1608 (56.96)gydF4y2Ba | 1799 (79.88)gydF4y2Ba | <措施gydF4y2Ba | |
|
正性肌力药物gydF4y2Ba | 1867 (36.79)gydF4y2Ba | 778 (27.56)gydF4y2Ba | 1089 (48.36)gydF4y2Ba | <措施gydF4y2Ba | |
|
血管舒张药gydF4y2Ba | 3103 (61.14)gydF4y2Ba | 1698 (60.15)gydF4y2Ba | 1405 (62.39)gydF4y2Ba | .10gydF4y2Ba | |
|
||||||
|
LVEFgydF4y2BajgydF4y2Ba,中位数(IQR)gydF4y2Ba | 46 (35-56)gydF4y2Ba | 50 (39-58)gydF4y2Ba | 41 (31-54)gydF4y2Ba | <措施gydF4y2Ba | |
|
<40%, n (%)gydF4y2Ba | 1716 (33.81)gydF4y2Ba | 719 (25.47)gydF4y2Ba | 997 (44.27)gydF4y2Ba | <措施gydF4y2Ba | |
|
40%-50%, n (%)gydF4y2Ba | 1174 (23.13)gydF4y2Ba | 690 (24.44)gydF4y2Ba | 484 (21.49)gydF4y2Ba | 0。gydF4y2Ba | |
|
≥50%,n (%)gydF4y2Ba | 2185 (42.86)gydF4y2Ba | 1414 (50.09)gydF4y2Ba | 771 (34.24)gydF4y2Ba | <措施gydF4y2Ba | |
|
||||||
|
ALTgydF4y2BakgydF4y2Ba(IU / L)gydF4y2Ba | 21.00 (14.39 - -33.79)gydF4y2Ba | 20.80 (14.70 - -31.99)gydF4y2Ba | 21.54 (13.80 - -36.49)gydF4y2Ba | <措施gydF4y2Ba | |
|
ASTgydF4y2BalgydF4y2Ba(IU / L)gydF4y2Ba | 21.29 (16.29 - -30.50)gydF4y2Ba | 19.60 (15.50 - -26.00)gydF4y2Ba | 24.29 (18.09 - -38.80)gydF4y2Ba | <措施gydF4y2Ba | |
|
钙(更易/ L)gydF4y2Ba | 2.24 (2.16 - -2.33)gydF4y2Ba | 2.28 (2.21 - -2.36)gydF4y2Ba | 2.19 (2.10 - -2.27)gydF4y2Ba | <措施gydF4y2Ba | |
|
表皮生长因子受体gydF4y2Ba米gydF4y2Ba(毫升/分钟/ 1.73米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba | 87.62 (75.65 - -98.80)gydF4y2Ba | 92.06 (80.84 - -101.91)gydF4y2Ba | 81.85 (70.90 - -92.91)gydF4y2Ba | <措施gydF4y2Ba | |
|
GGTgydF4y2Ban (gydF4y2Ba国际单位/ L)gydF4y2Ba | 34.80 (21.90 - -63.79)gydF4y2Ba | 31.70 (21.30 - -54.89)gydF4y2Ba | 40.30 (23.09 - -75.00)gydF4y2Ba | <措施gydF4y2Ba | |
|
高密度脂蛋白胆固醇gydF4y2BaogydF4y2Ba(更易/ L)gydF4y2Ba | 1.02 (0.85 - -1.22)gydF4y2Ba | 1.04 (0.88 - -1.22)gydF4y2Ba | 1.01 (0.82 - -1.22)gydF4y2Ba | <措施gydF4y2Ba | |
|
血红蛋白、g / LgydF4y2Ba | 137年(124 - 150)gydF4y2Ba | 143年(132 - 154)gydF4y2Ba | 129年(116 - 142)gydF4y2Ba | <措施gydF4y2Ba | |
|
低密度gydF4y2BapgydF4y2Ba(更易/ L)gydF4y2Ba | 2.25 (1.79 - -2.81)gydF4y2Ba | 2.46 (1.96 - -3.05)gydF4y2Ba | 2.04 (1.62 - -2.48)gydF4y2Ba | <措施gydF4y2Ba | |
|
NT-pro-BNPgydF4y2Ba问gydF4y2Ba(pg / mL)gydF4y2Ba | 1216年(422 - 2950)gydF4y2Ba | 572年(225 - 1319)gydF4y2Ba | 2680年(1355 - 5188)gydF4y2Ba | <措施gydF4y2Ba | |
|
钾(更易/ L)gydF4y2Ba | 3.89 (3.62 - -4.17)gydF4y2Ba | 3.87 (3.62 - -4.13)gydF4y2Ba | 3.91 (3.61 - -4.20)gydF4y2Ba | .005gydF4y2Ba | |
|
钠(更易/ L)gydF4y2Ba | 140.70 (138.10 - -142.70)gydF4y2Ba | 141.30 (139.40 - -143.20)gydF4y2Ba | 139.40 (136.30 - -142.00)gydF4y2Ba | <措施gydF4y2Ba | |
|
总胆红素(μmol/L)gydF4y2Ba | 13.69 (9.80 - -19.90)gydF4y2Ba | 12.79 (9.40 - -17.40)gydF4y2Ba | 15.85 (10.39 - -24.60)gydF4y2Ba | <措施gydF4y2Ba | |
|
总蛋白(g/L)gydF4y2Ba | 67.5 (63.3 - -71.8)gydF4y2Ba | 69.2 (65.8 - -73.3)gydF4y2Ba | 65.1 (60.4 - -69.0)gydF4y2Ba | <措施gydF4y2Ba | |
|
甘油三酸酯(更易/ L)gydF4y2Ba | 1.11 (0.82 - -1.59)gydF4y2Ba | 1.34 (0.98 - -1.87)gydF4y2Ba | 0.92 (0.72 - -1.21)gydF4y2Ba | <措施gydF4y2Ba | |
|
肌钙蛋白T (ng/mL)gydF4y2Ba | 0.01 (0.01 - -0.04)gydF4y2Ba | 0.01 (0.00 - -0.02)gydF4y2Ba | 0.02 (0.01 - -0.10)gydF4y2Ba | <措施gydF4y2Ba | |
|
尿素(更易/ L)gydF4y2Ba | 5.84 (4.73 - -7.25)gydF4y2Ba | 5.46 (4.51 - -6.60)gydF4y2Ba | 6.45 (5.11 - -8.12)gydF4y2Ba | <措施gydF4y2Ba | |
|
||||||
|
血管造影术gydF4y2Ba | 2008 (29.57)gydF4y2Ba | 1311 (46.44)gydF4y2Ba | 697 (30.95)gydF4y2Ba | <措施gydF4y2Ba | |
|
一种总线标准gydF4y2BargydF4y2Ba | 969 (19.09)gydF4y2Ba | 620 (21.96)gydF4y2Ba | 349 (15.50)gydF4y2Ba | <措施gydF4y2Ba |
一个gydF4y2BaAKI:急性肾损伤。gydF4y2Ba
bgydF4y2BaDBP:舒张压。gydF4y2Ba
cgydF4y2BaSBP:收缩压。gydF4y2Ba
dgydF4y2Ba心衰:心力衰竭。gydF4y2Ba
egydF4y2Ba心房颤动。gydF4y2Ba
fgydF4y2Ba冠心病:冠状动脉疾病。gydF4y2Ba
ggydF4y2BaVHD:心脏瓣膜病。gydF4y2Ba
hgydF4y2BaACEI/ARB:血管紧张素转换酶抑制剂/血管紧张素受体阻断剂。gydF4y2Ba
我gydF4y2Ba钙通道阻滞剂。gydF4y2Ba
jgydF4y2BaLVEF:左室射血分数。gydF4y2Ba
kgydF4y2BaALT:丙氨酸转氨酶。gydF4y2Ba
lgydF4y2BaAST:天冬氨酸转氨酶。gydF4y2Ba
米gydF4y2BaeGFR:估计肾小球滤过率。gydF4y2Ba
ngydF4y2BaGGT: γ -谷氨酰转移酶。gydF4y2Ba
ogydF4y2BaHDL-C:高密度脂蛋白胆固醇。gydF4y2Ba
pgydF4y2BaLDL-C:低密度脂蛋白胆固醇。gydF4y2Ba
问gydF4y2BaNT-pro-BNP: n端脑钠肽前体。gydF4y2Ba
rgydF4y2BaPCI:经皮冠状动脉介入。gydF4y2Ba
由于生成的表型组之间AKI的患病率和住院死亡率存在显著差异,因此表型组1被直观地标记为“低风险”,表型组2被标记为“高风险”。我们进一步研究了产生的表型指数是否可以作为临床结果的基本风险指标。gydF4y2Ba
在发育(PLAGH)和外部验证(MIMIC-III)数据集中AKI和住院死亡率的Kaplan-Meier曲线。AKI:急性肾损伤;重症监护医疗信息集市;解放军总医院。gydF4y2Ba
预测性能比较。gydF4y2Ba
按任务建模gydF4y2Ba | PLAGHgydF4y2Ba一个gydF4y2Ba数据集(开发)gydF4y2Ba | MIMIC-IIIgydF4y2BabgydF4y2Ba数据集(验证)gydF4y2Ba | ||||||
灵敏度gydF4y2Ba | 特异性gydF4y2Ba | C-statisticgydF4y2BacgydF4y2Ba | 灵敏度gydF4y2Ba | 特异性gydF4y2Ba | C-statisticsgydF4y2Ba | |||
|
||||||||
|
模型1gydF4y2Ba | 0.710gydF4y2Ba | 0.577gydF4y2Ba | 0.643gydF4y2Ba | 0.760gydF4y2Ba | 0.342gydF4y2Ba | 0.551gydF4y2Ba | |
|
模型2gydF4y2Ba | 0.647gydF4y2Ba | 0.638gydF4y2Ba | 0.696gydF4y2Ba | 0.374gydF4y2Ba | 0.652gydF4y2Ba | 0.532gydF4y2Ba | |
|
模型3gydF4y2Ba | 0.679gydF4y2Ba | 0.723gydF4y2Ba | 0.756gydF4y2Ba | 0.478gydF4y2Ba | 0.562gydF4y2Ba | 0.546gydF4y2Ba | |
|
模型4gydF4y2Ba | 0.737gydF4y2Ba | 0.753gydF4y2Ba | 0.815gydF4y2Ba | 0.544gydF4y2Ba | 0.560gydF4y2Ba | 0.570gydF4y2Ba | |
|
模型5gydF4y2Ba | 0.718gydF4y2Ba | 0.746gydF4y2Ba | 0.816gydF4y2Ba | 0.573gydF4y2Ba | 0.540gydF4y2Ba | 0.575gydF4y2Ba | |
|
||||||||
|
模型1gydF4y2Ba | 0.849gydF4y2Ba | 0.568gydF4y2Ba | 0.708gydF4y2Ba | 0.826gydF4y2Ba | 0.309gydF4y2Ba | 0.568gydF4y2Ba | |
|
模型2gydF4y2Ba | 0.791gydF4y2Ba | 0.736gydF4y2Ba | 0.824gydF4y2Ba | 0.530gydF4y2Ba | 0.672gydF4y2Ba | 0.622gydF4y2Ba | |
|
模型3gydF4y2Ba | 0.820gydF4y2Ba | 0.763gydF4y2Ba | 0.856gydF4y2Ba | 0.622gydF4y2Ba | 0.599gydF4y2Ba | 0.647gydF4y2Ba | |
|
模型4gydF4y2Ba | 0.835gydF4y2Ba | 0.809gydF4y2Ba | 0.899gydF4y2Ba | 0.490gydF4y2Ba | 0.746gydF4y2Ba | 0.646gydF4y2Ba | |
|
模型5gydF4y2Ba | 0.856gydF4y2Ba | 0.812gydF4y2Ba | 0.900gydF4y2Ba | 0.620gydF4y2Ba | 0.720gydF4y2Ba | 0.644gydF4y2Ba |
一个gydF4y2Ba解放军总医院。gydF4y2Ba
bgydF4y2Bamimi -III:重症监护医疗信息集市。gydF4y2Ba
cgydF4y2BaC-statistic:一致性统计。gydF4y2Ba
dgydF4y2BaAKI:急性肾损伤。gydF4y2Ba
我们使用未经调整的Cox比例风险回归来确定与原始的39个纳入变量相比,表型指数是否可以作为必要的风险分层指标。中列出了HR最高的前10个变量gydF4y2Ba
(a)急性肾损伤和(b)来自解放军总医院数据集的住院死亡率排名前10的鉴别特征的风险比。AST:天门冬氨酸转氨酶;eGFR:估计肾小球滤过率;NT-pro-BNP: n端脑钠肽前体。*贫血定义为男性血红蛋白<135 g/L,女性血红蛋白<120 g/L。图中所有变量的单位都与图中的单位相同gydF4y2Ba
对(a)急性肾损伤和(b)住院死亡率产生的表型组指数进行亚组分析。AF:房颤;CHD:慢性心脏病;HF:心力衰竭;LVEF:左室射血分数。*贫血定义为男性血红蛋白<135 g/L,女性血红蛋白<120 g/L。图中所有变量的单位都与图中的单位相同gydF4y2Ba
我们探索了使用大量EHR数据来聚类HF患者的潜力,并通过无监督机器学习模型来识别那些肾功能正常但易患新生AKI的患者。实验结果表明,由EHR数据生成的2个表型组在AKI和院内死亡率发生方面存在显著差异。由于EHR是一个现实世界,随时可用的数据源,包含数千名患者的丰富医疗信息,我们的研究表明,研究人员可以通过机器学习技术,利用EHR数据的巨大潜力,有效地回答重要的临床和科学问题,而使用传统方法所需的资源成本仅为其一小部分[gydF4y2Ba
我们证明肾功能正常的心衰患者可以自然地分为“高危表型组”,即易感于新生AKI的患者和不易感于新生AKI的“低风险表型组”。高危表型组患者年龄较大,更容易发生多器官功能障碍和贫血,住院死亡率明显高于低危表型组。这些发现与最近的研究结果一致[gydF4y2Ba
识别肾功能正常但有急性肾损伤高危的心衰患者是心衰治疗管理的主要挑战。临床医生强调需要更有效的方法来执行这一重要的临床任务[gydF4y2Ba
我们的研究具有潜在的重要临床意义。首先,由于心衰患者,尤其是肾功能正常的患者,其AKI风险往往被低估或忽视[gydF4y2Ba
应该承认这项研究的几个局限性。首先,这是一项单一机构的研究。虽然我们已经在从MIMIC-III中提取的外部验证数据集上评估了我们的模型,但由于缺乏从不同医疗机构和不同临床环境中收集的足够的外部验证样本,这些方法在其他情况下的表现可能不太好。其次,我们的研究受到回顾性设计的限制,所有分析都是纯观察性的。虽然我们发现有明显的变量与新生AKI风险增加和住院死亡率相关,但在这种情况下,这些非随机比较应谨慎解释,并且我们的模型的预后能力需要前瞻性研究的验证来支持。第三,考虑到AKI预测的敏感性和特异性,我们的模型相对敏感,但特异性不高。尽管本研究中假阳性分类的影响有限,但仍需要进一步研究,以使基于机器学习的分析能够捕捉区分高风险病例和低风险病例的显著特征,从而提高我们模型的预测性能。gydF4y2Ba
这项研究表明,基于无监督机器学习的EHR分析能够将心衰患者和正常肾功能患者区分为相互排斥的表型组,这些表型组对应于显著不同的AKI风险水平。我们的研究为开发一种易于使用、广泛可用的模型铺平了道路,该模型允许识别处于新生AKI高危的HF患者,并可能有助于改善HF的预后,与传统的患者表型分组和临床风险分层技术相比,具有至关重要的优势。gydF4y2Ba
实验数据集介绍及详细实验结果。gydF4y2Ba
心房纤颤gydF4y2Ba
急性肾损伤gydF4y2Ba
冠心病gydF4y2Ba
慢性肾病gydF4y2Ba
慢性肾脏疾病流行病学合作gydF4y2Ba
估计肾小球滤过率gydF4y2Ba
电子健康记录gydF4y2Ba
心脏衰竭gydF4y2Ba
风险比gydF4y2Ba
肾脏疾病:改善全球结果gydF4y2Ba
逻辑回归gydF4y2Ba
重症监护医疗信息集市gydF4y2Ba
中国人民解放军总医院gydF4y2Ba
血清肌酐gydF4y2Ba
调查人员和临床协调员的贡献得到了应有的承认。gydF4y2Ba
没有宣布。gydF4y2Ba