发表在9卷7号(2021): 7月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/29226,首次出版
使用可解释的机器学习方法预测抗结核药物引起的肝损伤:模型开发和验证研究

使用可解释的机器学习方法预测抗结核药物引起的肝损伤:模型开发和验证研究

使用可解释的机器学习方法预测抗结核药物引起的肝损伤:模型开发和验证研究

原始论文

1深圳市南山慢性病预防控制中心结核控制科,中国深圳

2香港理工大学应用数学系,中国香港

3.美国加州大学洛杉矶分校生物统计学系

4香港理工大学深圳研究院,中国深圳

5香港理工大学未来食品研究所,中国香港

6香港理工大学应用生物及化学科技学系,中国香港

这些作者的贡献相同

通讯作者:

刘胜远博士

结核病防治署

深圳市南山慢性病预防控制中心

华明路7号

南山区

深圳,518000

中国

电话:86 13543301395

电子邮件:jfk@sznsmby.com


相关的文章这是更正后的版本。见更正声明:https://medinform.www.mybigtv.com/2021/8/e32415

背景:结核病是一种大流行病,是十大死亡原因之一,也是单一感染源导致死亡的主要原因。药物性肝损伤(DILI)是结核病治疗过程中最常见和最严重的副作用。

摘要目的:我们的目的是在临床治疗阶段预测结核病患者的肝损伤状况。

方法:我们设计了基于XGBoost算法的可解释预测模型,并基于2014 - 2019年深圳市南山慢病控制中心医院信息系统提取的临床数据,确定了最稳健、最有意义的TB-DILI风险预测因子。

结果:共纳入757例患者,其中287例(38%)已发展为TB-DILI。根据受试者工作特征曲线下的相对重要性值和面积,机器学习工具选择患者最近的丙氨酸转氨酶水平、患者最近两次丙氨酸转氨酶水平的平均变化率、吡嗪酰胺的累积剂量和乙胺丁醇的累积剂量作为评估TB-DILI风险的最佳预测因子。在验证数据集中,该模型预测TB-DILI病例的准确率为90%,召回率为74%,分类准确率为76%,平衡错误率为77%。经10倍交叉验证,受试者工作特征曲线评分下面积为0.912 (95% CI 0.890 ~ 0.935)。此外,该模型在DILI发病前为患者提供了中位数为15 (IQR 7.3-27.5)天的高风险预警。

结论:该模型在预测TB-DILI病例方面具有较高的准确性和可解释性,可为临床医生调整用药方案和避免患者更严重的肝损伤提供有用的信息。

中华医学杂志;2011;9(7):992 - 996

doi: 10.2196/29226

关键字



结核病(TB)是一种由杆菌引起的传染病结核分枝杆菌。它是全世界十大死亡原因之一,也是单一传染病导致死亡的主要原因[1]。2019年,全世界约有1000万人被诊断患有结核病,140万人死亡[1]。为了防止肺结核的传播,及时有效的抗结核治疗是非常重要的[2]。一线抗结核药物包括吡嗪酰胺(PZA)、乙胺丁醇(EMB)、异烟肼(INH)和利福平(RIF) [3.-6]。在治疗结核病患者时,药物性肝损伤(DILI)是最常见和最严重的副作用[7-10]。在不同人群中,TB-DILI在抗结核治疗期间的发病率为2.3%至27.7% [11-14]。研究人员认为抗结核药物具有肝毒性[1115-18]。

TB-DILI可能是由抗结核药物或其代谢物对肝细胞的直接毒性损伤或抗结核药物引发多种炎症免疫途径引起的免疫介导肝损伤和诱导肝细胞凋亡引起的[1119]。TB-DILI的特征是短暂的轻度转氨酶升高或急性肝炎[20.]。重型病例可能发展为暴发性肝衰竭,而慢性肝炎发生在少数患者中。

目前,临床肝脏检查通常包括血液生化指标,如谷丙转氨酶(ALT)、碱性磷酸酶、胆红素、乳酸脱氢酶、白蛋白等转氨酶,以及肝脏影像学和组织病理学评价。根据这些指标很难区分DILI和非DILI,因为DILI和非DILI的检测结果基本一致。此外,目前常用的临床标志物,既不能考虑肝毒性药物的类型和作用机制的差异,也不能考虑患者的个体特征,只能根据毒性结果进行评估[21]。因此,确定TB-DILI的临床阶段预测因子和患者的风险预测因子已成为一项紧迫而必要的任务。

先前的研究表明,TB-DILI与一些人口统计学特征和潜在的慢性疾病有关[1222-26]。Patterson等[27提示预处理ALT升高及ALT变化梯度增加晚期TB-DILI的风险。因此,除了累积抗结核药物剂量外,ALT水平和人口统计学变量(如年龄、性别、教育水平、收入和BMI)也被纳入我们的模型作为预测因子。在临床前阶段,各种模型用于识别与DILI风险相关的药物[28]。机器学习模型显示出强大的预测能力,并保留了与研究人员沟通的简单形式[29-39]。XGBoost是一种增强集成机器学习算法,它集成了一些分类和回归树模型来形成一个强分类器[4041]。它在处理变量间的非线性和复杂关系方面表现良好[42]。我们使用XGBoost算法设计了一个可解释的预测模型,并确定了最稳健和最有意义的TB-DILI风险预测因子。然后,利用这些判别预测因子,机器学习模型构建可解释的决策树,在TB-DILI发生前提供预警信号,帮助临床医生及时调整用药方案,潜在地降低TB-DILI发生的可能性。在这项研究中,我们回顾性评估了2014年至2019年在中国深圳南山区登记治疗的757例结核病患者。


数据

我们提取了2014 - 2019年深圳市南山慢性病预防控制中心医院信息系统中登记的757例肺结核病例的数据,包括涂片阳性和初步治疗的病例。部分患者未持续治疗或最初出院后再住院,导致记录的治疗时间超过正常范围,抗结核药物累积剂量不明。在接受常规治疗的患者中,这种异常病例不能用于预测。因此,我们在TB典型治疗过程的基础上,经验性地选择300天作为时间窗口[1]。我们排除了抗结核治疗开始后300天记录的TB-DILI病例。总共有743名患者的数据被纳入模型。我们根据美国胸科学会的标准将患者定义为DILI阳性病例[11]:有肝炎症状时,ALT水平升高是正常上限的3倍,无肝炎症状时,ALT水平升高是正常上限的5倍。

患者的人口学和临床资料包括性别、年龄、体重、受教育程度、收入、身高、乙型肝炎、糖尿病、抗结核药物累积剂量、ALT水平。对于未发生TB-DILI的患者,我们收集了截至最近一次肝脏检查时处方抗结核药物的总量。对于发生TB-DILI的患者,我们记录了他们在检测到TB-DILI时抗结核药物的累积剂量。此外,我们测量了患者在最后一次肝脏检查前最近的ALT水平,以及在最后一次肝功能检查前最后2次ALT水平的平均变化率。我们分别计算了联合用药时每种药物(PZA、RFP、EMB和INH)的累积剂量。

治疗开始后,将患者分开,形成训练和验证数据集。2019年4月前(607例,涂片阳性186例)和2019年4月后(136例,涂片阳性95例)入院患者的数据分别纳入训练和验证数据集。

描述性统计

对阳性病例和TB-DILI病例进行描述性统计。采用2-样本法比较两组的人口学和实验室资料t正态分布连续变量的检验,非正态分布连续变量的Kruskal-Wallis秩和检验,分类变量的卡方检验。当测试差异时,遗漏的值被省略。多媒体附录1显示每个变量缺失值的比例。

预测模型

我们使用XGBoost算法建立预测模型[41]。XGBoost是一种基于树助推系统的高性能机器学习算法[43-47]。它使用稀疏感知学习算法来处理稀疏数据,并使用加权分位数草图来近似树学习[41]。由于决策树是由分层组织的二分类决定组成的简单分类器,因此其结构也具有良好的可解释性[48-50]。此外,该模型可以很好地处理缺失值。当模型搜索树生长的最佳候选分割标准时,它们也会为这些节点上的缺失值分配一个默认方向[41]。决策树中可解释的标准和对缺失数据的高容忍度使模型在处理临床数据时具有鲁棒性和意义。为了获得一个可以方便地应用于临床的模型,我们试图尽可能地降低模型的复杂性。因此,我们选择单树XGBoost算法作为预测模型。

为了建立模型,我们首先将所有人口统计和临床数据作为预测因子。因变量是DILI状态,这是一个二元结果。我们用训练集训练单树XGBoost算法。通过考虑每个特征对模型中每棵树的贡献,我们确定了它们对树模型的相对重要性[51]。我们在训练数据集上重复100次分层10倍交叉验证,以获得每个特征相对重要性的平均值。然后,我们按照它们的相对重要性排列了前10个预测因子。将预测因子按相对重要性的递减顺序分别加入到模型中,形成10个候选模型。我们在训练数据集的基础上对候选模型重复100次分层10倍交叉验证,得到接收者工作特征曲线下的平均面积(AUC),并选择AUC最大的模型作为最终模型。然后,用整个训练数据集对所选模型进行训练,得到可解释的决策树。详细的分层过程k-fold交叉验证,模型中设置的参数由多媒体附录1

模型性能评价

我们使用整个训练数据集训练模型,并将模型应用于验证数据集。然后,我们在混淆矩阵的基础上评估预测结果,混淆矩阵是一个特定的表,用于可视化分类模型的性能[52]。根据混淆矩阵,我们计算了以下评价指标的值:准确率、召回率、F1值、分类准确率和平衡错误率。指标公式的详细说明见多媒体附录1。为了确定模型是否能够及时发出预警信号,我们还计算了在错误分类病例中,从模型发出预警信号的时间点到TB-DILI实际诊断日期的持续时间。同时,我们利用整个数据集通过10次交叉验证,比较了单树XGBoost算法与多树XGBoost算法、逻辑回归、单树随机森林算法和多树随机森林算法的性能(AUC)。我们用DeLong方法确定AUC值的95% CI值[53]。我们使用选择的变量来训练单树XGBoost模型,因为变量选择是整个算法的一部分。完整的数据集用于训练其他模型。此外,我们采用了链式方程的多重插值[54来解决逻辑回归中缺失的数据。

敏感性分析

我们选择250天和350天作为可选的时间窗口来过滤数据。然后,我们训练模型并比较选择的预测因子。在整个数据集的基础上,通过10倍交叉验证,比较了原始模型和2个备选模型的性能(AUC)。所有分析均使用R(版本4.0.4,The R Foundation)进行。本研究中使用的代码可以在GitHub存储库中找到[55]。


共纳入743例患者,其中结核- dili阳性281例(37.8%),阴性462例(62.2%)。表1显示描述性统计信息。患者年龄中位数为30岁(IQR 25-45岁),男性484例(65.1%)。大多数患者(n=272, 43.5%)具有本科及以上学历。患者中位体重为56 (IQR 50-63) kg,中位身高为168 (IQR 160-173) cm。共有24例(3.2%)患者患有乙型肝炎,69例(9.3%)患者患有糖尿病。男性DILI患者比例(n=281, 74.0%)显著高于非DILI患者比例(n=276, 59.7%)。DILI患者最近测定的ALT水平和最近2次ALT测量的平均变化率(分别为27.0 U/L, IQR为17.0-34.0 U/L和0.27 U/[Lday], IQR为0.0-0.6 U/[Lday])显著高于无DILI患者(分别为11.0 U/L, IQR为8.3-16.0 U/L和0.0 U/[Lday], IQR为-0.1至0.1 U/[Lday])。图1显示开始抗结核治疗后每天结核- dili病例数。从治疗到DILI发作的中位时间为27 (IQR 15-48)天。

表1。患者人口学和临床特征(N=743)。
特征 整体 阴性病例(n=462) 阳性病例(n=281) P价值
男性,n (%) 484 (65.1) 276 (59.7) 208 (74.0) <措施
年龄一个(年),中位数(IQR) 30日(25-45) 30日(25-45) 31日(25岁至44岁) .62
重量一个(kg),中位数(IQR) 56.0 (50.0 - -63.0) 55.00 (49.0 - -63.0) 57.0 (51.5 - -63.0) 06
教育程度,n (%) 55

初中以下 201 (32.2) 123 (33.1) 78 (30.8)

中学 152 (24.3) 93 (25.0) 59 (23.3)

本科以上学历 272 (43.5) 156 (41.9) 116 (45.8)
收入一个(元b),中位数(IQR) 500000年(300000 - 800000) 500000年(300000 - 800000) 600000年(500000 - 1000000) .002
高度一个(cm),中位数(IQR) 168.0 (160.0 - -173.0) 167.0 (160.0 - -172.0) 168.0 (162.0 - -173.0) 03
乙型肝炎,n (%) 24 (3.2) 16 (3.5) 8 (2.8) 结果
糖尿病,n (%) 69 (9.3) 48 (10.4) 21日(7.5) 23)
身体质量指数一个,中位数(IQR) 20.0 (18.5 - -22.1) 19.9 (18.4 - -22.0) 20.2 (18.7 - -22.2)
吡嗪酰胺剂量一个(g),中位数(IQR) 16.8 (3.0 - -60.0) 24.0 (3.1 - -87.9) 5.4 (3.0 - -25.6) <措施
利福平剂量一个(g),中位数(IQR) 13.5 (1.3 - -67.5) 40.5 (5.5 - -94.5) 3.2 (1.2 - -12.6) <措施
乙胺丁醇剂量一个(g),中位数(IQR) 18.7 (2.2 - -91.1) 50.3 (4.4 - -139.2) 5.3 (2.2 - -18.8) <措施
异烟肼剂量一个(g),中位数(IQR) 8.1 (0.8 - -37.0) 22.8 (3.6 - -58.3) 2.0 (0.6 - -6.5) <措施
最近的丙氨酸转氨酶测定a、c(U/L),中位数(IQR) 13.0 (10.0 - -23.0) 11.0 (8.3 - -16.0) 27.0 (17.0 - -34.0) <措施
丙氨酸转氨酶水平的变化率,维(U/[Lday]),中位数(IQR) 0.0(-0.1到0.1) 0.00(-0.1到0.1) 0.27 (0.0 ~ 0.6) <措施

一个非正态分布变量。

b1元人民币= 0.15美元。

c患者最近一次肝脏检查前的丙氨酸转氨酶水平。

d患者在最终肝功能检查前最后2次丙氨酸转氨酶测量值的平均变化率(增量除以持续时间)。

图1所示。本研究患者从结核治疗到发生药物性肝损伤的天数。DILI:药物性肝损伤;TB:肺结核。
查看此图

图2显示了单树XGBoost模型选择的前10个重要变量。最近的ALT水平被发现是预测过程中最重要的因素。我们在模型中分别添加了10个变量,形成10个候选模型。经过100次训练和测试数据集的10倍交叉验证,4个变量的模型AUC值最大(表2)。因此,我们选择具有4个变量的模型(最近的ALT测量值,最近2个ALT测量值的平均变化率,PZA累积剂量和EMB累积剂量)作为最终模型。然后,我们用整个训练数据集训练选定的模型。图3显示模型的单个决策树的内容。决策过程从最近的ALT测试值开始,然后在决策树的每个节点上进行二分类确定;这个过程以输出预测(DILI的高或低风险)结束。

图2。单树XGBoost模型选择的前10个重要变量。ALT:丙氨酸转氨酶,EMB:乙胺丁醇,INH:异烟肼,PZA:吡嗪酰胺,RFP:利福平。
查看此图
表2。AUC摘要一个候选模型的值。
候选人模型 变量,n AUC,均值(SD)
1 1 0.908 (0.043)
2 2 0.912 (0.040)
3. 3. 0.913 (0.041)
4(选定型号) 4 0.918 (0.040)
5 5 0.917 (0.040)
6 6 0.915 (0.040)
7 7 0.913 (0.040)
8 8 0.913 (0.041)
9 9 0.912 (0.041)
10 10 0.911 (0.041)

一个AUC:接收机工作特性曲线下的面积。

图3。详细概述了单决策树模型。决策过程从左侧开始(最近的ALT测量),并在右侧结束(“是”:药物性肝损伤风险高或“否”:药物性肝损伤风险低)。在决策树的每个节点上进行二分类确定。参考PZA和EMB的累积剂量。黑路径是缺失值的默认方向。ALT:丙氨酸转氨酶,EMB:乙胺丁醇,PZA:吡嗪酰胺,RFP:利福平。
查看此图

表3在验证数据集(136例)的基础上总结了模型的性能。正确预测DILI 70例,成功预测阴性33例。模型的准确率为90%,召回率为74%,分类准确率为76%,平衡错误率为77%,F1值为81%。对于正确预测的病例,从DILI发病到模型为患者提供高风险警告的中位数天数为15 (IQR 7.3-27.5)天(图4)。多媒体附录1给出了基于接收者工作特征曲线和AUC的单树XGBoost模型与多树XGBoost模型、逻辑回归模型、多树或单树随机森林模型在整个数据集上的性能比较。多树XGBoost模型表现最佳(AUC=0.940, 95% CI 0.924-0.956)。单树XGBoost模型的AUC为0.912 (95% CI 0.890-0.935),与多树模型非常相似,高于其他模型。

表4为候选模型在不同时间窗下的AUC值。不同时间窗下的最终模型都包含了4个最重要的预测因子,与我们的原始模型相同。在所有3种模型中,最近的ALT测量值、患者最近2次ALT测量值的平均变化率和PZA的累积剂量被确定为最佳预测因子。然而,我们的原始模型也选择了EMB的累积剂量作为一个重要的预测因子,并且在250天和350天时间窗口的基础上,分别选择了RFP和INH的累积剂量。三种模型的性能总结如下多媒体附录1,表明3种型号的接收机工作特性曲线模式相似,AUC值基本一致。

表3。模型的性能一个使用验证数据集。
预测或参考模型 是的 没有
是的,n 70 8
不,n 25 33

一个准确率=90%,召回率=74%,F1值=81%,分类准确率=76%,平衡错误率=77%。

图4。从药物性肝损伤发生到为TB-DILI患者提供高风险警告的模型之间的天数。TB-DILI:结核伴药物性肝损伤。
查看此图
表4。AUC摘要一个敏感性分析后候选模型的值。
候选人模型 变量,n 模型250天时间窗的AUC,均值(SD) 模型350天时间窗的AUC,均值(SD)
1 1 0.910 (0.040) 0.913 (0.042)
2 2 0.916 (0.039) 0.911 (0.040)
3. 3. 0.920 (0.039) 0.915 (0.041)
4(选定型号) 4 0.922 (0.039) 0.915 (0.041)
5 5 0.921 (0.039) 0.915 (0.041)
6 6 0.918 (0.038) 0.915 (0.042)
7 7 0.918 (0.039) 0.915 (0.041)
8 8 0.917 (0.039) 0.913 (0.041)
9 9 0.916 (0.039) 0.913 (0.041)
10 10 0.916 (0.039) 0.912 (0.041)

一个AUC:接收机工作特性曲线下的面积。


主要研究结果

抗结核药物是临床治疗结核病最常见和最有效的手段之一,可以有效控制结核病患者的疾病进展。然而,研究表明,由于抗结核药物的肝毒性,患者在治疗过程中可能发生DILI [1115-18]和长期治疗结核病[56]。临床医生往往难以预测抗结核治疗的疗效以及结核病患者的肝损伤状况。为了确定可靠准确的预测因子,更好地预测结核病治疗期间的DILI,我们建立了单树XGBoost机器学习模型,并选择了效果显著的变量。我们的模型可以为临床医生及时调整用药方案提供建议,避免造成更严重的肝损伤。据我们所知,这是首次将XGBoost模型应用于临床治疗阶段的DILI预测。

有趣的是,男性患TB-DILI的比例明显高于女性(表1)。这一结果与Chang等人[23],该研究表明,在调整年龄后,男性发生肝毒性的可能性是女性的2.1倍。我们发现DILI患者的最新ALT测量值明显高于没有DILI的患者,两次最新ALT测量值之间的平均变化率也高于没有DILI的患者(表1)。Singanayagam等[57]也证实了DILI患者治疗前ALT与治疗后2周ALT水平之间的关联。

根据变量选择的结果,预测DILI的重要预测因子是最近的ALT测量值、最近2个ALT测量值的平均变化率以及PZA和EMB的累积剂量。根据决策树(图3),我们模型的决策过程是首先关注患者最近的ALT测量,然后综合评估ALT水平的变化率以及PZA和EMB的累积摄入剂量,以做出预测。先前的一项研究[58]报道PZA及其代谢物的初始浓度与肝毒性有关[58]。Cao等[59]表明,与INH和RIF单药治疗相比,PZA、INH和RIF联合治疗可能增加肝毒性的风险。此外,在INH、RIF和EMB方案中加入低剂量PZA并没有显著增加抗结核治疗的前2个月DILI的发生率[60]。在单树模型的分支中(图3),并提供了不同情况下抗结核药物累积剂量是否促进DILI发展的阈值。

目前,各种机器学习算法已被评估用于早期检测DILI,并显示出较高的预测精度[6162]。Xu等[63]提出了一种深度学习模型,经过475个样本集的训练,对DILI预测进行外部验证,分类准确率达到86.9%。Dominic等人[64]将肝脏安全机制检测与贝叶斯机器学习算法相结合构建模型,该模型平衡准确率为86%,灵敏度为87%,特异性为85%,从而提高了DILI风险的预测。此外,XGBoost模型被用于提高大规模结核病筛查的特异性[65]。我们的模型也证明了XGBoost模型在临床治疗阶段的高预测准确性和可解释性。

从交叉验证的AUC值可以看出,与备选模型相比,多树XGBoost模型表现最好(多媒体附录1)。单树XGBoost模型显示出与多树XGBoost模型相似的性能。由于单树模型更容易解释,占用更少的计算资源,并且在更短的时间内提供预测,因此单树XGBoost模型更适合于临床环境。此外,单树XGBoost模型的性能优于多树随机森林模型和单树随机森林模型。逻辑回归模型也是可解释的。然而,由于线性模型不能直接处理缺失值,缺失的临床数据可能会影响逻辑回归的性能。对于多次插值,需要额外的假设和先验信息,这可能会使过程复杂化,降低模型的鲁棒性。此外,灵敏度分析表明,在不同时间窗的训练下,我们的模型具有一致的高预测精度。因此,在所有候选模型中,单树XGBoost模型是最合适的。

限制

我们的模型也有一些值得注意的局限性。首先,尽管该模型确定了最有意义的TB-DILI风险预测因子,但由于该模型完全由数据输入驱动,因此应谨慎做出病理结论。数据更新时,需要对模型进行相应的调整。其次,我们的模型在其他数据集上缺乏验证。未来的研究可以通过将该模型应用于更大的数据集来进一步探索这些问题。输入更多的数据可能有助于识别更有效的预测者,并产生更高的预测准确性。此外,还需要验证模型在不平衡数据集上的性能,以确定是否需要进一步的重加权或重采样来提高预测精度。

结论

我们开发了一种单树XGBoost模型,该模型证明了患者最近的ALT测量值、患者两项最新ALT测量值的平均变化率以及PZA和EMB的累积剂量是评估DILI风险的最佳预测因子。在验证数据集中,该模型预测TB-DILI病例具有较高的准确率(准确率为90%,召回率为74%,分类准确率为76%,平衡错误率为77%)和可解释性。此外,模型给出患者高风险预警与DILI发病之间的中位数天数为15 (IQR 7.3-27.5)天,提示临床医生可以参考模型预测调整用药方案,避免造成更严重的肝损伤。

致谢

深圳市科技创新委员会资助:基于机器学习的结核病药物性肝损伤早期预警模型研究(奖项# JCYJ20190809153201668)和深圳市医学三明项目(奖项# SZSM201603029)。

利益冲突

没有宣布。

多媒体附录1

补充材料。

DOCX文件,5878 KB

  1. 经合发组织和世界卫生组织。肺结核。见:健康概览:2020年亚太地区。衡量实现全民健康覆盖的进展。巴黎:经合组织出版;2020.
  2. Albert RK, Iseman M, Sbarbaro JA, Stage A, Pierson DJ。监测结核病患者治疗期间和治疗后的失败情况。中国生物医学工程学报,1997,12(6):1051-1060。[CrossRef] [Medline]
  3. Isa S, Ebonyi A, Shehu N, Idoko P, Anejo-Okopi J, Simji G,等。尼日利亚乔斯住院病人的抗结核药物和肝毒性中华结核分枝杆菌学杂志,2016;5(1):21-26 [J]免费全文] [CrossRef] [Medline]
  4. 李建平,李建平,李建平,等。抗结核药物致肝毒性的研究进展。生物医学工程学报(英文版);2004;38(6):1074-1079。[CrossRef] [Medline]
  5. 安华,吴旭,王忠,徐军,郑松,王凯。2457例住院结核病患者抗结核药物致肝损伤临床特征分析。中国医药杂志,2013;7(13):710-714。[CrossRef]
  6. Dheda K, Barry CE, Maartens G.肺结核。柳叶刀2016年3月;387(10024):1211-1226。[CrossRef]
  7. 郑毅,朴建军,赵玉军,尹海燕,宋军,李春涛,等。抗结核药物的肝毒性及其血清水平。韩国医学杂志2015;30(2):167-172 [J]免费全文] [CrossRef] [Medline]
  8. 李建军,李建军,李建军,等。抗结核治疗中肝毒性的危险因素分析。中国军事学报,2006;32 (1):45-49 [J]免费全文] [CrossRef] [Medline]
  9. 王晓明,王晓明,王晓明,王晓明。抗结核药物肝毒性的研究进展。[J]国际肝病杂志,2008;23(2):192-202。[CrossRef] [Medline]
  10. 王晓东,王晓东,王晓东,等。南埃塞俄比亚达罗地区结核病患者抗结核药物肝毒性发生率及相关危险因素的队列研究。中华结核分枝杆菌学杂志,2016;5(1):14-20 [J]免费全文] [CrossRef] [Medline]
  11. Saukkonen JJ, Cohn DL, Jasmer RM, Schenker S, Jereb JA, Nolan CM, ATS(美国胸科学会)抗结核治疗肝毒性小组委员会。ATS官方声明:抗结核治疗的肝毒性。[J]中华呼吸与急救医学杂志,2006;18(8):935-952。[CrossRef] [Medline]
  12. 刘建军,刘建军,刘建军,等。抗结核治疗引起的药物性肝损伤:一项来自英国大型结核病中心的回顾性研究。BMC感染杂志2017年3月24日;17(1):231 [j]免费全文] [CrossRef] [Medline]
  13. Singanayagam A, Sridhar S, Dhariwal J, Abdel-Aziz D, Munro K, Connell DW等。抗结核治疗中监测肝功能两种策略的比较。[J]中华呼吸与急救医学杂志,2012;18(6):653-659。[CrossRef] [Medline]
  14. Yee D, Valiquette C, Pelletier M, Parisien I, Rocher I, Menzies D.一线抗结核药物在活动性结核病治疗中的严重副作用发生率。[J]中华呼吸与急救医学杂志,2003;16(11):1145 - 1145。[CrossRef] [Medline]
  15. 刘建军,刘建军,刘建军。中毒性肝炎与异烟肼和利福平。一个荟萃分析。胸部1991年2月;99(2):465-471。[CrossRef] [Medline]
  16. 杨伟,梁晨。抗结核药物的肝毒性研究。中华呼吸病学杂志2006;11(6):699-707。[CrossRef] [Medline]
  17. 杨建军,张建军,张建军,等。吡嗪酰胺和乙胺丁醇治疗潜伏性结核的肝毒性研究。中华呼吸杂志2005;26(3):462-464 [J]免费全文] [CrossRef] [Medline]
  18. 舒晨,李晨,李敏,王健,于超,李玲。一线抗结核药物的肝毒性:台湾某医疗中心的5年经验。中华结核与肺杂志,2013;17(7):934-939。[CrossRef] [Medline]
  19. 张洪兰。抗结核药物性肝损伤的预防及治疗药物的选择。中华实用医学杂志,2016;36(24):3307-3311。[CrossRef]
  20. 中华医学会结核病分会。抗结核药物性肝损伤诊治指南(2019年版)。中华结核与呼吸杂志2019;42(05):343-356。[CrossRef]
  21. 孙培芳,彭秋莎,凌云。药物性肝损伤生物标志物。世界中医药2020;15(23):37-44。[CrossRef]
  22. Hosford JD, von Fricken ME, Lauzardo M, Chang M, Dai Y, Lyon JA,等。老年人抗结核治疗的肝毒性:一项系统综述。结核病(爱丁堡)2015年3月;95(2):112-122 [j]免费全文] [CrossRef] [Medline]
  23. 张建超,梁振中,姚伟伟,刘泰,谭明明。吡嗪酰胺的肝毒性:队列和病例对照分析。[J]中华呼吸与急救医学杂志,2008;17(6):391- 396。[CrossRef] [Medline]
  24. Lammert C, Imler T, Teal E, Chalasani N.慢性肝病提示非酒精性脂肪性肝病患者可能有较高的药物性肝损伤风险。中华胃肠与肝杂志2019;17(13):2814-2815。[CrossRef] [Medline]
  25. 王志强,王志强。药物性肝病。编辑:Schiff ER, Maddrey WC, Sorrell MF。希夫肝病(第11版)。新德里:威利-布莱克威尔;2011:703 - 783。
  26. Tweed CD, Wills GH, Crook AM, Dawson R, Diacon AH, low CE等。REMoxTB研究中与结核化疗相关的肝毒性。中国医学杂志2018年3月28日;16(1):46 [j]免费全文] [CrossRef] [Medline]
  27. Patterson B, Abbara A, Collin S, Henderson M, Shehata M, Gorgui-Naguib H,等。通过早期监测肝脏检查预测抗结核药物引起的药物性肝损伤。中华检验医学杂志,2011,32(2):344 - 344。[CrossRef] [Medline]
  28. 陈敏,Bisgin H,佟林,洪华,方华,Borlak J,等。人类药物性肝损伤的预测模型:我们做到了吗?中华生物医学杂志,2014;8(2):201-213 [j]免费全文] [CrossRef] [Medline]
  29. Quiroz JC,冯毅,程志,Rezazadegan D,陈鹏,林强,等。基于临床和影像学数据自动评估COVID-19严重程度的机器学习方法的开发和验证:回顾性研究。JMIR Med Inform 2021 Feb 11;9(2):e24572 [j]免费全文] [CrossRef] [Medline]
  30. 侯超,钟翔,何鹏,徐斌,刁松,易峰,等。使用机器学习技术预测中国女性乳腺癌:算法开发。中华医学杂志,2020;8(6):e17364 [j]免费全文] [CrossRef] [Medline]
  31. Sandhu S, Lin AL, Brajer N, Sperling J, Ratliff W, Bedoya AD,等。将机器学习系统集成到临床工作流程:定性研究。医学信息学报,2020,11,19;22(11):e22421 [J]免费全文] [CrossRef] [Medline]
  32. 李建军,李建军,李建军,李建军。基于机器学习和序列特征的急诊科心脏骤停预测:模型建立和回顾性临床验证研究。中华医学杂志,2008,28 (8):559 - 559 [j]免费全文] [CrossRef] [Medline]
  33. Fujihara K, Matsubayashi Y,原田山田M,山本M, Iizuka T,宫村K,等。日本2型糖尿病患者胰岛素启动决策的机器学习方法(JDDM 58):模型开发和验证研究。中华医学杂志[j]; 2011;9(1): 362 - 362 [j]免费全文] [CrossRef] [Medline]
  34. 刘建军,刘建军,李建军,等。基于机器学习的药物性肝损伤预测方法研究。中华医学杂志,2010;17(7):2628-2637 [j]免费全文] [CrossRef] [Medline]
  35. Sakatis MZ, Reese MJ, Harrell AW, Taylor MA, Baines IA, Chen L,等。使用>200种化合物的体外生物活性数据降低临床肝毒性的临床前策略。中华毒物学杂志,2012;25(10):2067-2082。[CrossRef] [Medline]
  36. Nakayama S, Atsumi R, Takakusa H, Kobayashi Y,栗原A, Nagai Y,等。使用日剂量和共价结合进行特殊药物毒性风险评估的区域分类系统。2009年9月37日(9):1970-1977。[CrossRef] [Medline]
  37. Chen M, Borlak J, Tong w。高亲脂性和高日剂量口服药物与药物性肝损伤的显著风险相关。国际肝病杂志,2013;58(1):388-396。[CrossRef] [Medline]
  38. 张建军,张建军,张建军,张建军。基于贝叶斯机器学习的药物性肝损伤预测方法。化学与毒物,2020,21(1):239-248。[CrossRef] [Medline]
  39. 张建军,张建军,张建军,等。基于贝叶斯神经网络的毒性预测方法。中国生物医学工程学报,2020;16 (1):100 - 133 [j]免费全文] [CrossRef]
  40. De'ath G, fabicius K.分类和回归树:一种强大而简单的生态数据分析技术。生态学报,2000,31 (11):3178-3192 [j]免费全文] [CrossRef]
  41. 陈涛,Guestrin C. XGBoost:一种可扩展的树增强系统。2016在第22届ACM SIGKDD知识发现与数据挖掘国际会议上发表;2016年8月13-17日;纽约,纽约。[CrossRef]
  42. 王强,王志强。XGBoost模型在慢性肾脏病诊断中的应用。[j] .计算机工程学报,2016;17(6):661 - 661。[CrossRef] [Medline]
  43. 弗里德曼JH。贪心函数逼近:一种梯度增强机。统计学报,2001,29(5):1189-1232。[CrossRef]
  44. 张欣,李涛,王军,李军,陈玲,刘晨。基于XGBoost的肿瘤相关长链非编码rna的高精度鉴定。Front Genet 2019;10:735 [免费全文] [CrossRef] [Medline]
  45. 李国强,杜德华,赵峰,叶海霞,陈晨。XGBoost提高IDH1野生型胶质母细胞瘤MGMT启动子甲基化的分类水平。中华医学杂志2020年9月15日;10(3):128 [J]免费全文] [CrossRef] [Medline]
  46. A,莫瓦hedi A, Taghipour H, Derrible S, Mohammadian A.面向更安全道路的XGBoost和SHAP实时事故检测与特征分析。[au:] [au:] 2020年3月;136:105405。[CrossRef] [Medline]
  47. 使用GPU计算加速XGBoost算法。[j] .计算机工程学报,2017;33(4):591 - 591。[CrossRef]
  48. 李勇,杨玲,杨斌,王宁,吴涛。可解释机器学习模型在智能决策中的应用。计算机科学进展(英文版);33 (3):391 - 391 [j]免费全文] [CrossRef]
  49. 闫磊,张宏,Goncalves J,肖勇,王敏,郭勇,等。COVID-19患者可解释的死亡率预测模型[j] .计算机工程学报,2014;22(5):383 - 388。[CrossRef]
  50. 毕勇,向东,葛志,李峰,贾超,宋健。基于XGBoost和SHAP的n -甲基鸟苷位点可解释性预测模型。生物信息学[j]; [c]; 2012;免费全文] [CrossRef] [Medline]
  51. 陈涛,何涛,Benesty M, Khotilovich V,唐勇,赵辉。xgboost:极限梯度增强。R包版本0.4-2。URL:https://mran.microsoft.com/snapshot/2020-07-15/web/packages/xgboost/vignettes/xgboost.pdf[2021-07-12]访问
  52. DMW权力。评价:从精密度、召回率、f -测度到ROC、知情度、显著性、相关性。出来了。预印本于2020年10月11日在线发布。
  53. DeLong ER, DeLong DM, Clarke-Pearson DL。比较两个或多个相关的受者工作特性曲线下的面积:一种非参数方法。生物识别技术1988;44(3):837-845。[Medline]
  54. Azur M, Stuart E, Frangakis C, Leaf P.链式方程的多重归算:它是什么?它是如何工作的?国际精神病学杂志,2011;20(1):40-49 [J]免费全文] [CrossRef] [Medline]
  55. 庄忠。tb - dili -预测模型。GutHub。URL:https://github.com/Larryzza/TB-Dili-forecast-model[2021-07-12]访问
  56. 怀超,魏勇,李敏,张旭,吴辉,邱旭,等。汉族人群DNA甲基化与抗结核药物性肝损伤的全基因组分析。中华临床药理学杂志,2019,26(6):1389-1397。[CrossRef] [Medline]
  57. Singanayagam A, Sridhar S, Dhariwal J, Abdel-Aziz D, Munro K, Connell DW等。抗结核治疗中监测肝功能两种策略的比较。[J]中华呼吸与急救医学杂志,2012;18(6):653-659。[CrossRef] [Medline]
  58. 石涛,派超,杨鹏,常伟,王宁,胡玉玉。吡嗪酰胺肝毒性的新机制。中国生物医学工程学报(英文版);2009;31 (4):349 - 349 [j]免费全文] [CrossRef] [Medline]
  59. 曹军,米勇,石超,边勇,黄超,叶忠,等。一线抗结核药物诱导肝毒性:基于尿代谢组学平台的新机制。生物化学学报,2018,33(2):485-491。[CrossRef] [Medline]
  60. Horita N, Miyazawa N, Yoshiyama T, Kojima R, Ishigatsubo Y, Kaneko T.目前使用的低剂量吡嗪酰胺在结核病治疗的前两个月不会增加肝损伤。实习医学2015;54(18):2315-2320 [j]免费全文] [CrossRef] [Medline]
  61. 刘建军,刘建军,李建军,等。基于机器学习的药物性肝损伤预测方法研究。中华医学杂志,2010;17(7):2628-2637 [j]免费全文] [CrossRef] [Medline]
  62. 陈建军,陈建军,陈建军,陈建军。基于机器学习的药物性肝损伤预测方法。Biol Direct 2020 2月13日;15(1):3 [免费全文] [CrossRef] [Medline]
  63. 徐勇,戴志,陈峰,高松,裴军,赖林。深度学习在药物性肝损伤中的应用。中国化学学报,2015;55(10):2085-2093。[CrossRef] [Medline]
  64. 张建军,张建军,张建军,张建军。基于贝叶斯机器学习的药物性肝损伤预测方法。化学与毒物,2020,21(1):239-248。[CrossRef] [Medline]
  65. Septiandri AA, Aditiawarman A, Tjiong R, Burhan E, Shankar A.利用成本敏感的机器学习分类改进大规模结核病筛查。2017发表于:美国胸科学会2017年国际会议;2017年5月19-24日;华盛顿特区。


ALT:丙氨酸氨基转移酶
AUC:接收机工作特性曲线下的面积
帝力:药物性肝损伤
循证:乙胺丁醇
异烟肼:异烟肼
PZA:吡嗪酰胺
RIF:利福平
结核病:肺结核


G·艾森巴赫编辑;提交30.03.21;由T Chen, K Turner同行评审;对作者的评论15.04.21;收到修订版本12.05.21;接受16.05.21;发表20.07.21

版权

©钟涛,庄子安,董晓丽,王家兴,王永德,王健,何代海,刘生远。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 2021年7月20日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到https://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map