这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
骨质疏松症是一种疾病,需要早期筛查和发现其管理。骨质疏松筛查常用的临床工具和机器学习(ML)模型已经开发出来,但它们显示出准确性低等局限性。此外,这些方法局限于有限的危险因素,缺乏个性化的解释。gydF4y2Ba
本研究的目的是开发一种具有临床特征的可解释的深度学习(DL)模型,用于骨质疏松症风险筛查。使用可解释的人工智能(XAI)技术提供具有特征贡献的个体解释的临床解释。gydF4y2Ba
我们使用了两个独立的数据集:来自美国(NHANES)和韩国(KNHANES)的国家健康和营养检查调查数据集,分别有8274和8680名受访者。根据股骨颈或全股骨的骨密度t评分对研究人群进行分类。在数据集上训练了骨质疏松症的DL模型,并使用局部可解释模型不可知解释(LIME)研究了显著的危险因素。将DL模型的性能与ML模型和常规临床工具进行了比较。此外,研究了危险因素的贡献排序和特征贡献的个性化解释。gydF4y2Ba
我们的DL模型使用NHANES数据集显示,股骨颈和股骨总骨密度的曲线下面积(AUC)值分别为0.851 (95% CI 0.844-0.858)和0.922 (95% CI 0.916-0.928)。KNHANES数据集对应的AUC值分别为0.827 (95% CI 0.821-0.833)和0.912 (95% CI 0.898-0.927)。通过LIME方法,诱导显著特征,并确定每个特征对个体风险的综合贡献和解释。gydF4y2Ba
所开发的DL模型显著优于传统的ML模型和临床工具。我们的XAI模型产生了高排名的特征,以及每个特征的综合贡献,这有助于解释单个风险。总之,我们的骨质疏松风险筛查可解释模型优于最先进的方法。gydF4y2Ba
骨质疏松症是一种骨骼疾病,其特征是骨量减少、骨组织微结构退化和骨质量下降,从而导致骨质脆弱和骨折风险增加[gydF4y2Ba
双能x线骨密度仪(DXA),特别是髋关节和腰椎的中央DXA,目前是测量骨密度(BMD)来定义骨质疏松症的金标准。然而,集中式DXA由于其低可用性和高成本而没有得到广泛应用[gydF4y2Ba
作为筛查的另一种方法,临床评估工具,如骨折风险评估工具(FRAX)、简单计算骨质疏松风险评估(SCORE)、骨质疏松风险评估工具(ORAI)、骨质疏松风险指数(OSIRIS)和骨质疏松自我评估工具(OST)已被开发出来,以确定骨质疏松风险增加的患者。这些工具的曲线下面积(AUC)范围为0.65到0.70。FRAX是一种被广泛研究的预测骨折风险的工具,其AUC在0.58 ~ 0.82 [gydF4y2Ba
随着大数据时代计算能力的指数级增长,机器学习(ML)方法已迅速应用于医疗领域,包括骨病诊断。与现有的临床工具相比,基于人工智能的方法具有分析与骨质疏松症相互交织关系的多种特征的优势,准确性更高。多项研究揭示了ML方法在骨质疏松症诊断和检测、骨折预测中的应用[gydF4y2Ba
因此,我们开发了一种深度学习(DL)模型来筛查骨质疏松症风险,并利用可解释的人工智能(XAI)技术为我们模型的结果提供临床解释。为了证明我们方法的性能,我们将DL模型的结果与ML模型和传统临床工具的结果进行了比较。我们还证明了我们的模型为特征贡献提供了单独的解释。据我们所知,这是第一个使用DL方法进行基于大型人口数据库的风险筛查的研究。我们的模型研究了使用任意特征工程的传统统计无法识别的变量的复杂非线性关系。此外,通过考虑风险变量的各种组合和疾病的复杂方面,提出了个性化风险评估和治疗决策的综合方法。gydF4y2Ba
本研究使用了两个横断面数据集,即美国(NHANES)和韩国(KNHANES)的国家健康和营养检查调查数据集。NHANES是由国家卫生统计中心进行的一项横断面研究,旨在评估美国人口的整体健康和营养状况[gydF4y2Ba
我们使用了2005年至2006年、2007年至2008年、2009年至2010年和2013年至2014年四个周期的NHANES,我们只纳入了年龄超过50岁或已经绝经的受访者。NHANES的两个周期(2011 - 2012年和2015 - 2016年)被排除在外,因为这两个周期没有股骨颈BMD和股骨总BMD数据。在NHANES中,使用Hologic QDR-4500A扇束密度计(Hologic, Inc;贝德福德,马萨诸塞州,美国)。gydF4y2Ba
KNHANES是自1998年以来由韩国疾病控制和预防中心(KCDC)进行的一项对韩国健康和营养状况的横断面调查,具有代表性的人口集通过抽样得出[gydF4y2Ba
这些方法是根据相关指南和法规执行的,并得到国家卫生统计中心研究伦理审查委员会的批准(议定书#2005-06,议定书#2011-17)。NHANES已获得所有受访者的书面知情同意。KNHANES获得了KCDC机构审查委员会(2008-04EXP-01-C, 2009-01CON-03-2C, 2010-02CON-21-C, 2011-02CON-06-C)的批准,并获得了所有参与者的书面同意。gydF4y2Ba
对于NHANES和KNHANES,基于股骨颈骨密度和股骨总骨密度的两种不同标准将受访者分为骨质疏松症组、骨质减少组和正常组。股骨颈BMD或股骨总BMD t评分低于- 2.5的受访者被定义为骨质疏松症。t评分在- 1.0和- 2.5之间的患者被归为骨质减少组。t评分高于- 1.0的组被定义为正常组。对于KNHANES, t评分的计算采用了一个20岁以上的日本个体参照组[gydF4y2Ba
我们只纳入了有股骨颈和股骨总BMD记录的受访者。此外,将多个具有相关信息的变量合并为单个变量或删除除一个变量外的所有变量。例如,患者健康问卷-9 (PHQ-9)中使用的九个表明抑郁症症状和体征的变量[gydF4y2Ba
在合并变量后,我们排除了具有非数字值的变量,并将“拒绝”或“不知道”的响应视为缺失值。所有变量中缺失值超过10%的被调查者或所有被调查者中缺失值超过10%的变量被排除在外。使用k-nearest neighbors (KNN) imputation填充缺失值。预处理结束时,总共创建了四种类型的数据集:两个来自NHANES,两个来自KNHANES,每个数据集在将受访者分为骨质疏松、骨质减少或正常组时使用股骨颈BMD或股骨总BMD。来自NHANES的两个数据集包括8274名受访者和89个变量,来自KNHANES的两个数据集包括8680名受访者和162个变量。中给出了整个数据处理的流程图gydF4y2Ba
整体数据预处理流程图。BMD:骨密度:KNHANES:韩国健康和营养调查;全国健康和营养调查(美国)。gydF4y2Ba
我们实现了一种DL算法,并将结果与ML算法进行了比较。我们使用的DL模型由三层组成:两层具有整流线性单元激活函数的密集层和最后一层具有软最大激活函数的层。在两个密集层之后,加入了批量归一化层和dropout层。通过五次交叉验证,基于所创建数据集的五个子集优化DL模型的超参数。NHANES的优化模型有两个密集层(股骨颈各有128和16个节点,全股骨各有128和64个节点),使用Adam优化器的学习率为0.005,dropout率为0.2。KNHANES模型有两个密集层(股骨颈分别为128和16个节点,股骨总节点为128和32个节点),使用Adam优化器和0.005学习率时的退出率分别为0.2(股骨颈)和0.4(股骨总)。使用TensorFlow后端(谷歌Inc)在Keras中训练和优化模型[gydF4y2Ba
在训练DL和ML模型之后,我们应用了一种算法来解释DL模型的行为,并根据重要性对特征进行排序。对于DL模型,局部可解释模型不可知解释(LIME) [gydF4y2Ba
出于类似的原因,Boruta [gydF4y2Ba
广泛用于诊断骨质疏松症的临床评估工具,如OST、ORAI和OSIRIS被用于比较,以评估DL模型的性能。我们在NHANES和KNHANES数据集上比较了DL模型与临床骨质疏松评估工具的性能。在对骨质疏松症进行分类时,OST用于男性和女性,而ORAI和OSIRIS仅用于女性数据集。gydF4y2Ba
来自NHANES和KNHANES数据集的连续变量的比较使用Student进行gydF4y2Ba
来自预处理数据集的受访者的基线特征显示在gydF4y2Ba
受访者的一般特征。gydF4y2Ba
变量gydF4y2Ba | NHANESgydF4y2Ba一个gydF4y2Ba(N = 8274)gydF4y2Ba | KNHANESgydF4y2BabgydF4y2Ba(N = 8680)gydF4y2Ba |
|
||
|
<措施gydF4y2Ba | ||||
|
男性gydF4y2Ba | 4283 (51.76)gydF4y2Ba | 3899 (44.92)gydF4y2Ba |
|
|
|
女gydF4y2Ba | 3991 (48.24)gydF4y2Ba | 4781 (55.08)gydF4y2Ba |
|
|
年龄(年),平均值(SD)gydF4y2Ba | 64.89 (9.67)gydF4y2Ba | 63.83 (8.99)gydF4y2Ba | <措施gydF4y2Ba | ||
|
<措施gydF4y2Ba | ||||
|
家庭PIRgydF4y2BadgydF4y2Ba | 2.71 (1.54)gydF4y2Ba | N/AgydF4y2BaegydF4y2Ba |
|
|
|
家庭收入gydF4y2Ba | N/AgydF4y2Ba | 141.07 (134.24)gydF4y2Ba |
|
|
|
<措施gydF4y2Ba | ||||
|
每年至少喝12杯gydF4y2Ba | 5705 (68.95)gydF4y2Ba | N/AgydF4y2Ba |
|
|
|
高风险的酒鬼gydF4y2Ba | N/AgydF4y2Ba | 682 (7.86)gydF4y2Ba |
|
|
一生至少吸100支烟,n (%)gydF4y2Ba | 4316 (52.16)gydF4y2Ba | 3475 (40.03)gydF4y2Ba | <措施gydF4y2Ba | ||
无体能限制,n (%)gydF4y2Ba | 7269 (87.85)gydF4y2Ba | 6465 (74.48)gydF4y2Ba | <措施gydF4y2Ba | ||
BMI(公斤/米gydF4y2Ba2gydF4y2Ba),平均值(SD)gydF4y2Ba | 28.46 (5.47)gydF4y2Ba | 23.94 (3.13)gydF4y2Ba | <措施gydF4y2Ba | ||
糖尿病,n (%)gydF4y2Ba | 1457 (17.61)gydF4y2Ba | 1528 (17.61)gydF4y2Ba | 0。gydF4y2Ba | ||
高血压,n (%)gydF4y2Ba | 4344 (52.50)gydF4y2Ba | 4529 (52.18)gydF4y2Ba | <措施gydF4y2Ba | ||
抑郁,n (%)gydF4y2Ba | 532 (6.43)gydF4y2Ba | 437 (5.03)gydF4y2Ba | <措施gydF4y2Ba | ||
|
<措施gydF4y2Ba | ||||
|
股骨颈gydF4y2Ba | 0.77 (0.14)gydF4y2Ba | 0.67 (0.13)gydF4y2Ba |
|
|
|
总股骨gydF4y2Ba | 0.93 (0.17)gydF4y2Ba | 0.84 (0.15)gydF4y2Ba |
|
|
骨质疏松家族史,n (%)gydF4y2Ba | 1031 (12.456)gydF4y2Ba | 1252 (14.42)gydF4y2Ba | <措施gydF4y2Ba | ||
|
<措施gydF4y2Ba | ||||
|
正常的gydF4y2Ba | 4564 (55.16)gydF4y2Ba | 4204 (48.43)gydF4y2Ba |
|
|
|
骨量减少gydF4y2Ba | 3233 (39.07)gydF4y2Ba | 3255 (37.50)gydF4y2Ba |
|
|
|
骨质疏松症gydF4y2Ba | 477 (5.77)gydF4y2Ba | 1221 (14.07)gydF4y2Ba |
|
|
|
<措施gydF4y2Ba | ||||
|
正常的gydF4y2Ba | 6031 (72.89)gydF4y2Ba | 6095 (70.22)gydF4y2Ba |
|
|
|
骨量减少gydF4y2Ba | 1965 (23.75)gydF4y2Ba | 2313 (26.65)gydF4y2Ba |
|
|
|
骨质疏松症gydF4y2Ba | 278 (3.36)gydF4y2Ba | 272 (3.13)gydF4y2Ba |
|
一个gydF4y2BaNHANES:美国国家健康和营养调查。gydF4y2Ba
bgydF4y2Bakhanes:韩国全国健康和营养调查。gydF4y2Ba
cgydF4y2Ba
dgydF4y2BaPIR:贫困收入比。gydF4y2Ba
egydF4y2BaN/A:不适用。gydF4y2Ba
优化后的DL和ML模型的接收机工作特性曲线和相应的AUC值分别为gydF4y2Ba
深度学习(DL)模型在NHANES和KNHANES数据集上的性能。DL模型应用于NHANES和KNHANES股骨颈和股骨总骨密度(BMD)的受试者工作特征(ROC)曲线。各个类的曲线值下的面积在图中标注。KNANES:韩国全国健康和营养调查;NHANES:美国国家健康和营养调查。gydF4y2Ba
机器学习(ML)模型在NHANES和KNHANES数据集上的性能。7个ML模型的受试者工作特征(ROC)曲线应用于NHANES和KNHANES股骨颈和股骨总骨密度(BMD)。各类的曲线下面积(AUC)值在图中标注。KNANES:韩国全国健康和营养调查;KNN: k-最近邻;LGBM:轻型梯度提升机;MLP:多层感知器;NHANES:美国全国健康和营养调查;支持向量机:支持向量机。gydF4y2Ba
深度学习和机器学习模型的性能。gydF4y2Ba
算法gydF4y2Ba | AUCgydF4y2Ba一个gydF4y2Ba(95%置信区间)gydF4y2Ba | |||
|
NHANESgydF4y2BabgydF4y2Ba | KNHANESgydF4y2BacgydF4y2Ba | ||
|
股骨颈gydF4y2Ba | 总股骨gydF4y2Ba | 股骨颈gydF4y2Ba | 总股骨gydF4y2Ba |
深度学习(微观平均)gydF4y2Ba | 0.851 (0.844 - -0.858)gydF4y2Ba | 0.922 (0.916 - -0.928)gydF4y2Ba | 0.827 (0.821 - -0.833)gydF4y2Ba | 0.912 (0.898 - -0.927)gydF4y2Ba |
深度学习(骨质疏松)gydF4y2Ba | 0.866 (0.842 - -0.890)gydF4y2Ba | 0.915 (0.898 - -0.931)gydF4y2Ba | 0.874 (0.858 - -0.890)gydF4y2Ba | 0.898 (0.884 - -0.911)gydF4y2Ba |
深度学习(骨质减少)gydF4y2Ba | 0.719 (0.707 - -0.730)gydF4y2Ba | 0.784 (0.763 - -0.805)gydF4y2Ba | 0.688 (0.679 - -0.698)gydF4y2Ba | 0.782 (0.751 - -0.812)gydF4y2Ba |
深度学习(正常)gydF4y2Ba | 0.783 (0.776 - -0.789)gydF4y2Ba | 0.827 (0.809 - -0.846)gydF4y2Ba | 0.823 (0.815 - -0.832)gydF4y2Ba | 0.822 (0.795 - -0.849)gydF4y2Ba |
非线性支持向量机gydF4y2BadgydF4y2Ba | 0.800 (0.761 - -0.838)gydF4y2Ba | 0.848 (0.791 - -0.906)gydF4y2Ba | 0.785 (0.775 - -0.795)gydF4y2Ba | 0.895 (0.888 - -0.902)gydF4y2Ba |
额外的树gydF4y2Ba | 0.807 (0.802 - -0.812)gydF4y2Ba | 0.893 (0.883 - -0.903)gydF4y2Ba | 0.769 (0.761 - -0.777)gydF4y2Ba | 0.885 (0.882 - -0.887)gydF4y2Ba |
逻辑回归gydF4y2Ba | 0.827 (0.803 - -0.850)gydF4y2Ba | 0.900 (0.868 - -0.932)gydF4y2Ba | 0.794 (0.781 - -0.807)gydF4y2Ba | 0.905 (0.899 - -0.910)gydF4y2Ba |
然而,gydF4y2BaegydF4y2Ba | 0.770 (0.763 - -0.778)gydF4y2Ba | 0.866 (0.855 - -0.878)gydF4y2Ba | 0.717 (0.711 - -0.724)gydF4y2Ba | 0.846 (0.837 - -0.855)gydF4y2Ba |
LGBMgydF4y2BafgydF4y2Ba分类器gydF4y2Ba | 0.810 (0.804 - -0.821)gydF4y2Ba | 0.900 (0.899 - -0.918)gydF4y2Ba | 0.750 (0.745 - -0.759)gydF4y2Ba | 0.900 (0.900 - -0.905)gydF4y2Ba |
中长期规划gydF4y2BaggydF4y2Ba | 0.819 (0.806 - -0.831)gydF4y2Ba | 0.902 (0.897 - -0.907)gydF4y2Ba | 0.766 (0.754 - -0.779)gydF4y2Ba | 0.869 (0.860 - -0.879)gydF4y2Ba |
决策树gydF4y2Ba | 0.668 (0.655 - -0.681)gydF4y2Ba | 0.761 (0.749 - -0.773)gydF4y2Ba | 0.649 (0.642 - -0.655)gydF4y2Ba | 0.755 (0.747 - -0.762)gydF4y2Ba |
一个gydF4y2BaAUC:曲线下面积。gydF4y2Ba
bgydF4y2BaNHANES:美国国家健康和营养调查。gydF4y2Ba
cgydF4y2Bakhanes:韩国全国健康和营养调查。gydF4y2Ba
dgydF4y2Ba支持向量机:支持向量机。gydF4y2Ba
egydF4y2BaKNN: k-最近邻。gydF4y2Ba
fgydF4y2BaLGBM:轻型梯度提升机。gydF4y2Ba
ggydF4y2BaMLP:多层感知器。gydF4y2Ba
临床骨质疏松症评估工具的性能。AUC:曲线下面积;khanes:韩国全国健康和营养调查;NHANES:美国全国健康和营养调查;骨质疏松症风险评估工具ORAI;骨质疏松症风险指数;骨质疏松症自我评估工具;ROC:受试者工作特征。gydF4y2Ba
用LIME对NHANES和KNHANES数据计算的贡献排名列于gydF4y2Ba
美国国家健康与营养检查调查(NHANES)中深度学习模型和局部可解释模型不可知解释的前20个特征的排名。gydF4y2Ba
NHANES排名gydF4y2Ba | 股骨颈gydF4y2Ba | 总股骨gydF4y2Ba |
|||
|
功能描述gydF4y2Ba | 系数gydF4y2Ba | 功能描述gydF4y2Ba | 系数gydF4y2Ba | |
1gydF4y2Ba | 性gydF4y2Ba | 234.15gydF4y2Ba | 性gydF4y2Ba | 188.91gydF4y2Ba | |
2gydF4y2Ba | 年龄gydF4y2Ba | 171.67gydF4y2Ba | 年龄gydF4y2Ba | 77.05gydF4y2Ba | |
3.gydF4y2Ba | BMI(公斤/米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba | 115.66gydF4y2Ba | 臂围(厘米)gydF4y2Ba | 60.84gydF4y2Ba | |
4gydF4y2Ba | 臂围(厘米)gydF4y2Ba | 108.35gydF4y2Ba | BMI(公斤/米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba | 59.49gydF4y2Ba | |
5gydF4y2Ba | 医生说过你有关节炎gydF4y2Ba | 68.07gydF4y2Ba | 医生说过你超重gydF4y2Ba | 37.31gydF4y2Ba | |
6gydF4y2Ba | 上臂长度(厘米)gydF4y2Ba | 60.80gydF4y2Ba | 上臂长度(厘米)gydF4y2Ba | 30.45gydF4y2Ba | |
7gydF4y2Ba | 一生至少抽100支烟gydF4y2Ba | 43.30gydF4y2Ba | 这种饮食有多健康gydF4y2Ba | 20.29gydF4y2Ba | |
8gydF4y2Ba | 医生确认过你有高血压gydF4y2Ba | 41.69gydF4y2Ba | 碱性磷酸酶(U/L)gydF4y2Ba | 18.92gydF4y2Ba | |
9gydF4y2Ba | 医生证实你有糖尿病gydF4y2Ba | 39.18gydF4y2Ba | 抑郁症gydF4y2Ba | 18.87gydF4y2Ba | |
10gydF4y2Ba | 上腿长(厘米)gydF4y2Ba | 37.27gydF4y2Ba | 家庭PIRgydF4y2Ba一个gydF4y2Ba | 17.33gydF4y2Ba | |
11gydF4y2Ba | 在楼梯/斜坡上呼吸急促gydF4y2Ba | 35.47gydF4y2Ba | 一生至少抽100支烟gydF4y2Ba | 14.40gydF4y2Ba | |
12gydF4y2Ba | 这种饮食有多健康gydF4y2Ba | 30.09gydF4y2Ba | 一般健康状况gydF4y2Ba | 13.90gydF4y2Ba | |
13gydF4y2Ba | 家庭PIRgydF4y2Ba | 24.97gydF4y2Ba | 漏尿的频率是多少gydF4y2Ba | 12.31gydF4y2Ba | |
14gydF4y2Ba | 医生说过你超重gydF4y2Ba | 22.42gydF4y2Ba | 医生证实你有糖尿病gydF4y2Ba | 12.13gydF4y2Ba | |
15gydF4y2Ba | 单核细胞数量gydF4y2Ba | 22.18gydF4y2Ba | 曾有过胸部疼痛或不适gydF4y2Ba | 12.00gydF4y2Ba | |
16gydF4y2Ba | 碱性磷酸酶(U/L)gydF4y2Ba | 21.99gydF4y2Ba | 体重最重年龄gydF4y2Ba | 11.35gydF4y2Ba | |
17gydF4y2Ba | 钾(更易/ L)gydF4y2Ba | 21.84gydF4y2Ba | 医生确认过你有高血压gydF4y2Ba | 11.12gydF4y2Ba | |
18gydF4y2Ba | 低密度脂蛋白gydF4y2BabgydF4y2Ba-胆固醇(mg/dL)gydF4y2Ba | 21.82gydF4y2Ba | 尿酸(mg/dL)gydF4y2Ba | 10.47gydF4y2Ba | |
19gydF4y2Ba | 尿酸(mg/dL)gydF4y2Ba | 20.56gydF4y2Ba | 在楼梯/斜坡上呼吸急促gydF4y2Ba | 9.45gydF4y2Ba | |
20.gydF4y2Ba | 抑郁症gydF4y2Ba | 16.98gydF4y2Ba | 葡萄糖(mg / dL)gydF4y2Ba | 8.68gydF4y2Ba |
一个gydF4y2BaPIR:贫困收入比。gydF4y2Ba
bgydF4y2BaLDL:低密度脂蛋白。gydF4y2Ba
在韩国国家健康和营养检查调查(KNHANES)中,使用深度学习模型和局部可解释的模型未知解释对前20个特征进行排名。gydF4y2Ba
KNHANES的等级gydF4y2Ba | 股骨颈gydF4y2Ba | 总股骨gydF4y2Ba | |||
|
功能描述gydF4y2Ba | 系数gydF4y2Ba | 功能描述gydF4y2Ba | 系数gydF4y2Ba | |
1gydF4y2Ba | 性gydF4y2Ba | 596.16gydF4y2Ba | 性gydF4y2Ba | 108.62gydF4y2Ba | |
2gydF4y2Ba | 年龄gydF4y2Ba | 354.75gydF4y2Ba | 年龄gydF4y2Ba | 106.44gydF4y2Ba | |
3.gydF4y2Ba | 肥胖的流行gydF4y2Ba | 227.33gydF4y2Ba | 肥胖的流行gydF4y2Ba | 79.23gydF4y2Ba | |
4gydF4y2Ba | 确诊为骨关节炎的年龄gydF4y2Ba | 188.29gydF4y2Ba | 婚姻状况gydF4y2Ba | 65.44gydF4y2Ba | |
5gydF4y2Ba | 糖尿病gydF4y2Ba | 166.55gydF4y2Ba | 乙型肝炎的治疗gydF4y2Ba | 55.64gydF4y2Ba | |
6gydF4y2Ba | BMI(公斤/米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba | 147.76gydF4y2Ba | BMI(公斤/米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba | 52.58gydF4y2Ba | |
7gydF4y2Ba | 诊断为高血压的年龄gydF4y2Ba | 144.57gydF4y2Ba | 确诊为骨关节炎的年龄gydF4y2Ba | 44.56gydF4y2Ba | |
8gydF4y2Ba | 高风险的喝gydF4y2Ba | 133.87gydF4y2Ba | 运动能力gydF4y2Ba | 38.27gydF4y2Ba | |
9gydF4y2Ba | 教育水平gydF4y2Ba | 122.13gydF4y2Ba | 抑郁的存在gydF4y2Ba | 37.48gydF4y2Ba | |
10gydF4y2Ba | 抑郁症的诊断gydF4y2Ba | 116.04gydF4y2Ba | 诊断为高血压的年龄gydF4y2Ba | 34.67gydF4y2Ba | |
11gydF4y2Ba | 甲状腺疾病的治疗gydF4y2Ba | 112.91gydF4y2Ba | 脑中风的治疗gydF4y2Ba | 33.70gydF4y2Ba | |
12gydF4y2Ba | 诊断为心绞痛的年龄gydF4y2Ba | 109.09gydF4y2Ba | 诊断为心肌梗死的年龄gydF4y2Ba | 33.68gydF4y2Ba | |
13gydF4y2Ba | 碱性磷酸酶(IU/L)gydF4y2Ba | 94.27gydF4y2Ba | 是否患有乳腺癌gydF4y2Ba | 32.73gydF4y2Ba | |
14gydF4y2Ba | 脑中风的治疗gydF4y2Ba | 92.46gydF4y2Ba | 诊断血脂异常gydF4y2Ba | 31.12gydF4y2Ba | |
15gydF4y2Ba | 更年期gydF4y2Ba | 92.10gydF4y2Ba | 限制身体活动gydF4y2Ba | 28.70gydF4y2Ba | |
16gydF4y2Ba | 诊断血脂异常gydF4y2Ba | 88.83gydF4y2Ba | 婚姻状况gydF4y2Ba | 28.32gydF4y2Ba | |
17gydF4y2Ba | 占领gydF4y2Ba | 88.02gydF4y2Ba | 碱性磷酸酶(IU/L)gydF4y2Ba | 23.72gydF4y2Ba | |
18gydF4y2Ba | 结直肠癌的诊断gydF4y2Ba | 85.92gydF4y2Ba | 结直肠癌的诊断gydF4y2Ba | 23.01gydF4y2Ba | |
19gydF4y2Ba | 存在心肌梗死或心绞痛gydF4y2Ba | 83.92gydF4y2Ba | 高强度体力活动gydF4y2Ba | 22.99gydF4y2Ba | |
20.gydF4y2Ba | 类风湿性关节炎的诊断gydF4y2Ba | 81.06gydF4y2Ba | 中等强度体力活动gydF4y2Ba | 22.93gydF4y2Ba |
前10个特征和6个特征对骨质疏松症分类的影响。使用局部可解释的模型不可知解释和深度学习模型对骨质疏松症分类的可视化特征贡献值。每个点对应一个单独的应答者,使用不同的颜色表示特征量和类别。数值和分类特征值的大小都归一化在0到1的范围内进行比较。x轴以百分比表示影响值,右侧圆点倾向于增加被纳入骨质疏松组的概率。NHANES和KNHANES前10个特征在股骨颈和股骨总BMD整合后的影响图显示在最上面两张图中。以下6张图是BMI、臂围、维生素D、碱性磷酸酶、家族PIR、甲状旁腺激素的影响值在y轴上以原始值表示。khanes:韩国全国健康和营养调查;NHANES:美国全国健康和营养调查;PIR:贫困收入比。gydF4y2Ba
骨质疏松症的个体化风险评估与可解释的人工智能模型的特征集成贡献。个体化的骨质疏松风险预测和前10个特征的贡献显示在图表中。图例中的特征按照其绝对贡献值的顺序从左到右书写。选取了三位具有代表性的受访者,用彩色柱状图展示了前10个特征的属性及其对诊断概率的积极或消极影响。具有正影响值的特征的一定值往往会增加模型预测骨质疏松的概率。相反,具有负面影响的特征的影响值往往会降低模型预测骨质疏松症的概率。对于第一个样本,该模型预测骨质疏松症的概率为62.31%,对于第二个样本,它预测的概率为68.48%。第三个样本预测正常,概率为82.59%。“教育水平”是根据受访者完成的最高学校级别进行分类的,其中第一类代表小学,第二类代表初中或高中,第三类代表大学或以上。“饮食健康程度”分为“极好”、“非常好”、“好”、“一般”和“差”五个等级。 PIR: poverty income ratio.
在这项研究中,使用NHANES和KNHANES数据集中具有全国代表性的样本,将XAI技术应用于骨质疏松风险筛查的DL模型。我们的DL模型优于现有的ML模型、回归分析和临床工具。随后,我们将LIME应用于DL模型进行特征分析。LIME的特征分析结果再次证实了先前已知的与骨质疏松风险相关的特征,如性别、年龄和与体重相关的因素(如BMI、超重和肥胖诊断)。然而,在临床实践中容易被忽视的意想不到的特征也被发现。此外,我们的模型提供了个体化的骨质疏松症风险评估,并解释了特征贡献。gydF4y2Ba
据我们所知,这是第一个在医疗大数据上使用DL模型对骨质疏松症和LIME进行DL分类并选择影响最大的特征的研究。先前的研究已经提出了DL或ML模型的应用,以分类骨质疏松症,估计BMD,并预测骨质疏松骨折。然而,以往利用深度学习的研究主要集中在分析图像数据,如计算机断层扫描[gydF4y2Ba
除了这些先前的研究,我们开发了一个利用横断面数据筛选骨质疏松症的DL分类器,并使用XAI技术的表格LIME将特征按重要性排序,将受访者分为骨质疏松症组。我们的模型的强大性能,通过AUC值进行评估,表明DL分类器也适用于横断面数据分析和骨质疏松症诊断。此外,通过LIME选择的特征与现有临床危险因素之间的一致性表明,DL模型利用临床显著特征对骨质疏松患者进行分类。尽管人们普遍担心DL模型是黑盒模型,其复杂性使得解释决策过程具有挑战性,但我们的研究表明,如果采用适当的解释技术,即使是非图像数据也可以实现可解释性。gydF4y2Ba
现有研究支持LIME确定的主要贡献特征及其与骨质疏松症的关系。性别和年龄是众所周知的骨质疏松症的危险因素,这与一些研究表明女性性别和低体重是骨质疏松症的主要危险因素相吻合[gydF4y2Ba
一般来说,肥胖被认为是预防骨质疏松症的一个保护性特征,因为它能给骨骼提供机械刺激[gydF4y2Ba
社会心理行为往往被忽视为骨质疏松症的危险因素。然而,我们的DL模型表明抑郁相关变量是显著的危险因素。这可能与身体活动减少有关,而身体活动对保持骨骼强度至关重要,以及抗抑郁药物对骨代谢的负面影响,包括选择性血清素再摄取抑制剂[gydF4y2Ba
这项研究有几个局限性需要解决。首先,本研究中使用的NHANES和KNHANES数据集来自横断面调查,这些调查收集了某一特定时间点的人口数据。因此,本研究仅限于在特定时间点预测骨质疏松症的风险,我们无法预测未来的发生。在横断面数据集上训练的DL模型仅限于估计当前的骨质疏松状况,除非使用带有未来骨质疏松状况标签的数据集,如纵向队列数据。因此,我们计划在后续工作中研究使用纵向队列数据训练DL模型来预测未来骨质疏松症的风险。其次,由于计算NHANES III t评分的参考骨密度不包含腰椎骨密度数据,因此没有对腰椎骨密度进行分析。此外,这两个数据集都缺乏关于骨骼本身的信息,例如骨转换标记物,仅提供了与bmd相关的信息。考虑到骨质疏松症的临床意义,进一步使用骨骼本身的数据,包括骨转换标记物,有望有助于提高模型性能和可靠性。第三,在NHANES和KNHANES数据集中都存在高度的阶级不平衡,这是因为少数受访者被诊断患有骨质疏松症。这种不平衡可能导致DL模型偏向于拥有最多受访者的正常组。 We attempted applying techniques such as class weighting and the synthetic minority oversampling technique [
总之,我们利用NHANES和KNHANES数据开发了一个DL模型来分类骨质疏松症,该模型优于传统的临床评估工具和ML模型。此外,我们还讨论了基于XAI技术选择的重要特性。这意味着DL可以完全应用于医疗大数据,用于某些疾病的风险分析。此外,我们的模型能够进行个体化的骨质疏松风险评估,并解释每个特征对模型结果的贡献。尽管存在上述局限性,但深度学习分类器的性能和特征分析结果值得注意,并证明了将深度学习和XAI技术应用于医学研究(包括横断面研究)的潜力。利用队列数据对我们的DL模型进行外部验证,并使用队列数据进行训练,以预测未来骨质疏松症的风险被认为是未来的工作。gydF4y2Ba
使用机器学习模型和Boruta对NHANES的前20个特征进行排名。gydF4y2Ba
使用机器学习模型和Boruta对来自KNHANES的前20个功能进行排名。gydF4y2Ba
使用机器学习模型和LASSO对NHANES的前20个特征进行排名。gydF4y2Ba
使用机器学习模型和LASSO对KNHANES的前20个功能进行排名。gydF4y2Ba
描述性统计:数据分布(受访者人数)在50-60岁年龄组各骨质疏松症类别。gydF4y2Ba
50-60岁年龄段NHANES和KNHANES受访者深度学习模型的受试者工作特征(ROC)曲线。gydF4y2Ba
使用深度学习模型对NHANES受访者50-60岁年龄组的前20个特征进行排名。gydF4y2Ba
使用深度学习模型对50-60岁年龄段的KNHANES受访者的前20个特征进行排名。gydF4y2Ba
曲线下面积gydF4y2Ba
骨密度gydF4y2Ba
深度学习gydF4y2Ba
双能x线吸收仪gydF4y2Ba
骨折风险评估工具gydF4y2Ba
韩国疾病控制和预防中心gydF4y2Ba
韩国国民健康和营养调查gydF4y2Ba
再邻居gydF4y2Ba
最小绝对收缩和选择算子gydF4y2Ba
轻型梯度提升机gydF4y2Ba
局部可解释的模型未知解释gydF4y2Ba
机器学习gydF4y2Ba
多层感知器gydF4y2Ba
全国健康和营养调查gydF4y2Ba
骨质疏松症风险评估仪gydF4y2Ba
骨质疏松症风险指数gydF4y2Ba
骨质疏松症自我评估工具gydF4y2Ba
患者健康问卷-9gydF4y2Ba
贫困收入比gydF4y2Ba
简单计算骨质疏松症风险评估gydF4y2Ba
Shapley加法解释gydF4y2Ba
可解释的人工智能gydF4y2Ba
极端梯度增强gydF4y2Ba
这项工作得到了韩国政府(MSIT)资助的韩国国家研究基金会(2020R1A2C4001842)和韩国科学技术研究院(2E31570)的内部资助。这项工作也得到了韩国政府(MSIT)资助的信息与通信技术规划与评估研究所(RS-2022-00155966,人工智能融合创新人力资源开发;梨花女子大学)。这篇文章包括香港在梨花女子大学博士论文的部分材料和成果。gydF4y2Ba
JK和JC都是资深作者,贡献相当。BS、HY、JK和JC对概念、设计和数据分析做出了贡献。所有作者都对数据的解释做出了贡献,并起草并严格修改了手稿。所有作者都最终同意并同意对这项工作的所有方面负责。gydF4y2Ba
没有宣布。gydF4y2Ba