发表在24卷,第8号(2022): 8月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/34126,首次出版
基于问卷的眩晕诊断预测集成学习模型:模型开发与验证研究

基于问卷的眩晕诊断预测集成学习模型:模型开发与验证研究

基于问卷的眩晕诊断预测集成学习模型:模型开发与验证研究

原始论文

1中国上海复旦大学附属眼科医院耳鼻咽喉科

2中国上海复旦大学附属眼耳鼻喉医院护理部

3.复旦大学信息管理与信息系统系,中国上海

4复旦大学医学神经生物学国家重点实验室,脑科学教育部前沿研究中心,上海

5复旦大学听力医学国家卫生健康委员会重点实验室,上海

6复旦大学脑科学研究所和脑科学协同创新中心,中国上海

7安徽医科大学第二附属医院耳鼻咽喉头颈外科,中国合肥

8厦门大学医学院第一附属医院耳鼻喉头颈外科,中国厦门

9沈阳市中国医科大学附属盛京医院耳鼻咽喉头颈外科

10上海浦东医院耳鼻咽喉科

11深圳市第二人民医院耳鼻咽喉科,中国深圳

12重庆医科大学第一附属医院耳鼻咽喉科,中国重庆

13复旦大学生物医学研究所,中国上海

这些作者的贡献相同

通讯作者:

李华伟,医学博士,博士

耳鼻咽喉科

眼科及耳鼻喉科医院

复旦大学

9号楼611室

徐汇区汾阳路83号

上海,200031年

中国

电话:86 021 64377134转2669

电子邮件:hwli@shmu.edu.cn


背景:在过去的20年里,调查问卷被用来预测眩晕的诊断和辅助临床决策。基于问卷的机器学习模型有望提高前庭疾病的诊断效率。

摘要目的:本研究旨在开发和验证一个基于问卷的机器学习模型,该模型可以预测眩晕的诊断。

方法:在这项多中心前瞻性研究中,2019年8月至2021年3月期间,出现眩晕的患者首次访问7个三级转诊中心的耳鼻喉科和眩晕诊所时进入连续队列,随访期为2个月。所有参与者在资格筛选后都完成了诊断问卷。在模型的开发和验证中,只接受了治疗专家一次最终诊断的患者。采用2021年2月1日前入组的患者数据进行建模和交叉验证,之后入组的患者进行外部验证。

结果:共入组患者1693例,有效率为96.2%(1693/1760)。中位年龄51岁(IQR 38 ~ 61),女性991例(58.5%);1041例(61.5%)患者在研究期间获得最终诊断。其中928例(54.8%)患者被纳入模型开发和验证,113例(6.7%)患者被纳入后作为外部验证的测试集。他们被分为5个诊断类别。我们比较了9种候选机器学习方法,其中光梯度增强机的重新校准模型表现最佳,交叉验证曲线下面积为0.937 (95% CI 0.917-0.962),外部验证曲线下面积为0.954 (95% CI 0.944-0.967)。

结论:基于问卷的光梯度增强机能够预测常见的前庭疾病,并协助耳鼻喉科和眩晕诊所的决策。更大样本量的进一步研究和神经学家的参与将有助于评估这种机器学习方法的泛化和鲁棒性。

[J] .中国医学信息学报,2010;24(8):344 - 344

doi: 10.2196/34126

关键字



头晕和眩晕是前庭疾病患者的主要主诉,估计一生中头晕(包括眩晕)的患病率为15%-35% [1]。头晕和眩晕使患者丧失行为能力,严重影响患者的生活质量。这些情况通常导致活动受限,并与精神疾病如焦虑、恐惧和躯体形式障碍密切相关[1-3.]。患有头晕和眩晕的患者,尤其是老年人,也有较高的跌倒和跌倒相关伤害的风险[4]。然而,前庭疾病的诊断是具有挑战性和耗时的。它涉及多种前庭和神经系统原因以及复杂的病理过程,导致眩晕患者的误诊和潜在的广泛过度使用影像学[5-8]。由此造成的诊断延误会使疾病的功能和心理后果恶化。

人工智能在头晕和眩晕诊断中的应用可以追溯到30多年前。专家系统如眩晕9],Carrusel10),而一个11]由具有固定诊断规则的知识库组成。他们通过无法从患者数据中学习的非适应性算法进行推断。不同的机器学习算法,包括遗传算法、神经网络、贝叶斯方法、k近邻和支持向量机,也被用于分析患者数据一个12-16]。6种常见耳神经系统诊断的预测准确率为90% ~ 97%,9种诊断类别的预测准确率为76.8% ~ 82.4%。EMBalance是一个综合平台,于2015年推出,通过使用基于决策树的集成学习方法(Adaptive Boosting)来辅助平衡障碍的诊断、治疗和演变[1718]。在前庭疾病的计算机辅助诊断中,已经从纯粹的知识驱动转向数据驱动的方法。

除了眩晕,上述模型均基于患者的病史和检查,并结合必要的检查,而在实践中,患者的病史本身为可能的诊断和进一步的评估提供了重要的线索[19]。在过去的20年里,出现了大量关于头晕和眩晕的调查问卷,以协助前庭疾病的临床诊断[20.-27]。这些研究大多使用简单的统计模型,通常是逻辑回归,用与建模相同的数据进行验证[26-28]。很少有研究尝试应用机器学习算法。然而,由于数据集较小或建模数据选择不当,这些模型的准确性不如简单统计模型[2930.]。

本研究是耳源性眩晕人工智能研究(OVerAIR)研究的一部分,该研究的总体目的是利用人工智能技术建立一个集耳源性眩晕患者诊断、治疗、康复和随访为一体的综合平台。本研究的具体目标包括开发和验证眩晕诊断平台,通过使用机器学习技术协助临床决策,并进一步探索所提出平台的有效性和临床实用性。


研究设计

根据Barany学会对前庭症状的分类,以眩晕或头晕为新主诉的患者[31于2019年8月至2021年3月在复旦大学眼科医院、安徽医科大学第二医院、厦门大学第一附属医院、中国医科大学盛京医院、上海浦东医院、深圳第二人民医院、重庆医科大学第一附属医院的耳鼻喉科和眩晕科门诊连续入组。在与耳鼻喉科专家的第一次面谈中,患者在知情同意后,通过平板电脑或智能手机完成了电子版的调查问卷。那些不能阅读和自己完成问卷的人回答了研究人员宣读的问题。我们没有干涉病人的正常医疗程序。当专家认为有必要时,病人会被安排下一次就诊;因此,他们没有坚持固定的随访时间。

伦理批准

本研究已获得所有参与中心的机构审查委员会批准(批准号2019091)。本研究遵循了个体预后或诊断报告指南的多变量预测模型透明报告[32]。

结果

每位患者都进行了常规病史收集,然后进行了完整的耳神经检查,必要时进行了进一步的检查(即纯音听力学、前庭测试、计算机断层扫描和磁共振成像)。临床经验5年以上的耳鼻喉专科医师对问卷的盲法诊断作为参考诊断。参考诊断标准包括美国耳鼻喉头颈外科学会关于良性阵发性位置性眩晕(BPPV)的实践指南[33]和前庭疾病(包括前庭偏头痛)的诊断标准[34]、梅尼埃病[35],持续性体位知觉眩晕[36],前庭阵发性发作[37]和双侧前庭病变[38])。有典型临床特征但不符合明确诊断标准的患者给予可能诊断。2个月内没有明确诊断或在最终诊断前停止就诊的患者被标记为未确定。

调查问卷的发展

诊断问卷是通过一个迭代过程开发的,主要包括以下3个阶段。

  1. 焦点小组和小组会议:首先,召开了一次焦点小组讨论和3次后续小组会议,以确定耳鼻喉科诊所常见的外周前庭疾病。在此过程中,共识别出16种障碍,并列出了每种障碍的特征表现。对每一种疾病的诊断或实践指南的文献进行了检索,并对相关的文献进行了仔细的审查。之后,起草了包含43个项目的初步调查问卷。
  2. 患者访谈:为了便于理解和方便填写问卷,我们对我院耳鼻喉科就诊的15例眩晕患者进行了访谈。两名患者报告说手术时间太长,耗时太长。另有3人抱怨被问了太多问题,比如心脏病和服用的药物,而这些问题似乎与他们的眩晕状况无关。在此阶段,问卷的措辞进行了彻底的简化,并删除了6个问题。
  3. 专家组会议:在一次全国会议上,邀请了来自耳鼻喉科、神经内科、前庭检查和康复的12位专家对问卷的适用性和清晰度进行了评价,并提出了进一步修订的建议。在这个过程中,项目被重新排序,有些项目被合并或省略。

统计分析

我们比较了9种候选机器学习方法,以筛选性能最好的一种。考虑了五种非集成学习算法,即决策树[39],脊状回归[40]、逻辑回归(l2 -正则化)[41]、支持向量分类[42],随机梯度下降支持向量分类[43]。集成学习是指一种通用的元方法,通过组合来自多个模型的预测,策略性地提高预测性能。实现了四种集成学习方法,即随机森林[44]、自适应增强[45],梯度增强决策树[46]、光梯度增强机(LGBM) [47]。我们采用自举交叉验证,将随机采样数据以7:3的比例放入训练集和验证集,重复100次。48]。在训练集上对模型进行训练,并根据验证集上的预测性能对模型进行评估。根据100个验证集的平均预测性能选择并调整最佳模型。采用曲线下面积(AUC)来评价模型的性能。在多类别预测中,通过1 -vs-rest方案(微平均)计算敏感性、特异性、似然比和AUC。然后,使用校准曲线进行重新校准[49]和Brier分数[50]来调整每种诊断类别的预测概率与观察比例之间的差异。外部验证使用队列中最新患者(最近2个月入组)的数据进行,这些数据构成测试集。所有指标的95% ci通过bootstrapping计算。

将布尔变量的缺失值在主要结果中以False进行imputation,并通过比较不同的imputation策略(即不imputation或带True进行imputation)进行敏感性分析。所有机器学习算法都是用Python实现的,代码可以在在线资源中获得。根据最先进的机器学习包sklearn,超参数被设置为默认值。

稳健性和样本量分析

作为一种促进临床诊断的数据驱动预测方法,有必要验证样本数量是否足够用于模型的开发和验证。跟随莱利[51]和Riley等人[52],我们用全局收缩因子和最小样本数来量化样本量的充分性。足够样本量的标准是确保收缩系数>0.9。此外,给定可接受的收缩因子(例如,0.9),可以根据解释方差的Cox-Snell比率估计开发预测模型所需的样本大小。

此外,现代技术灵活性的提高意味着,与逻辑回归等经典方法相比,可靠估计可能需要更大的样本量。因此,我们遵循van der Ploeg等人的方法[53]来评估我们的最佳模型LGBM对样本量的敏感性。训练集是不同大小的,并且是从开发集中抽取的。每个训练集大小重复30次以消除随机性,而平均AUC衡量测试集上的性能。

重要的变量

为了衡量变量的重要性,我们首先根据交叉验证中的信息增益评估多变量特征的重要性,并选择前20个重要变量。然后,为了确定各个诊断类别的特征重要性,使用每个选定的变量独立预测5个诊断类别,并以AUC衡量单变量重要性。


诊断问卷概述

最后的问卷由23个包含分支逻辑的项目组成。问卷的完整版本可在多媒体附录1。项目的内容显示在文本框1

诊断问卷中的项目。
  • 一个关于症状特征的问题是:头是否晕眩?如果没有,则需要明确头晕的类型(头昏眼花,摇摇晃晃或其他)。
  • 三个问题,频率,持续时间,以及从第一次眩晕发作开始的持续时间
  • 有一个问题是关于听力损失的情况,那就是,哪一边以及它是如何变化的
  • 耳鸣、耳胀、耳痛的情况三个问题,即发作前后应明确是哪一侧、有无变化(发作前/发作中加重,发作后缓解)
  • 一个关于头痛的问题,特别是头痛发作的时间和相关的家族史
  • 一个关于伴发恐光症或恐音症的问题
  • 有一个问题是关于眩晕发作期间、之后或没有眩晕发作时的不稳定
  • 一个问题是站立或行走时症状是否会加重
  • 两个问题关于跌倒的情况,意识状态,以及是否有失禁的攻击
  • 关于眩晕触发因素的五个问题,即躺下、翻身、迅速起床、屏气、大声刺激、在一些特殊的场景、特殊的食物或气味、疲劳、失眠、生气
  • 一个问题是是否颈性眩晕,即上肢麻木疼痛或颈部疼痛
  • 一个关于前驱的问题,即发病前的感冒、发烧和腹泻
  • 一个关于耳科疾病病史的问题,即耳漏、中耳炎、耳科手术
  • 一个关于头颈部创伤和手术史的问题
文本框1。诊断问卷中的项目。

参与者的人口统计学特征

从7个参与中心的耳鼻喉科和眩晕门诊纳入了1693名患者的前瞻性队列(表1)。应答率为96.2%(1693/1760,67人拒绝参与)。1693例入组患者中,1041例(61.5%)接受了治疗专家的一次最终诊断,14例(0.8%)有一次以上诊断,145例(8.6%)有可能诊断,其余493例(29.1%)在2个月内未接受最终诊断。最后的诊断结果分布不均。最常见的诊断为BPPV、前庭偏头痛、突发性感音神经性听力损失伴前庭功能障碍(SSNHL-V)和梅尼埃病。由于模型的开发和验证只纳入了1种最终诊断的患者,因此5种诊断类别中有1041例患者(中位年龄50 [IQR 38-61]岁,女性608例[58.4%])被纳入模型的开发和验证。不超过20例的不太常见的诊断目前被标记为“其他”,因为没有足够的病例使它们形成单独的类别。

在1041例患者中,928例被纳入训练集(用于建模和交叉验证),113例被纳入测试集(表2)。图1显示研究流程图。训练集和测试集的详细描述见表2

表1。参与者的人口学特征(N=1693)。
特征 价值
年龄(岁),中位数(IQR) 51 (38 - 61)
性别,n (%)

991 (58.5)

男性 702 (41.6)
诊断,n (%)

良性阵发性位置性眩晕 398 (23.5)

前庭偏头痛 203 (12)

梅尼埃病(又名内耳眩晕 194 (11.5)

突发性感音神经性听力丧失伴前庭功能障碍 173 (10.2)

其他人一个 73 (4.3)

多个诊断 14 (0.8)

可能的诊断 145 (8.6)

待定 493 (29.1)

一个这一类包括前庭神经炎、持续性体位知觉头晕、心因性头晕、迟发性内淋巴水肿、前庭阵发性发作、颈源性眩晕、听神经瘤、前庭老性病变、轻丘、拉姆齐- hunt综合征、迷路瘘和上半规管破裂综合征。

表2。训练数据集和测试数据集的特征。
特征 训练集(n=928) 测试集(n=113)
年龄(岁),中位数(IQR) 50 (37-60) 53 (41 - 63)
性别,n (%)

536 (57.8) 72 (63.7)

男性 392 (42.2) 41 (36.3)
诊断,n (%)

良性阵发性位置性眩晕 348 (37.5) 50 (44.2)

前庭偏头痛 182 (19.6) 21日(18.6)

梅尼埃病(又名内耳眩晕 168 (18.1) 26 (23)

突发性感音神经性听力丧失伴前庭功能障碍 164 (17.6) 9 (8)

其他人一个 66 (7.1) 7 (6.2)

一个这一类包括前庭神经炎、持续性体位知觉头晕、心因性头晕、迟发性内淋巴水肿、前庭阵发性发作、颈源性眩晕、听神经瘤、前庭老性病变、轻丘、拉姆齐- hunt综合征、迷路瘘和上半规管破裂综合征。

图1所示。2019年8月至2021年3月期间,对新出现眩晕或头晕症状的患者进行了筛查。在随访2个月内记录诊断。
查看此图

模型的开发和验证

交叉验证中,LGBM模型的AUC最高,为0.937 (95% CI 0.917 ~ 0.962), Brier评分最低,为0.057 (95% CI 0.049 ~ 0.068)。表3)。因此,它被重新校准并用作最终的预测模型。

在敏感性分析中,当用mode(最频繁的标签)输入缺失值时,9种方法的AUC和Brier评分均下降(表4)。注意LGBM不依赖于imputation方法;因此,它可以直接利用的信息失踪以达到更好的预测性能。不加输入的LGBM与加0输入的LGBM性能相当,验证了方法的鲁棒性。在交叉验证中,除了LASSO逻辑回归之外,集成学习方法的表现优于非集成学习方法,这表明在特定的集成方法中引入集成学习用于眩晕诊断是有效的。此外,LGBM在AUC和Brier评分方面优于其他方法。

经交叉验证的重新校准的LGBM模型的受试者工作特征曲线如图所示图2表5给出了交叉验证和外部验证中不同诊断类别的AUC、敏感性、特异性、似然比和准确性。该模型对SSNHL-V的预测准确度较高(AUC>0.98,阳性似然比[+LR]>20,阴性似然比[-LR]<0.05),对BPPV和Meniere病的预测准确度较高(AUC>0.95,敏感性>0.8,特异性>0.9,准确度>0.9,+LR>10, -LR <0.2),对前厅偏头痛的判别能力较好(AUC 0.9, 95% CI 0.78 ~ 0.92)。由于样本量有限且异质性较大,其他诊断的预测不稳定,交叉验证的AUC范围为0.771 ~ 0.929,外部验证的AUC范围为0.879 ~ 0.957。

交叉验证的校正曲线(图3)正确估计了梅尼埃病和前庭偏头痛的概率,略低估了SSNHL-V和BPPV的概率。其他诊断的预测相对保守,因为它不太可能给出接近0或1的概率。交叉验证的Brier评分为0.058 (95% CI 0.049 ~ 0.068),表明预测概率与实际诊断比例吻合较好。我们还将我们的方法应用于外部数据集。结果表明,选择的最佳模型LGBM在预测眩晕诊断方面具有较好的泛化能力,AUC为0.958 (95% CI 0.951-0.969)。同时,LGBM也优于第二好的logistic回归方法,其外部验证的AUC为0.939 (95% CI 0.925-0.956)。多变量特征在信息增益方面的重要性见表6

各诊断类别的全局收缩因子分析和敏感性分析结果表明,本研究的样本量足以进行模型开发。看到多媒体附录2有关样本大小分析的更多细节。然后,找出特征的重要性在个别诊断类别,每个前20个贡献变量表6,用于独立预测5种诊断类别,单变量重要性以AUC (图4)。

表3。候选算法的预测性能。
方法 曲线下面积(95% CI) Brier评分(95% CI)
Non-ensemble学习

决策树 0.765 (0.726 - -0.798) 0.125 (0.104 - -0.146)

岭回归 0.803 (0.780 - -0.831) 0.087 (0.071 - -0.104)

逻辑回归 0.928 (0.907 - -0.956) 0.060 (0.051 - -0.069)

支持向量分类 0.501 (0.499 - -0.505) 0.239 (0.220 - -0.258)

随机梯度下降 0.733 (0.611 - -0.824) 0.141 (0.083 - -0.254)
整体学习

随机森林 0.924 (0.900 - -0.949) 0.063 (0.056 - -0.070)

自适应增强 0.851 (0.793 - -0.901) 0.148 (0.144 - -0.151)

梯度增强决策树 0.925 (0.902 - -0.951) 0.064 (0.053 - -0.076)

光梯度增强机 0.935 (0.913 - -0.960) 0.057 (0.047 - -0.067)

重新校准光梯度增强机 0.9370.917 - -0.962) 0.058 (0.049 - -0.068)
表4。用模式输入缺失数据时不同算法的性能。
方法 曲线下面积(95% CI) Brier评分(95% CI)
Non-ensemble学习

决策树 0.746 (0.690 - -0.791) 0.137 (0.114 - -0.169)

岭回归 0.788 (0.733 - -0.817) 0.096 (0.076 - -0.121)

逻辑回归 0.921 (0.900 - -0.943) 0.067 (0.057 - -0.082)

支持向量分类 0.500 (0.500 - -0.500) 0.240 (0.222 - -0.258)

随机梯度下降 0.727 (0.578 - -0.819) 0.148 (0.090 - -0.251)
整体学习

随机森林 0.919 (0.896 - -0.939) 0.068 (0.061 - -0.078)

自适应增强 0.833 (0.741 - -0.887) 0.148 (0.143 - -0.156)

梯度增强决策树 0.915 (0.888 - -0.935) 0.073 (0.059 - -0.093)

光梯度增强机 0.929 (0.906 - -0.950) 0.062 (0.055 - -0.072)

光梯度增压机(无插补) 0.935 (0.916 - -0.956) 0.057 (0.049 - -0.065)
图2。每个诊断类别的受试者工作特征曲线(实线),95% CI(2条虚线之间)。通过1 -vs-rest方案评估各诊断类别的表现。BPPV:良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。
查看此图
表5所示。不同诊断类别的预测能力。
AUC一个(95%置信区间) 灵敏度(95% CI) 特异性(95% CI) + LRb(95%置信区间) lrc(95%置信区间) 准确度(95% CI)
良性阵发性位置性眩晕

简历d 0.97 (0.96 - -0.99) 0.94 (0.87 - -0.99) 0.92 (0.85 - -0.97) 13.23 (6.55 - -29.3) 0.07 (0.01 - -0.14) 0.92 (0.89 - -0.95)

电动汽车e 0.98 (0.97 - -0.99) 0.97 (0.92 - 1) 0.90 (0.83 - -0.94) 10.23 (5.88 - -17.92) 0.04 (0 - 0.09) 0.93 (0.90 - -0.96)
前庭偏头痛

简历 0.91 (0.87 - -0.94) 0.86 (0.76 - -0.95) 0.85 (0.74 - -0.95) 6.58 (3.56 - -13.93) 0.17 (0.07 - -0.27) 0.85 (0.78 - -0.92)

电动汽车 0.9 (0.87 - -0.92) 0.66 (0.52 - -0.76) 0.90 (0.85 - -0.96) 7.38 (4.71 - -12.05) 0.38 (0.26 - -0.51) 0.86 (0.82 - -0.88)
突发性感音神经性听力丧失伴眩晕

简历 0.99 (0.97 - 1) 0.95 (0.88 - 1) 0.95 (0.90 - -0.99) 25.07 (9.39 - -67.93) 0.05 (0 - 0.12) 0.95 (0.91 - -0.98)

电动汽车 1.00 (1.00 - -1.00) 1.00 (1.00 - -1.00) 0.98 (0.97 - -1.00) f(34.67负) 0.00 (0.00 - -0.00) 0.98 (0.97 - 1)
梅尼埃病(又名内耳眩晕

简历 0.96 (0.93 - -0.98) 0.92 (0.81 - 1) 0.90 (0.82 - -0.96) 10.79 (5.28 -22) 0.09 (0 - 0.21) 0.90 (0.84 - -0.95)

电动汽车 0.97 (0.97 - -0.98) 0.82 (0.69 - -0.88) 0.98 (0.95 - -0.99) 正(18.4负) 0.19 (0.12 - -0.31) 0.94 (0.91 - -0.96)
其他人

简历 0.86 (0.77 - -0.93) 0.83 (0.66 - 1) 0.78 (0.55 - -0.93) 4.44 (2.10 - -9.77) 0.21 (0 - 0.44) 0.78 (0.57 - -0.91)

电动汽车 0.92 (0.88 - -0.96) 0.74 (0.50 - -0.86) 0.90 (0.85 - -0.94) 7.59 (5.05 - -12.02) 0.38 (0.26 - -0.51) 0.89 (0.85 - -0.93)

一个AUC:曲线下面积。

b+LR:正似然比。

c-LR:负似然比。

d简历:交叉验证。

eEV:外部验证。

fInf:阳性似然比为无穷大,因为特异性为1。

图3。基于重新校准的光梯度增强机模型的验证数据上具有逐点95%置信限(灰带)的校准曲线(蓝色实线)。BPPV:良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。
查看此图
表6所示。多变量特征在光梯度增强机模型中的重要性。
变量 功能的重要性
突发性听力损失 1039.8
发作持续时间 912.3
听力损失 694.8
第一次发病时间 468.1
触发:起床、躺下或翻身 358.0
年龄 255.6
头痛史 250.6
攻击频率 221.4
波动性听力损失 186.3
恐光症或恐音症 185.7
第一次失聪后的时间 183.7
反复出现的症状 155.9
耳鸣 135.5
耳朵丰满 135.4
发作时头痛 117.7
因站立或行走而加重的 80.4
诱因:疲劳、睡眠不足 69.7
眩晕 65.0
上肢疼痛或麻木 62.4
攻击时的不稳定 59.5
头痛家族史 54.2
男性 54.1
秋天 47.3
失去意识,失禁 44.6
耳鸣:发作前加重,发作后减轻 36.7
触发:视觉刺激 31.0
触发:声音和压力 23.0
不稳定:首次发病后 22.4
前驱:感冒、发烧、呕吐或腹泻 22.0
头晕家族史 17.4
诱因:某些食物 15.9
耳痛 11.6
摔倒时有意识 9.8
中耳炎或耳部手术史 7.2
耳鸣:眩晕时加重 4.5
波动:逐渐恶化 0.0
攻击之间的不稳定 0.0
最近有头颈部外伤或手术史 0.0
图4。在单变量预测中,曲线下面积作为变量重要性的估计。AUC:曲线下面积;BPPV:良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。
查看此图

主要研究结果

在这项多中心前瞻性队列研究中,我们开发了一份问卷来诊断眩晕,并利用通过问卷收集的患者历史数据建立了LGBM模型。据我们所知,这是第一个基于问卷的机器学习模型来预测眩晕的多种诊断。由于本研究的所有患者均来自耳鼻喉科和眩晕科诊所,因此诊断分布与之前在神经病学和平衡科进行的研究有所不同[19-2126]。在我们的研究中,SSNHL-V的患病率高得多(173/1693,10.2%),前庭神经炎的患病率低得多(22/1693,1.3%)。

我们的模型在预测常见前庭诊断方面优于先前报道的基于问卷的统计模型[20.2126]。一个可能的解释是,机器学习方法更擅长处理潜在的非线性关系和过拟合。此外,考虑到患者报告的历史信息的主观性,数据驱动模型比知识驱动模型更适合基于问卷的预测[9115455]。与以往使用综合病史数据、体格检查和实验室测试的机器学习诊断系统相比,我们基于问卷的诊断模型有其优点[13-17]。首先,病史为眩晕的病因提供了重要的线索,在此基础上,医生将试图确认或排除一个假定的诊断。因此,基于问卷的诊断工具可以根据患者病史提供早期决策支持,并有助于减少不必要的检查。此外,由于问卷数据直接来自患者,该模型的性能不依赖于专业人员对患者病史的准确解释。此外,考虑到特定测试(如纯音听力学、热量测试、视频头脉冲测试)的可及性有限,不需要特殊设备的问卷适用于不同的临床环境。然而,基于问卷的诊断模型也有内在的局限性。患者报告的病史可能不准确,因为它很容易受到回忆偏差、误解、患者的情绪状态和其他主观因素的影响。同时,对于只有非特异性症状的患者,体格检查和实验室检测是更重要的诊断工具。患者病史应始终与客观证据相结合,以作出更可靠的诊断。因此,未来有必要将体检和实验室检测结果引入系统,进行全面的逐步诊断预测。

限制

本研究有以下局限性。诊断分布的不均匀使得该模型难以对罕见的诊断做出准确的预测。为了减少潜在的噪声,我们在建模中只纳入了最终诊断为1的患者。排除诊断不明确的患者是一个潜在的偏倚来源。这些病人没有得到明确的诊断有几个原因。在某些情况下,BPPV患者在等待预定的体位检查和治疗时(1-2周后)可能会自发缓解,这也解释了我们队列中BPPV的患病率相对较低的原因。56]。排除这些患者可以降低噪声,提高模型性能。此外,有些患者仅出现短暂症状,没有明显的结构、功能或心理变化;因此,没有给出具体的诊断。此外,虽然大多数患者在随访期间完成了所有必要的检查,但也有可能在2个月内未确定一些罕见的原因,这可能增加了数据的不平衡。然而,随着队列的扩大,更多罕见诊断的患者将被纳入,这将使模型预测罕见诊断的准确性更高。我们还可以在建模过程中管理不平衡数据的影响。同时,外部验证的AUC高于交叉验证,这可能是由于测试集的样本量相对较小。需要更多明确诊断的参与者提供进一步的验证。最后,由于本研究是在三级中心的耳鼻喉科和眩晕门诊进行的,该模型在不同临床环境下的预测能力有待验证。

结论

本研究提出了第一个基于问卷的机器学习模型,用于预测常见的前庭疾病。该模型采用集成学习方法LGBM对BPPV、前庭偏头痛、梅尼埃病和SSNHL-V具有较强的预测能力。作为OVerAIR平台的一部分,它可用于辅助耳鼻喉科诊所的临床决策,并有助于BPPV的远程诊断。我们还在开发一款智能手机应用程序,该应用程序将调查问卷与转诊、随访、治疗和康复相结合,以改善眩晕患者的健康状况。OVerAIR研究的下一阶段将包括神经学家的参与,这有望提高模型对中枢性眩晕的预测能力,并有助于评估其泛化和稳健性。

致谢

本研究得到上海市卫生健康委员会重大疾病(耳源性眩晕)跨学科诊疗能力建设项目、上海市临床重点专科项目(shslczdzk00801)、上海市卫生健康委员会科研基金一般项目(批准号202040286)和国家自然科学基金项目(资助号91846302和72033003)的支持。资金来源没有参与本研究的设计和实施;数据的收集、管理、分析和解释;报告的撰写;或者决定提交稿件发表。

作者的贡献

FY和HD对研究中的所有数据拥有完全的访问权限,并对数据的完整性和数据分析的准确性负责。FY, PW, HD, CZ和HL负责本研究的概念和设计。所有作者都对数据的获取、分析或解释做出了贡献,并对手稿的重要知识内容进行了批判性修订。FY, PW和HD起草了手稿。FY和HD进行统计分析。HL和CZ获得了本研究的经费。FY、PW、HD、JW、HY、CZ和HL提供了行政、技术或物质支持。HL和CZ监督研究。

利益冲突

没有宣布。

多媒体附录1

本研究采用眩晕诊断问卷的最终版本。

DOCX文件,21 KB

多媒体附录2

样本量分析。

DOCX文件,119kb

  1. 李建军,李建军,李建军,等。不同器质性眩晕综合征的精神合并症。中国生物医学工程学报(英文版);2009;31(3):563 - 568。[CrossRef] [Medline
  2. 刘建军,刘建军,刘建军,等。前庭性眩晕综合征的临床研究进展。一项为期一年的前瞻性纵向研究的结果。中国生物医学工程学报,2009,31(1):559 - 561。[CrossRef] [Medline
  3. lahman C, Henningsen P, Brandt T, Strupp M, Jahn K, Dieterich M,等。眩晕和头晕患者的精神合并症和社会心理障碍。中华神经外科杂志;2015;36(3):393 - 398。[CrossRef] [Medline
  4. de Moraes SA, Soares WJDS, Ferriolli E, Perracini先生。社区居住老年人头晕患病率及其相关因素:一项基于横断面人群的研究。中华医学杂志2013年1月4日;13:4 [免费全文] [CrossRef] [Medline
  5. 张晓明,张晓明,张晓明,等。眩晕患者在初级保健中的健康服务利用:一项回顾性队列研究。中华神经科杂志,2014;26(8):1492-1498。[CrossRef] [Medline
  6. Ahsan SF, Syamal MN, Yaremchuk K, Peterson E, Seidman M.急诊室眩晕患者影像学评估的成本和效用。喉镜2013;123(9):2250-2253。[CrossRef] [Medline
  7. Bakhit M, Heidarian A, Ehsani S, Delphi M, Latifi SM。眩晕患者的临床评估:诊断试验的必要性和作用。全球健康科学杂志2014年3月24日;6(3):194-199 [J]免费全文] [CrossRef] [Medline
  8. 罗氏G, Ploner CJ, Leithner C.眩晕在急诊室:诊断和误诊。中国生物医学工程学报,2011;33(5):563 - 563。[CrossRef] [Medline
  9. 刘建军,刘建军,刘建军,等。神经神经系统疾病诊断的研究进展。[J] .耳鼻喉学杂志,1990;32(2):96-103。[CrossRef] [Medline
  10. Gavilán C, Gallego J, Gavilán J。“Carrusel”:前庭诊断专家系统。耳鼻咽喉学报,1990;11(3):161-167。[CrossRef] [Medline
  11. Auramo Y, Juhola M, Pyykkö 1 .计算机辅助诊断头晕和眩晕的专家系统。医学通报,1993;18(4):293-305。[CrossRef] [Medline
  12. Laurikkala JPS, Kentala EL, Juhola M, Pyvkkö 4 .应用于耳科诊断的新型机器学习程序。声学学报,2001(52):100-102。[CrossRef] [Medline
  13. 刘建军,刘建军,刘建军,等。基于神经网络的神经神经数据分类及其可视化。中国生物医学工程学报,2008;38(8):858-866。[CrossRef] [Medline
  14. Miettinen K, Juhola M.基于贝叶斯概率模型的耳神经病例分类。医学系统学报,2010,34(2):119-130。[CrossRef] [Medline
  15. j ., j ., M.基于支持向量机和K近邻的1对1和1对所有分类器的神经神经学多类问题。猪健康技术通报2011;169:579-583。[Medline
  16. 刘建军,张建军,张建军,等。神经神经分类的机器学习方法。2013年发表于:第35届IEEE医学与生物工程学会(EMBC)国际会议;2013年7月3日至7日;日本大阪,第1294-1297页。
  17. Exarchos T, Rigas G, Bibas A, Kikidis D, Nikitas C, Wuyts F,等。为开发诊断决策支持系统而挖掘平衡失调数据。中国生物医学工程学报(英文版);2016;37(1):344 - 344。[CrossRef] [Medline
  18. Exarchos T, Bellos C, Bakola I, Kikidis D, Bibas A, Koutsouris D,等。使用决策支持系统管理和建模平衡障碍:EMBALANCE项目。In: GeNeDis 2014: Adv Exp Med Biol。可汗:施普林格;2015:61 - 67。
  19. 赵建刚,Piccirillo JF, Spitznagel, Kallogjeri D, Goebel JA。历史数据对眩晕诊断的预测能力。中华医学杂志,2011;32(2):284-290 [j]免费全文] [CrossRef] [Medline
  20. 王晓明,王晓明,王晓明,等。眩晕性疾病的诊断指标分析。中华医学会神经病学分会2010;10:10 [j]免费全文] [CrossRef] [Medline
  21. 弗里德兰博士,Tarima S, Erbe C, Miles a .前庭诊断预测统计模型的发展。中华医学会耳鼻喉头颈外科杂志2016;42(4):351-356 [j]免费全文] [CrossRef] [Medline
  22. Imai T, Higashi-Shingai K, Takimoto Y, Masumura C, Hattori K, Inohara H.良性阵发性位置性眩晕诊断的新评分系统。耳鼻咽喉学报,2016;36(3):283-288。[CrossRef] [Medline
  23. Lapenna R, Faralli M, Del Zompo MR, Cipriani L, Mobaraki PD, Ricci G.老年人良性阵发性体位性眩晕诊断的可靠性分析。老年临床实验杂志,2016;28(5):881-888。[CrossRef] [Medline
  24. 陈伟,舒林,王强,潘华,吴军,方军,等。中文版头晕障碍量表5项和2项问卷对良性阵发性体位性眩晕筛查效果的验证神经科学学报,2016;37(8):1241-1246。[CrossRef] [Medline
  25. 李丽,齐霞,刘军,王铮。良性阵发性体位性眩晕诊断问卷的编制与评价。神经科学杂志2017年10月;331:148-149。[CrossRef
  26. 张建军,张建军,张建军,等。一项多中心前瞻性盲法研究:利用简短的头晕问卷来区分眩晕的原因并指导适当的转诊。中华医学杂志,2015;36(10):1687-1694 [j]免费全文] [CrossRef] [Medline
  27. 金辉,宋军,钟磊,杨晓东,金杰。基于问卷的良性阵发性体位性眩晕诊断。神经病学2019年12月30日;94(9):e942-e949。[CrossRef
  28. 刘国强,刘国强,刘国强,刘国强。良性阵发性位置性眩晕预测的统计算法评估。中华耳鼻咽喉头颈外科杂志2018;01;14 (10):883-886 [j]免费全文] [CrossRef] [Medline
  29. 李丽娟,李丽娟,李丽娟,等。良性阵发性体位性眩晕的临床诊断。发表于:第17届IEEE机器学习与应用国际会议;12月;奥兰多,佛罗里达州,美国第332-337页。
  30. Masankaran L, Viyanon W, Mahasittiwat V.基于机器学习技术的眩晕障碍量表良性阵发性定位性眩晕类型分类。2018年智能信息学与生物医学科学国际会议;2018;泰国曼谷,第209-214页。
  31. bdorff A, Von Brevern M, Lempert T, Newman-Toker DE.前庭症状的分类:迈向前庭疾病的国际分类。地球物理学报2009;19(1-2):1-13。[CrossRef
  32. Collins GS, Reitsma JB, Altman DG, Moons KGM, TRIPOD Group。透明报告个体预后或诊断的多变量预测模型(TRIPOD): TRIPOD声明。三脚架组。流通2015年1月13日;131(2):211-219 [免费全文] [CrossRef] [Medline
  33. Bhattacharyya N, Gubbels SP, Schwartz SR, Edlow JA, El-Kashlan H, Fife T,等。临床实践指南:良性阵发性位置性眩晕(更新)。耳鼻咽喉头颈外科2017;156(3):S1-S47。[CrossRef] [Medline
  34. 李建军,李建军,李建军,等。前庭偏头痛:诊断标准。地球物理学报2012,11月1日;22(4):167-172。[CrossRef
  35. Lopez-Escamez JA, Carey J, Chung W, Goebel JA, Magnusson M, mandalom M,等。梅氏病的诊断标准。地球物理学报2015年3月1日;25(1):1-7。[CrossRef
  36. Staab JP, Eckhardt-Henn A, Horii A, Jacob R, Strupp M, Brandt T,等。持续体位-知觉头晕(PPPD)的诊断标准:Bárány学会前庭疾病分类委员会共识文件。地球物理学报,2017;27(4):191-208。[CrossRef
  37. Strupp M, Lopez-Escamez JA, Kim J, Straumann D, Jen JC, Carey J,等。前庭阵发性发作:诊断标准。地球物理学报2017年1月27日;26(5-6):409-415。[CrossRef
  38. 刘建军,刘建军,刘建军,等。双侧前庭病变:诊断标准Bárány学会分类委员会共识文件。地球物理学报2017,10月21日;27(4):177-189。[CrossRef
  39. 分类与回归树。电线数据挖掘知识发现2011年1月6日;1(1):14-23。[CrossRef
  40. Rifkin RM, Lippert RA。关于正则化最小二乘的注意事项。CSAIL技术报告。2007年5月1日。URL:http://hdl.handle.net/1721.1/37318[2022-06-25]访问
  41. Hosmer JDW, Lemeshow S, Sturdivant RX。应用逻辑回归。新泽西州霍博肯:John Wiley & Sons;2013.
  42. 徐春春,张春春,林俊杰。支持向量分类的实用指南。数据科学学报。2003。URL:http://www.datascienceassn.org/sites/default/files/Practical%20Guide%20to%20Support%20Vector%20Classification.pdf[2021-02-19]访问
  43. Bottou L.随机梯度下降技巧。见:Montavon G, Orr G, m ller KR,编辑。神经网络:交易技巧。柏林,海德堡:施普林格出版社;2012:3 - 540。
  44. 布雷曼L.随机森林。机器学习;2001;45(1):5-32。[CrossRef
  45. 胡建军,李建军,李建军,等。统计及其接口2009;2(3):349-360。[CrossRef
  46. 弗里德曼JH。随机梯度增强。计算统计与数据分析2002;38(4):367-378。[CrossRef
  47. 柯刚,孟强,Finley T,王涛,陈伟,马伟,等。Lightgbm:一个高效的梯度增强决策树。2017年12月发表于:神经信息处理系统进展30 (NIPS 2017);2017年12月4日至9日;长滩,加州,美国。
  48. 饶超,吴勇。交叉验证的线性模型选择。统计规划与推理学报,2005,28(1):231-240。[CrossRef
  49. Van Calster B, Nieboer D, Vergouwe Y, De Cock B, Pencina MJ, Steyerberg EW。定义了风险模型的校准层次:从乌托邦到实证数据。中华流行病学杂志(英文版);2016;44(4):557 - 557。[CrossRef] [Medline
  50. 哈勒尔JFE。回归建模策略:线性模型、逻辑回归和生存分析的应用。美国纽约:斯普林格出版社;2015.
  51. Riley RD.修正:开发多变量预测模型的最小样本量:第二部分- Riley RD, Snell KI, Ensor J等人的二元和事件时间结果。统计医学2019年12月30日;38(30):5672 [j]免费全文] [CrossRef] [Medline
  52. 李建平,李建平,李建平,等。开发多变量预测模型的最小样本量:第一部分-连续结果。中国医学杂志2019年3月30日;38(7):1262-1275。[CrossRef] [Medline
  53. van der Ploeg T, Austin PC, Steyerberg EW。现代建模技术需要大量数据:预测二分类端点的模拟研究。中华医学会医学杂志2014年12月22日;14:137 [j]免费全文] [CrossRef] [Medline
  54. 董超,王勇,张强,王宁。动态不确定因果图智能诊断眩晕的方法。计算机工程学报,2014,33(1):464 - 468。[CrossRef] [Medline
  55. 李建军,李建军,李建军,等。基于ipad的医疗设备(mex)对眩晕和头晕诊断的预测能力。中华神经科学杂志2018;9:29 [免费全文] [CrossRef] [Medline
  56. 张晓明,张晓明,张晓明,等。眩晕和眩晕诊断比例的系统评价。中国生物医学工程学报,2019,39(1):6-15。[CrossRef] [Medline


AUC:曲线下面积
BPPV:良性阵发性位置性眩晕
LGBM:光梯度增强机
OVerAIR:耳源性眩晕人工智能研究
SSNHL-V:突发性感音神经性听力丧失伴前庭功能障碍


R库卡夫卡编辑;提交12.10.21;R Bajpai、S Kim同行评议;对作者30.01.22的评论;修订版本收到14.02.22;接受13.06.22;发表03.08.22

版权

©于方舟,吴培霞,邓浩文,吴敬芳,孙姗,于慧倩,杨建明,罗显扬,何静,马秀兰,文俊雄,邱丹红,聂国辉,刘日照,胡国华,陈涛,张成,李华伟。最初发表于医学互联网研究杂志(//www.mybigtv.com), 2022年8月3日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map