卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

1438 - 8871

卡塔尔世界杯8强波胆分析

加拿大多伦多

v24i8e34126

35921135

10.2196/34126

原始论文

基于问卷的集成学习模型预测眩晕的诊断:模型开发和验证研究

Kukafka

丽塔

亚太区

内存

金

Seongsoon

余

Fangzhou

医学博士 1

https://orcid.org/0000-0002-1549-0327

吴

Peixia

博士学位 2

https://orcid.org/0000-0003-4946-4140

邓

遗山

百时美施贵宝 3.

https://orcid.org/0000-0001-5373-3003

吴

Jingfang

博士学位 1 4 5

https://orcid.org/0000-0002-5743-1990

太阳

山

博士学位 5 6

https://orcid.org/0000-0003-2142-4307

余

Huiqian

博士学位 1 4 5

https://orcid.org/0000-0002-5769-9583

杨

Jianming

毫米 7

https://orcid.org/0000-0002-2996-399X

罗

咸阳

毫米 8

https://orcid.org/0000-0003-1542-6832

他

京

毫米 8

https://orcid.org/0000-0002-7320-4587

妈

Xiulan

医学博士 9

https://orcid.org/0000-0002-0364-9206

温

Junxiong

毫米 9

https://orcid.org/0000-0002-9031-5916

邱

Danhong

毫米 10

https://orcid.org/0000-0003-2827-3185

聂

Guohui

博士学位 11

https://orcid.org/0000-0002-8328-3864

刘

日照

毫米 11

https://orcid.org/0000-0002-4748-1775

胡

国华

博士学位 12

https://orcid.org/0000-0002-9550-2534

程ydF4y2Ba

道

博士学位 12

https://orcid.org/0000-0003-2872-6287

张

程

博士学位 3.

https://orcid.org/0000-0002-8277-5138

李

华为

医学博士 1

耳鼻咽喉科眼科及耳鼻喉科医院复旦大学

9号楼611室

徐汇区汾阳路83号

上海,200031年

中国 86 021 64377134 ext 2669 hwli@shmu.edu.cn

4 5 6 13

https://orcid.org/0000-0002-9788-9285

1 耳鼻咽喉科眼科及耳鼻喉科医院复旦大学

上海

中国 2 护理部眼科及耳鼻喉科医院复旦大学

上海

中国 3. 信息管理和信息系统系“，复旦大学

上海

中国 4 医学神经生物学国家重点实验室、教育部脑科学前沿中心复旦大学

上海

中国 5 国家卫生健康委员会听力医学重点实验室复旦大学

上海

中国 6 脑科学研究所和脑科学协同创新中心复旦大学

上海

中国 7 耳鼻咽喉头颈外科“，安徽医科大学附属第二医院

合肥

中国 8 耳鼻咽喉头颈外科“，第一附属医院厦门大学医学院

厦门

中国 9 耳鼻咽喉头颈外科“，中国医科大学盛京医院

沈阳

中国 10 耳鼻喉科上海浦东医院

上海

中国 11 耳鼻喉科深圳市第二人民医院

深圳

中国 12 耳鼻喉科重庆医科大学附属第一医院

重庆

中国 13 生物医学研究所复旦大学

上海

中国

通讯作者:李华伟 hwli@shmu.edu.cn

8 2022

3. 8 2022

24 8

e34126

12 10 2021 30. 1 2022 14 2 2022 13 6 2022

©俞方舟、吴佩霞、邓浩文、吴景芳、孙珊、于慧倩、杨建明、罗显阳、何静、马秀兰、文俊雄、邱丹红、聂国辉、刘日照、胡国华、陈涛、张程、李华伟。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2022年3月8日。

2022

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

在过去的20年里，问卷调查被用于预测眩晕的诊断并协助临床决策。基于问卷的机器学习模型有望提高前庭疾病的诊断效率。

客观的

本研究旨在开发和验证一个基于问卷的机器学习模型，预测眩晕的诊断。

方法

在这项多中心前瞻性研究中，眩晕患者于2019年8月至2021年3月首次访问7个三级转诊中心的耳鼻喉科和眩晕科诊所时进入连续队列，随访期为2个月。所有参与者在资格筛选后完成诊断问卷。仅接受治疗专家对其主要疾病进行最终诊断的患者被纳入模型开发和验证。2021年2月1日之前入组的患者数据用于建模和交叉验证，之后入组的患者进行外部验证。

结果

共纳入1693例患者，有效率为96.2%(1693/1760)。中位年龄51岁(IQR 38-61岁)，女性991例(58.5%);1041例(61.5%)患者在研究期间得到最终诊断。其中928例(54.8%)患者纳入模型开发和验证，随后纳入的113例(6.7%)患者作为测试集进行外部验证。他们被分为5个诊断类别。我们比较了9种候选机器学习方法，重新校准的轻梯度增强机模型的性能最好，交叉验证的曲线下面积为0.937 (95% CI 0.917-0.962)，外部验证的曲线下面积为0.954 (95% CI 0.944-0.967)。

结论

基于问卷调查的光梯度增强机能够预测常见的前庭疾病，并协助耳鼻喉科和眩晕诊所的决策。更大样本量的进一步研究和神经学家的参与将有助于评估这种机器学习方法的泛化和鲁棒性。

前庭障碍机器学习诊断模型眩晕 ENT 问卷调查

简介

头晕和眩晕是前庭神经系统疾病患者的主要主诉，估计一生中头晕(包括眩晕)的发生率为15%-35% [ 1］．头晕和眩晕会使患者丧失行动能力，并严重影响患者的生活质量。这些情况往往导致活动受限，并与精神障碍密切相关，如焦虑、恐惧和躯体形式障碍[ 1- 3.］．头晕和眩晕患者摔伤和摔伤相关的风险也较高，尤其是老年人[ 4］．然而，前庭神经障碍的诊断是具有挑战性和耗时的。它涉及多种前庭和神经系统原因以及复杂的病理过程，导致误诊，并可能在眩晕患者中广泛滥用影像学[ 5- 8］．随之而来的诊断延误会加重疾病的功能和心理后果。

人工智能在诊断头晕和眩晕方面的应用可以追溯到30多年前。专家系统，例如眩晕［ 9]， Carrusel［ 10),而一个［ 11]由具有固定诊断规则的知识库组成。他们通过无法从患者数据中学习的非自适应算法进行推断。不同的机器学习算法，包括遗传算法、神经网络、贝叶斯方法、k近邻和支持向量机，也被用于分析来自一个［ 12- 16］．6种常见耳神经诊断的预测准确率为90% ~ 97%，9种诊断类别的预测准确率为76.8% ~ 82.4%。 EMBalance是一个综合平台，于2015年推出，通过使用基于决策树的集成学习方法(自适应增强)来辅助平衡障碍的诊断、治疗和进化[ 17， 18］．前庭神经疾病的计算机辅助诊断方法已经从单纯的知识驱动向数据驱动转变。

除了眩晕，上述所有模型都是基于患者的病史和检查，并结合必要的检查，而在实践中，患者的病史本身就为可能的诊断和进一步的评估提供了重要的线索[ 19］．在过去的20年里，出现了大量关于头晕和眩晕的问卷，以协助前庭神经疾病的临床诊断[ 20.- 27］．这些研究大多使用简单的统计模型，通常是逻辑回归，并使用与建模相同的数据进行验证[ 26- 28］．很少有研究尝试应用机器学习算法。但由于数据集较小或建模数据选择不当，这些模型的精度不如简单统计模型[ 29， 30.］．

本研究是耳源性眩晕人工智能研究(OVerAIR)的一部分，其主要目的是建立一个综合平台，利用人工智能对一组耳源性眩晕患者进行诊断、治疗、康复和随访。本研究的具体目标包括开发和验证一个眩晕诊断平台，通过使用机器学习技术协助临床决策，并进一步探索所提议的平台的有效性和临床效用。

方法研究设计

根据Barany学会对前庭症状的分类，出现新的眩晕或头晕主诉的患者[ 31]于2019年8月至2021年3月分别在复旦大学眼科医院、安徽医科大学第二医院、厦门大学附属第一医院、中国医科大学盛京医院、上海浦东医院、深圳市第二人民医院、重庆医科大学附属第一医院的耳鼻喉科和眩晕科就诊。在与耳鼻喉科专家的第一次面谈中，患者在知情同意后，通过平板电脑或智能手机完成了电子问卷。那些不能自己阅读和完成问卷的人回答了研究人员读到的问题。我们没有干涉病人的正常医疗程序。在专家认为有必要的情况下，为患者安排下一次就诊;因此，他们没有坚持一个固定的随访时间。

伦理批准

本研究已获得所有参与中心的机构审查委员会的批准(批准号2019091)。本研究遵循个体预后或诊断报告指南的多变量预测模型透明报告[ 32］．

结果

每位患者都进行了常规的病史收集，随后进行了完整的耳神经检查，必要时还进行了进一步的检查(如纯音听力测量、前庭测试、计算机断层扫描和磁共振成像)。由具有5年以上临床经验的耳鼻喉科专家给出的临床诊断被用作参考诊断，这些专家对问卷回答不知情。参考诊断标准包括美国耳鼻咽喉头颈外科学会关于良性阵发性位置性眩晕(BPPV)的实践指南[ 33]和前庭神经疾病的诊断标准(包括前庭偏头痛[ 34]，梅尼埃病[ 35]，持续性体位知觉性头晕[ 36]，前庭阵发性发作[ 37]，及双侧前庭病[ 38)。具有典型临床特征但不符合明确诊断标准的患者给予可能诊断。在2个月内没有明确诊断或在最终诊断前不再来就诊的患者被标记为未确诊。

调查问卷的发展

诊断问卷的制定是一个迭代的过程，主要包括以下3个阶段。

焦点小组和小组会议:首先，召开了焦点小组讨论和3次后续小组会议，以确定耳鼻喉科诊所常见的周围前庭神经障碍。在此过程中，确定了16种疾病，并列出了每种疾病的特征表现。对每种疾病的诊断或实践指南的文献进行了搜索，并仔细审查了相关的文献。之后，起草了由43个项目组成的初步问卷。

患者访谈:为了便于理解和填写问卷，对我院耳鼻喉科门诊15例眩晕患者进行了访谈。两名患者报告说，手术时间太长、太耗时。另外3人抱怨被问了太多问题，比如心脏病和吃药了，这些问题似乎与他们的眩晕症无关。在这一阶段，问卷的措辞进行了彻底的简化，删除了6个问题。

专家组会议:在一次全国会议上，邀请了12位专家(来自耳鼻喉科、神经病学、前庭检查、康复)对问卷的适用性和清晰度进行了评估，并提出了进一步修订的建议。在这个过程中，项目被重新排序，一些项目被合并或省略。

统计分析

我们比较了9种候选机器学习方法，以筛选出性能最好的一种。考虑了五种非集成学习算法，即决策树[ 39]，脊回归[ 40]，逻辑回归(l2正则化)[ 41]，支持向量分类[ 42]，以及随机梯度下降支持向量分类[ 43］．集成学习是指一种通用的元方法，通过组合多个模型的预测，从战略上提高预测性能。实现了四种集成学习方法，即随机森林[ 44]、自适应升压[ 45，梯度增强决策树[ 46]、轻型梯度增压机(LGBM) [ 47］．我们采用自举交叉验证，将随机采样的数据按7:3分成训练集和验证集，重复100次，并进行替换[ 48］．模型在训练集上进行训练，并根据验证集上的预测性能进行评估。根据100个验证集的平均预测性能选择和调整最佳模型。曲线下面积(area under The curve, AUC)被用来评价模型的性能。在多类预测中，灵敏度、特异性、似然比和AUC通过一比一休方案(微平均)计算。然后使用校准曲线进行重新校准[ 49]和Brier分数[ 50]，以调整各诊断类别的预测概率与观测比例之间的差异。外部验证使用队列中最新患者的数据(在最近2个月内登记)，这些数据构成了测试集。所有指标的95% ci是通过自举计算得出的。

对布尔变量的缺失值在主要结果中用False进行imputation，并通过比较不同的imputation策略(即不进行imputation和用True进行imputation)进行敏感性分析。所有的机器学习算法都是用Python实现的，代码可以在在线资源中找到。超参数根据最先进的机器学习包sklearn设置为默认值。

稳健性和样本量分析

作为一种促进临床诊断的数据驱动预测方法，需要验证样本数量是否足够用于模型开发和验证。跟随Riley [ 51]和莱利等人[ 52]，我们根据全局收缩因子和最小样本数来量化样本量的充分性。足够样本量的准则是保证收缩系数>0.9。此外，给定可接受的收缩因子(例如，0.9)，可以根据解释方差的Cox-Snell比估计出建立预测模型所需的样品大小。

此外，现代技术灵活性的增加意味着与逻辑回归等经典方法相比，可靠的估计可能需要更大的样本量。因此，我们采用了van der Ploeg等人的方法[ 53]来评估我们的最佳模型LGBM对样本量的敏感性。训练集的大小不同，并且从开发集中抽取了子样本。每个训练集大小重复30次以消除随机性，而平均AUC测量测试集上的性能。

重要的变量

为了衡量变量的重要性，我们首先根据交叉验证中的信息增益来评估多变量特征的重要性，并选择了前20个重要变量。然后，为了计算单个诊断类别中的特征重要性，每个选择的变量分别用于预测5个诊断类别，并以AUC衡量单变量变量的重要性。

结果诊断问卷概述

最终问卷由23个项目组成，其中包含分支逻辑。完整版的问卷可在多媒体附件1．项的内容显示在文本框1．

诊断问卷中的项目。

关于症状特征的一个问题是:头是否旋转?如果不是，那么需要说明头晕的类型(沉重/头脑混乱，摇摇晃晃或其他)

三个问题关于频率，持续时间，以及第一次眩晕发作后的持续时间

关于听力损失的情况，有一个问题，那就是，它的哪一边和如何变化

关于耳鸣、耳胀、耳痛的情况，具体问三个问题，即发作前/发作中加重，发作后减轻，发作前/发作后是否改变，是哪侧?

关于头痛是否存在的问题，特别是头痛发作的时间和相关家族史

一个关于伴随性恐光症或语音恐惧症的问题

一个关于在眩晕发作期间、之后或没有眩晕发作时的不稳定的问题

一个关于站立或行走时症状是否会恶化的问题

关于跌倒的情况，意识状态，攻击时是否失禁两个问题

五题关于眩晕的触发因素，即躺下、翻身、快速起身、屏气、大声刺激、在一些特殊场景、特殊食物或气味、疲劳、失眠、生气

一问到底是颈性眩晕，即上肢麻木疼痛还是颈部疼痛

一个关于前驱症状的问题，即发病前的感冒、发烧和腹泻

一个关于耳科疾病病史的问题，即耳漏，中耳炎，耳部手术

一个关于头颈部创伤和手术史的问题

参与者的人口学特征

来自7个参与中心( 表1)．回复率为96.2%(1693/ 1760,67人拒绝参与)。在1693例入选患者中，1041例(61.5%)得到了治疗专家的一次最终诊断，14例(0.8%)有一次以上的诊断，145例(8.6%)有可能的诊断，而其他493例(29.1%)在2个月内没有得到最终诊断。最终诊断结果分布不均匀。最常见的诊断为BPPV、前庭偏头痛、突发性感音神经性听力丧失伴前庭功能障碍(SSNHL-V)和梅尼埃病。由于只有1例最终诊断的患者被纳入模型开发和验证，5个诊断类别中的1041例患者(中位年龄50 [IQR 38-61]岁，608例[58.4%]女性)被纳入模型开发和验证。目前，不超过20例的低频率诊断被标记为“其他”，因为没有足够的病例可以形成单独的类别。

在1041例患者中，928例被分为训练集(用于建模和交叉验证)，113例被纳入测试集(用于建模和交叉验证)。表2)．图1显示了研究流程图。训练集和测试集的详细信息描述在表2．

表1

参与者的人口学特征(N=1693)。

特征		价值
年龄(年)，中位数(IQR)		51 (38 - 61)
性别，n (%)
	女	991 (58.5)
	男性	702 (41.6)
诊断率，n (%)
	良性阵发性位置性眩晕	398 (23.5)
	前庭偏头痛	203 (12)
	梅尼埃病(又名内耳眩晕	194 (11.5)
	伴有前庭功能障碍的突发性感音神经性听力丧失	173 (10.2)
	其他人^一个	73 (4.3)
	多个诊断	14 (0.8)
	可能的诊断	145 (8.6)
	待定	493 (29.1)

^一个这一类包括前庭神经炎、持续性体位知觉性头晕、心因性头晕、迟发性内淋巴积液、前庭阵发性发作、颈源性眩晕、听神经瘤、老老性前庭病、轻cupula、Ramsay-Hunt综合征、迷路瘘管和上半规管断裂综合征。

表2

训练数据集和测试集的特征。

特征		训练集(n=928)	测试集(n=113)
年龄(年)，中位数(IQR)		50 (37-60)	53 (41 - 63)
性别，n (%)
	女	536 (57.8)	72 (63.7)
	男性	392 (42.2)	41 (36.3)
诊断率，n (%)
	良性阵发性位置性眩晕	348 (37.5)	50 (44.2)
	前庭偏头痛	182 (19.6)	21日(18.6)
	梅尼埃病(又名内耳眩晕	168 (18.1)	26 (23)
	伴有前庭功能障碍的突发性感音神经性听力丧失	164 (17.6)	9 (8)
	其他人^一个	66 (7.1)	7 (6.2)

图1

在2019年8月至2021年3月期间，对新出现眩晕或头晕症状的患者进行了筛查。随访2个月内记录诊断。

模型的开发和验证

交叉验证的9个模型中LGBM模型的AUC最高，为0.937 (95% CI 0.917-0.962)， Brier评分最低，为0.057 (95% CI 0.049-0.068) ( 表3)．因此，我们将其重新校准并作为最终的预测模型。

灵敏度分析中，用模态(频率最高的标签)输入缺失值时，9种方法的AUC和Brier评分均下降( 表4)．注意，LGBM不依赖于imputation方法;因此，它可以直接利用来自失踪以达到更好的预测性能。无imputation的LGBM与重新校准的LGBM (imputation为0)的性能相同，这验证了我们方法的鲁棒性。在交叉验证中，除了使用LASSO的逻辑回归外，集成学习方法比非集成学习方法表现更好，这表明在眩晕诊断中引入集成学习在特定的集成方法中是有效的。此外，LGBM在AUC和Brier评分上优于其他方法。

重新校准的LGBM模型在交叉验证中的受试者工作特征曲线如图所示图2．表5显示交叉验证和外部验证中不同诊断类别的AUC、敏感性、特异性、似然比和准确性。该模型对SSNHL-V预测精度较高(AUC>0.98，阳性似然比[+LR]>20，阴性似然比[-LR]<0.05)，对BPPV和Meniere病预测精度较高(AUC>0.95，敏感性>0.8，特异性>0.9，准确性>0.9，+LR>10， -LR <0.2)，对前庭偏头痛具有较好的鉴别能力(AUC 0.9, 95% CI 0.87-0.92)。由于本组样本量有限，异质性较大，其他诊断的预测不稳定，交叉验证AUC为0.771 ~ 0.929，外部验证AUC为0.879 ~ 0.957。

交叉验证的校准曲线( 图3)正确估计了梅尼埃病和前庭偏头痛的概率，略微低估了SSNHL-V和BPPV的概率。其他诊断的预测相对保守，因为它不太可能给出接近0或1的概率。交叉验证的Brier评分为0.058 (95% CI 0.049 ~ 0.068)，表明预测概率与实际诊断比例吻合良好。我们还将我们的方法应用于外部数据集。结果表明，所选取的最佳模型LGBM对眩晕诊断的预测具有较好的泛化能力，AUC为0.958 (95% CI 0.951 ~ 0.969)。同时，LGBM也优于第二优方法logistic回归，其外部验证的AUC为0.939 (95% CI 0.925-0.956)。多变量特征在信息增益方面的重要性显示在表6．

各诊断类别的整体收缩因子分析和敏感性分析结果表明，本研究的样本量足以进行模型开发。看到多媒体附件2有关样本量分析的更多细节。然后，计算特征在各个诊断类别中的重要性，在中的前20个贡献变量中的每一个表6用于独立预测5个诊断类别，单因素变量重要性以AUC ( 图4)．

表3

候选算法的预测性能。

方法		曲线下面积(95% CI)	Brier评分(95% CI)
Non-ensemble学习
	决策树	0.765 (0.726 - -0.798)	0.125 (0.104 - -0.146)
	岭回归	0.803 (0.780 - -0.831)	0.087 (0.071 - -0.104)
	逻辑回归	0.928 (0.907 - -0.956)	0.060 (0.051 - -0.069)
	支持向量分类	0.501 (0.499 - -0.505)	0.239 (0.220 - -0.258)
	随机梯度下降	0.733 (0.611 - -0.824)	0.141 (0.083 - -0.254)
整体学习
	随机森林	0.924 (0.900 - -0.949)	0.063 (0.056 - -0.070)
	自适应增强	0.851 (0.793 - -0.901)	0.148 (0.144 - -0.151)
	梯度增强决策树	0.925 (0.902 - -0.951)	0.064 (0.053 - -0.076)
	轻型梯度提升机	0.935 (0.913 - -0.960)	0.057 (0.047 - -0.067)
	重新校准光梯度增强机	0.937 （0.917 - -0.962)	0.058 (0.049 - -0.068)

表4

不同算法在用模式输入缺失数据时的性能。

方法		曲线下面积(95% CI)	Brier评分(95% CI)
Non-ensemble学习
	决策树	0.746 (0.690 - -0.791)	0.137 (0.114 - -0.169)
	岭回归	0.788 (0.733 - -0.817)	0.096 (0.076 - -0.121)
	逻辑回归	0.921 (0.900 - -0.943)	0.067 (0.057 - -0.082)
	支持向量分类	0.500 (0.500 - -0.500)	0.240 (0.222 - -0.258)
	随机梯度下降	0.727 (0.578 - -0.819)	0.148 (0.090 - -0.251)
整体学习
	随机森林	0.919 (0.896 - -0.939)	0.068 (0.061 - -0.078)
	自适应增强	0.833 (0.741 - -0.887)	0.148 (0.143 - -0.156)
	梯度增强决策树	0.915 (0.888 - -0.935)	0.073 (0.059 - -0.093)
	轻型梯度提升机	0.929 (0.906 - -0.950)	0.062 (0.055 - -0.072)
	轻型梯度增厚机(无imput)	0.935 (0.916 - -0.956)	0.057 (0.049 - -0.065)

图2

每个诊断类别的95% CI(2条虚线之间)的受试者工作特征曲线(实线)。每个诊断类别的性能通过一个对休息方案进行评估。良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。

表5

不同诊断类别的预测能力。

		AUC^一个(95%置信区间)	敏感度(95% CI)	特异性(95% CI)	+ LR^b(95%置信区间)	lr^c(95%置信区间)	准确度(95%置信区间)
良性阵发性位置性眩晕
	简历^d	0.97 (0.96 - -0.99)	0.94 (0.87 - -0.99)	0.92 (0.85 - -0.97)	13.23 (6.55 - -29.3)	0.07 (0.01 - -0.14)	0.92 (0.89 - -0.95)
	电动汽车^e	0.98 (0.97 - -0.99)	0.97 (0.92 - 1)	0.90 (0.83 - -0.94)	10.23 (5.88 - -17.92)	0.04 (0 - 0.09)	0.93 (0.90 - -0.96)
前庭偏头痛
	简历	0.91 (0.87 - -0.94)	0.86 (0.76 - -0.95)	0.85 (0.74 - -0.95)	6.58 (3.56 - -13.93)	0.17 (0.07 - -0.27)	0.85 (0.78 - -0.92)
	电动汽车	0.9 (0.87 - -0.92)	0.66 (0.52 - -0.76)	0.90 (0.85 - -0.96)	7.38 (4.71 - -12.05)	0.38 (0.26 - -0.51)	0.86 (0.82 - -0.88)
伴有眩晕的突发性感音神经性听力丧失
	简历	0.99 (0.97 - 1)	0.95 (0.88 - 1)	0.95 (0.90 - -0.99)	25.07 (9.39 - -67.93)	0.05 (0 - 0.12)	0.95 (0.91 - -0.98)
	电动汽车	1.00 (1.00 - -1.00)	1.00 (1.00 - -1.00)	0.98 (0.97 - -1.00)	正^f(34.67负)	0.00 (0.00 - -0.00)	0.98 (0.97 - 1)
梅尼埃病(又名内耳眩晕
	简历	0.96 (0.93 - -0.98)	0.92 (0.81 - 1)	0.90 (0.82 - -0.96)	10.79 (5.28 -22)	0.09 (0 - 0.21)	0.90 (0.84 - -0.95)
	电动汽车	0.97 (0.97 - -0.98)	0.82 (0.69 - -0.88)	0.98 (0.95 - -0.99)	正(18.4负)	0.19 (0.12 - -0.31)	0.94 (0.91 - -0.96)
其他人
	简历	0.86 (0.77 - -0.93)	0.83 (0.66 - 1)	0.78 (0.55 - -0.93)	4.44 (2.10 - -9.77)	0.21 (0 - 0.44)	0.78 (0.57 - -0.91)
	电动汽车	0.92 (0.88 - -0.96)	0.74 (0.50 - -0.86)	0.90 (0.85 - -0.94)	7.59 (5.05 - -12.02)	0.38 (0.26 - -0.51)	0.89 (0.85 - -0.93)

^一个AUC:曲线下面积。

^b+LR:正似然比。

^c-LR:负似然比。

^d简历:交叉验证。

^eEV:外部验证。

^fInf:正似然比为无穷大，因为特异性为1。

图3

基于重新校准的光梯度增强机模型，在验证数据上逐点95%置信限(灰色带)的校准曲线(蓝色实线)。良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。

表6

轻梯度增压机模型中多变量特征的重要性。

变量	功能的重要性
突发性听力丧失	1039.8
发作时间	912.3
听力损失	694.8
首次发病时间	468.1
触发:起身、躺下或翻身	358.0
年龄	255.6
头痛病史	250.6
攻击频率	221.4
波动性听力损失	186.3
恐光症	185.7
第一次失聪的时间	183.7
反复出现的症状	155.9
耳鸣	135.5
耳朵丰满	135.4
发作时头痛	117.7
因站立或行走而加重	80.4
诱因:疲劳、睡眠不足	69.7
眩晕	65.0
上肢疼痛或麻木	62.4
攻击时不稳定	59.5
头痛家族史	54.2
男性	54.1
秋天	47.3
失去意识，大小便失禁	44.6
耳鸣:发作前加重，发作后减轻	36.7
触发因素:视觉刺激	31.0
触发:声音和压力	23.0
失稳:首次发病后	22.4
前驱症状:感冒、发烧、呕吐或腹泻	22.0
头晕家族史	17.4
诱因:某些食物	15.9
耳痛	11.6
摔倒时意识清醒	9.8
中耳炎或耳部手术史	7.2
耳鸣:眩晕时加重	4．5
波动的:逐渐恶化的	0．0
攻击之间的不稳定	0．0
近期有头颈部外伤或手术史	0．0

图4

在单变量预测中，采用曲线下面积作为变量重要性的估计。AUC:曲线下面积;良性阵发性位置性眩晕;SSNHL-V:突发性感音神经性听力丧失伴眩晕。

讨论主要研究结果

在这项多中心前瞻性队列研究中，开发了一份用于诊断眩晕的问卷，并使用通过问卷收集的患者历史数据开发了LGBM模型。据我们所知，这是第一个基于问卷的机器学习模型来预测眩晕的多种诊断。由于本研究中所有患者均来自耳鼻喉科和眩晕科诊所，因此诊断分布与以往在神经内科和平衡科诊所进行的研究不同[ 19- 21， 26］．在我们的研究中，SSNHL-V的患病率要高得多(173/1693,10.2%)，而前庭神经炎的患病率则低得多(22/1693,1.3%)。

我们的模型在预测常见前庭诊断方面优于先前报道的基于问卷的统计模型[ 20.， 21， 26］．一个可能的解释是，机器学习方法更擅长处理潜在的非线性关系和过拟合。此外，考虑到患者报告的历史信息的主观性，数据驱动模型比知识驱动模型更适合基于问卷的预测[ 9， 11， 54， 55］．与以往使用综合病史数据、体检和实验室检测的机器学习诊断系统相比，我们基于问卷的诊断模型有其优点[ 13- 17］．首先，病史为眩晕的原因提供了重要的线索，医生将根据这些线索来确认或排除一个假定的诊断。因此，基于问卷的诊断工具可以根据患者的病史提供早期决策支持，并有助于减少不必要的检查。此外，由于问卷数据直接来自患者，模型的表现不依赖于专业人员对患者病史的准确解释。此外，考虑到特定测试(如纯音测听、热量测试、视频头脉冲测试)的可及性有限，不需要特殊设备的问卷适用于不同的临床环境。然而，基于问卷的诊断模型也有其内在的局限性。患者报告的病史可能不准确，因为它容易受到回忆偏差、误解、患者情绪状态和其他主观因素的影响。同时，对于只有非特异性症状的患者，体检和实验室检查是更为重要的诊断工具。病史应始终与客观证据相结合，以作出更可靠的诊断。因此，未来有必要将体检和实验室检测结果引入系统，进行全面的逐步诊断预测。

限制

本研究存在以下局限性。诊断分布的不均匀使得模型很难对罕见诊断做出准确的预测。为了减少潜在的噪声，我们在建模中只纳入了最终诊断为1例的患者。排除诊断不确定的患者是一个潜在的偏倚来源。有几个原因导致这些病人没有得到明确的诊断。在某些情况下，BPPV患者在等待预定的位置测试和治疗(1-2周后)时可能会自发缓解，这也解释了我们队列中BPPV患病率相对于其他耳鼻喉科诊所较低的原因[ 56］．排除这些患者可以降低噪声，提高模型性能。此外，一些患者仅出现短暂症状，没有明显的结构、功能或心理变化;故未作明确诊断。此外，虽然大多数患者在随访期间完成了所有必要的检查，但也可能有一些罕见的原因在2个月内没有确定，这可能加剧了数据的不平衡。然而，随着队列的扩大，更多的罕见诊断患者将被纳入，这将使模型能够以更高的准确性预测罕见诊断。我们还可以在建模过程中管理不平衡数据的影响。同时，外部验证中观察到的AUC高于交叉验证，这可能是由于测试集的样本量相对较小。需要更多确诊的参与者进行进一步验证。最后，由于本研究是在三级中心的耳鼻喉科和眩晕科门诊进行的，该模型的预测能力还有待于在不同的临床环境中验证。

结论

这项研究提出了第一个基于问卷的机器学习模型预测常见的前庭疾病。该模型采用集成学习方法LGBM，对BPPV、前庭偏头痛、Meniere病和SSNHL-V具有较强的预测能力。作为OVerAIR平台的一部分，它可用于辅助耳鼻喉科诊所的临床决策，并有助于BPPV的远程诊断。我们还在开发一款智能手机应用程序，将调查问卷与转诊、随访、治疗和康复结合起来，以改善眩晕患者的健康状况。OVerAIR研究的下一阶段将涉及神经学家的参与，这有望提高模型对中枢性眩晕的预测能力，并有助于评估其泛化和稳健性。

多媒体附件1

最终版本的眩晕诊断问卷应用于本研究。

多媒体附件2

样本量分析。

缩写

AUC

曲线下面积

这

良性阵发性位置性眩晕

LGBM

轻型梯度提升机

OVerAIR

耳源性眩晕人工智能研究

SSNHL-V

伴有前庭功能障碍的突发性感音神经性听力丧失

本研究得到上海市卫生健康委重大疾病(耳源性眩晕)跨学科诊疗能力建设项目、上海市临床重点专科(shslczdzk00801)、上海市卫生健康委科研基金一般项目(grant 202040286)、国家自然科学基金(91846302、72033003)资助。资金来源在本研究的设计和实施中没有任何作用;数据的收集、管理、分析和解释;报告的撰写;或者是提交稿件发表的决定。

FY和HD可以完全访问研究中的所有数据，并对数据的完整性和数据分析的准确性负责。FY、PW、HD、CZ和HL负责本研究的概念和设计。所有作者都对数据的获取、分析或解释做出了贡献，并对重要知识内容的手稿进行了批判性修订。FY, PW, HD起草了手稿。FY和HD进行统计分析。HL和CZ获得了本研究的资助。FY、PW、HD、JW、HY、CZ和HL提供行政、技术或物质支持。HL和CZ监督了这项研究。

没有宣布。

Eckhardt-Henn

一个

最好的

浓密冰

年代

布鲁尔

Diener

Tschan

因兹

米

不同器质性眩晕综合征的精神病共病

J神经 2008 03 255 3. 420 8

10.1007 / s00415 - 008 - 0697 - x

18338198

最好的

Eckhardt-Henn

一个

Tschan

因兹

米

不同前庭性眩晕综合征的精神病发病率及共病。一项超过一年的前瞻性纵向研究的结果

J神经 2009 01 256 1 58 65

10.1007 / s00415 - 009 - 0038 - 8

19221849

Lahmann

Henningsen

布兰德

Strupp

米

扬

因兹

米

Eckhardt-Henn

一个

Feuerecker

斯佩耳特小麦

一个

施密德

眩晕和眩晕患者的精神共病和社会心理障碍

神经外科精神病学 2015 03 86 3. 302 8

10.1136 / jnnp - 2014 - 307601

24963122

jnnp - 2014 - 307601

德·莫拉埃斯

苏亚雷斯

WJDS

Ferriolli

Perracini

先生

社区老年人头晕的患病率和相关性:一项基于横断面人群的研究

BMC Geriatr 2013 01 04 13 4

10.1186 / 1471-2318-13-4

23290128

1471-2318-13-4

PMC3545826

烧烤

Strupp

米

穆勒

马丁

扬

眩晕患者在初级保健中的卫生服务利用:一项回顾性队列研究

J神经 2014 08 261 8 1492 8

10.1007 / s00415 - 014 - 7367 - y

24817192

Ahsan

科幻小说

Syamal

锰

Yaremchuk

彼得森

塞德曼

米

在急诊室评估晕眩病人影像学的成本和效用

喉镜 2013 09 123 9 2250 3.

10.1002 / lary.23798

23821602

Bakhit

米

Heidarian

一个

Ehsani

年代

特尔斐

米

Latifi

眩晕病人的临床评估:诊断试验的必要性和作用

Glob J健康科学 2014 03 24 6 3. 194 9

10.5539 / gjhs.v6n3p194

24762362

PMC4825364

Royl

plone (

Leithner

急诊室的头晕:诊断和误诊

欧元神经 2011 66 5 256 63

10.1159 / 000331046

21986277

000331046

米拉

Buizza

一个

Magenes

Manfrin

米

施密德

专家系统在耳神经病学中的诊断辅助作用

ORL耳鼻咽喉相关品 1990 52 2 96 103

10.1159 / 000276113

2183129

加维兰

加利西亚语

加维兰

Carrusel:前庭神经诊断专家系统

Acta Otolaryngol 1990 110 3 - 4 161 7

10.3109 / 00016489009122532

2239202

Auramo

Juhola

米

Pyykko

我

计算机辅助诊断头晕和眩晕的专家系统

医学资讯(伦敦) 1993 18 4 293 305

10.3109 / 14639239309025318

8072338

Laurikkala

JPS

Kentala

埃尔

Juhola

米

Pyvkko

一种新颖的机器学习程序用于发现耳科诊断

Scand Audiol补充 2001 52 One hundred. 2

10.1080 / 010503901300007218

11318434

Siermala

米

Juhola

米

Kentala

耳神经数据的神经网络分类及其可视化

Comput Biol Med 2008 08 38 8 858 66

10.1016 / j.compbiomed.2008.05.002

18572156

s0010 - 4825 (08) 00074 - 7

比赛当天艳阳高照

Juhola

米

基于贝叶斯概率模型的耳神经科病例分类

J医学系统 2010 04 34 2 119 30.

10.1007 / s10916 - 008 - 9223 - z

20433050

Varpa

Joutsijoki

Iltanen

Juhola

米

将k近邻法和支持向量机中的一对一和一对一分类器应用于耳神经多类问题

种马健康技术通知 2011 169 579 83

21893815

Joutsijoki

Varpa

Iltanen

Juhola

米

机器学习方法解决耳神经分类问题

2013

第35届IEEE医学与生物工程学会国际年会

2013年7月3日至7日

日本大阪

1294 7

Exarchos

里加斯

成员

一个

Kikidis

尼基塔

Wuyts

Ihtijarevic

梅斯

Cenciarini

米

毛雷尔

麦克唐纳

Bamiou

勒克桑

Prasinos

米

Spanoudakis

Koutsouris

Fotiadis

挖掘平衡障碍的数据，以开发诊断决策支持系统

Comput Biol Med 2016 10 01 77 240 8

10.1016 / j.compbiomed.2016.08.016

27619194

s0010 - 4825 (16) 30213 - x

Exarchos

巴洛斯

Bakola

我

Kikidis

成员

一个

Koutsouris

Fotiadis

迪

使用决策支持系统管理和建模平衡障碍:EMBALANCE项目

GeNeDis 2014: Adv Exp医学生物学 2015

可汗

施普林格

61 7

赵

杰夫克

Piccirillo

杰伊·F

Spitznagel

爱德华·L

Kallogjeri

Dorina

Goebel

乔尔一个

历史资料对头晕诊断的预测能力

Otol Neurotol 2011 02 32 2 284 90

21178804

PMC3543606

20.

拜耳

Warninghoff

Straube

一个

眩晕病的诊断指标

BMC神经 2010 10 25 10 98

10.1186 / 1471-2377-10-98

20973968

1471-2377-10-98

PMC2987857

Friedland

博士

Tarima

年代

Erbe

英里

一个

预测常见前庭病诊断的统计模型的发展

美国医学会耳鼻咽喉头颈外科杂志 2016 04 142 4 351 6

10.1001 / jamaoto.2015.3663

26913615

2496500

PMC5070446

Imai

Higashi-Shingai

Takimoto

Masumura

服部年宏

Inohara

良性阵发性位置性眩晕诊断的访谈新评分系统

Acta Otolaryngol 2016 136 3. 283 8

10.3109 / 00016489.2015.1121547

26838579

Lapenna

Faralli

米

德尔Zompo

先生

Cipriani

Mobaraki

里奇

老年人良性阵发性位置性眩晕诊断的记忆问卷可靠性研究

老化临床经验测定 2016 10 28 5 881 8

10.1007 / s40520 - 015 - 0487 - 0

26537236

10.1007 / s40520 - 015 - 0487 - 0

程ydF4y2Ba

蜀

王

问

锅

吴

方

太阳

翟

越南盾

刘

《中国版头晕障碍量表》中5项和2项问卷筛选客观良性阵发性位置性眩晕的有效性

神经科学 2016 08 37 8 1241 6

10.1007 / s10072 - 016 - 2573 - 2

27071688

10.1007 / s10072 - 016 - 2573 - 2

李

气

刘

王

良性阵发性位置性眩晕诊断问卷的编制与评价

神经科学杂志 2017 10 381 148 149

10.1016 / j.jns.2017.08.438

罗兰

Kallogjeri

汇

劳赫

年代

谢泼德

白色

Goebel

乔尔一个

一份简短的头晕问卷的效用，以区分眩晕的原因和指导适当的转诊:一项多中心前瞻性盲法研究

Otol Neurotol 2015 12 36 10 1687 94

26485598

PMC4692465

金

首歌

钟

杨

金

良性阵发性位置性眩晕的问卷诊断

神经学 2019 12 30. 94 9 e942 e949

10.1212 / wnl.0000000000008876

布瑞特

病房

汉堡王

奥乌苏

Friedland

罗素

乔

魏因赖希

嗯

预测良性阵发性位置性眩晕的统计算法评估

美国医学会耳鼻咽喉头颈外科杂志 2018 10 01 144 10 883 886

10.1001 / jamaoto.2018.1657

30178063

2697851

PMC6233832

Richburg

米切尔·波维内丽

Friedland

良性阵发性位置性眩晕的直接患者调查诊断

2018 12

第17届IEEE机器学习与应用国际会议

12月

奥兰多，佛罗里达州，美国

332 337

30.

Masankaran

Viyanon

Mahasittiwat

利用机器学习技术从眩晕障碍量表中分类良性阵发性定位性眩晕类型

2018

智能信息学和生物医学科学国际会议

2018

泰国曼谷

209 214

Bisdorff

一个

冯Brevern

米

专家

Newman-Toker

德

前庭症状的分类:前庭疾病的国际分类

大 2009 10 01 19 1 - 2 1 13

10.3233 /类型- 2009 - 0343

柯林斯

Reitsma

简森-巴顿

奥特曼

卫星

KGM

三脚架集团

透明报告个人预后或诊断的多变量预测模型(TRIPOD): TRIPOD声明。TRIPOD集团

循环 2015 01 13 131 2 211 9

10.1161 / CIRCULATIONAHA.114.014508

25561516

CIRCULATIONAHA.114.014508

PMC4297220

Bhattacharyya

·古

施瓦兹

老

Edlow

晶澳

El-Kashlan

横笛

霍姆博格

马奥尼

霍林

罗伯茨

塞德曼

医学博士

施泰纳

RWP

做

英国电信

Voelker

CCJ

Waguespack

科里根

医学博士

临床实践指南:良性阵发性位置性眩晕(更新)

耳鼻喉头颈外科 2017 03 156 3 _suppl S1 S47

10.1177 / 0194599816689667

28248609

专家

奥尔森

弗曼

沃森

Seemungal

凯里

Bisdorff

一个

Versino

米

埃弗斯

年代

Newman-Toker

前庭偏头痛:诊断标准

大 2012 11 01 22 4 167 172

10.3233 /类型- 2012 - 0453

Lopez-Escamez

晶澳

凯里

钟

Goebel

晶澳

所以马格努松

米

曼荼罗

米

Newman-Toker

德

Strupp

米

铃木

米

Trabalzini

Bisdorff

一个

Menière病的诊断标准

大 2015 03 01 25 1 1 7

10.3233 /类型- 150549

无助

摩根大通

Eckhardt-Henn

一个

Horii

一个

雅各

Strupp

米

布兰德

布罗斯特

一个

持续性体位知觉性头晕(PPPD)的诊断标准:Bárány学会前庭疾病分类委员会的共识文件

大 2017 10 21 27 4 191 208

10.3233 /类型- 170622

Strupp

米

Lopez-Escamez

晶澳

金

Straumann

珍

凯里

Bisdorff

一个

布兰德

前庭阵发性发作:诊断标准

大 2017 01 27 26 5 - 6 409 415

10.3233 /类型- 160589

Strupp

米

金

Murofushi

Straumann

珍

工厂的

德拉Santina

Kingma

双侧前庭病:诊断标准Bárány学会分类委员会共识文件

大 2017 10 21 27 4 177 189

10.3233 /类型- 170619

Loh

分类和回归树

电线数据挖掘Knowl发现 2011 01 06 1 1 14 23

10.1002 / widm.8

里夫金

利

类风湿性关节炎

关于正则化最小二乘的注释

CSAIL技术报告 2007 05 01

2022-06-25

http://hdl.handle.net/1721.1/37318

Hosmer

小DW

Lemeshow

年代

斯特

处方

应用逻辑回归 2013

新泽西州霍博肯

John Wiley & Sons

许

连续波

常

林

支持向量分类的实用指南

数据科学ASSN 2003

2021-02-19

http://www.datascienceassn.org/sites/default/files/Practical%20Guide%20to%20Support%20Vector%20Classification.pdf

Bottou

Montavon

奥尔

穆勒

基米-雷克南

随机梯度下降技巧

《神经网络:交易技巧 2012

柏林,海德堡

施普林格

3. 540

Breiman

随机森林

机器学习 2001 45 1 5 32

10.1023 /: 1010933404324

黑斯蒂

安全

年代

朱

邹

多演算法

统计数据及其接口 2009 2 3. 349 360

10.4310 / SII.2009.v2.n3.a8

弗里德曼

随机梯度增强

计算统计与数据分析“， 2002 2 38 4 367 378

10.1016 / s0167 - 9473 (01) 00065 - 2

柯

孟

问

芬利

王

程ydF4y2Ba

妈

叶

问

刘

泰

Lightgbm:一种高效的梯度增强决策树

2017 12

神经信息处理系统进展30 (NIPS 2017)

2017年12月4日至9日

长滩，加州，美国

饶

吴

交叉验证的线性模型选择

统计规划与推断杂志 2005 1 128 1 231 240

10.1016 / j.jspi.2003.10.004

范Calster

Nieboer

Vergouwe

De Cock博士

Pencina

乔丹

Steyerberg

电子战

定义了风险模型的校准层次结构:从乌托邦到经验数据

临床流行病学 2016 06 74 167 76

10.1016 / j.jclinepi.2015.12.005

26772608

s0895 - 4356 (15) 00581 - 8

哈勒尔

小菲

回归建模策略:应用于线性模型，逻辑回归和生存分析 2015

美国纽约

施普林格

莱利

理查德·道金斯

修正:开发多变量预测模型的最小样本量:Riley RD, Snell KI, Ensor J等的第二部分二进制和事件时间结果

地中海统计 2019 12 30. 38 30. 5672

10.1002 / sim.8409

31793031

PMC8097575

莱利

理查德·道金斯

斯奈尔

安瑟尔

伯克

戴斯。莱纳姆:

哈勒尔

菲

卫星

公斤

柯林斯

开发多变量预测模型的最小样本量:第一部分-连续结果

地中海统计 2019 03 30. 38 7 1262 1275

10.1002 / sim.7993

30347470

范德普洛格

Tjeerd

奥斯丁

个人电脑

Steyerberg

电子战

现代建模技术是数据饥渴:预测二分类端点的模拟研究

BMC医学Res Methodol 2014 12 22 14 137

10.1186 / 1471-2288-14-137

25532820

1471-2288-14-137

PMC4289553

越南盾

王

张

问

王

眩晕智能诊断的动态不确定因果图方法

计算方法程序生物医学 2014 113 1 162 74

10.1016 / j.cmpb.2013.10.002

24176413

s0169 - 2607 (13) 00330 - 1

Feil

Feuerecker

Goldschagg

Strobl

布兰德

•冯•穆勒

阿尔布雷希特

烧烤

Strupp

米

基于ipad的医疗设备(mex)对眩晕和头晕诊断的预测能力

前神经 2018 9 29

10.3389 / fneur.2018.00029

29535671

PMC5835100

帕克

我

Hartel

Paratz

白菜

Rahmann

一个

报告的头晕和眩晕诊断比例的系统回顾

Otol Neurotol 2019 01 40 1 6 15

30439765