这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。gydF4y2B一个
在调查语音障碍时,包括语音筛查和诊断在内的一系列过程都被使用。这两种方法的标准化测试都有限,受临床医生经验和主观判断的影响。机器学习(ML)算法已被用作筛选或诊断语音障碍的客观工具。然而,ML算法在评估和诊断语音障碍方面的有效性还没有得到足够的学术重视。gydF4y2B一个
本系统综述旨在评估ML算法在甄别和诊断语音障碍方面的有效性。gydF4y2B一个
对5个数据库进行了电子检索。研究检查了任何ML算法在检测病理声音样本中的性能(准确性、敏感性和特异性)。两名审稿人独立选择了这些研究,从纳入的研究中提取了数据,并评估了偏倚的风险。使用RevMan 5软件(Cochrane图书馆)的诊断准确性研究质量评估2工具评估各研究的方法学质量。提取研究、人群和指标检验的特征,并进行荟萃分析,以汇集ML技术的准确性、敏感性和特异性。异质性问题是通过讨论可能的来源和在必要时排除研究来解决的。gydF4y2B一个
在检索到的1409份记录中,有13项研究和4079名参与者纳入了本综述。在纳入的研究中,共使用了13种ML技术,最常见的技术是最小二乘支持向量机。ML技术筛查语音障碍的综合准确性、敏感性和特异性分别为93%、96%和93%。最小二乘支持向量机的准确率最高(99%),而k最近邻算法的灵敏度最高(98%),特异性最高(98%)。二次鉴别分析达到最低的准确性(91%),灵敏度(89%)和特异性(89%)。gydF4y2B一个
ML在声音障碍的筛查中显示出有希望的结果。然而,由于使用ML进行诊断的研究数量有限,这些发现在诊断语音障碍方面并不是结论性的;因此,需要进行更多的调查。虽然ML不可能单独作为当前诊断工具的替代品,但它可以作为临床医生评估患者的决策支持工具,这可以改善评估的管理流程。gydF4y2B一个
普洛斯彼罗CRD42020214438;https://www.crd.york.ac.uk/prospero/display_record.php?RecordID=214438gydF4y2B一个
嗓音障碍是指声音产生的异常,可能是由于声带结构的病变或异常改变而引起的[gydF4y2B一个
诊断和筛选嗓音障碍包括听觉-知觉和工具评估。听觉-知觉评估由有资格的言语和语言治疗师(SLT)进行;在这个评估中,SLT通过倾听患者持续的元音产生来确定他们的声音质量;例如,the, aa,或发音或连续语音[gydF4y2B一个
机器学习(ML)在20世纪80年代初被引入语音研究[gydF4y2B一个
尽管有几项研究调查了ML算法在检测和诊断语音障碍方面的有效性,但据我们所知,只有1篇综述试图总结这些研究得出的证据[gydF4y2B一个
本系统评审遵循Cochrane图书馆的诊断测试准确性(DTA)系统评审指南[gydF4y2B一个
2021年6月24日,我们搜索了以下5个数据库:MEDLINE(通过Ovid)、Embase、Scopus、Web of Science和ACM数字图书馆。没有语言限制,翻译非英语文章以检查其对审查的适用性。使用EndNote 9导出和管理检索到的引用。gydF4y2B一个
总共有两组关键词被用于搜索数据库:一组代表目标诊断(如语音障碍),另一组代表感兴趣的干预(如ML算法)。这些术语来源于ML和语言治疗专家。还包括医学主题标题,以最大限度地提高MEDLINE和Embase搜索的敏感性。应用于MEDLINE和Web of Science的详细搜索策略分别见多媒体附录1和2。gydF4y2B一个
本综述的研究对象包括被诊断患有语音障碍的患者。对人口特征的类型(如年龄、性别和种族)没有任何限制。关于索引测试,我们重点关注有监督的ML技术(分类),该技术通过使用在受控环境(如语音实验室、医院、诊所和数据库)中收集的语音样本,用于筛选或诊断二元结果(如病态语音vs健康语音或语音障碍a vs b)中的语音障碍。本文关注的参考标准是工具评估和听觉-知觉评估,因为两者都遵循了美国演讲-语言-听力协会的建议[gydF4y2B一个
我们排除了仅依靠临床医生判断而不使用任何工具来确保综述的有效性和可靠性的研究,因为依赖主观评估可能会受到临床医生经验水平的影响。排除无监督ML方法。会议论文、评论、报告、社论、正在进行的研究、非同行评审的文章、仅评估准确性的研究以及未评估敏感性和特异性的研究也被排除在外。gydF4y2B一个
研究选择首先通过筛选检索到的研究的标题和摘要进行。尽管我们排除了标题和摘要不符合任何合格标准的研究,但所有符合合格标准或因标题和摘要中缺乏信息而不明确的研究都被保留。然后,我们阅读了标题和摘要筛选后剩下的研究全文,以评估他们是否符合本综述。研究选择过程由2名审稿人完成。gydF4y2B一个
两位审阅人员创建了一个数据提取表单(gydF4y2B一个
使用诊断准确性研究质量评估(QUADAS)的修订版工具评估纳入研究的偏倚风险-2 [gydF4y2B一个
通过叙述和定量综合来分析每种ML技术的结果(准确性、敏感性和特异性)。如果>1研究使用相同的ML技术,结果之间的差异不显著(<5%),则在meta分析中考虑最佳结果。所有结果均列于提取表(gydF4y2B一个
从符合条件的研究中提取的ML方法的准确性、敏感性和特异性通过随机效应比例荟萃分析进行分析,以估计集合比例和95% CI,其基于Wilson评分[gydF4y2B一个
提出了在gydF4y2B一个
研究选择过程流程图。gydF4y2B一个
所示gydF4y2B一个
纳入研究的元数据。gydF4y2B一个
研究gydF4y2B一个 | 一年gydF4y2B一个 | 国家gydF4y2B一个 | 出版语言gydF4y2B一个 |
Akbari和Arjmandi [gydF4y2B一个 |
2015gydF4y2B一个 | 伊朗gydF4y2B一个 | 英语gydF4y2B一个 |
Arias-Londoño等[gydF4y2B一个 |
2011gydF4y2B一个 | 希腊gydF4y2B一个 | 英语gydF4y2B一个 |
Arjmandi和Pooyan [gydF4y2B一个 |
2012gydF4y2B一个 | 伊朗gydF4y2B一个 | 英语gydF4y2B一个 |
Arjmandi等人[gydF4y2B一个 |
2011gydF4y2B一个 | 伊朗gydF4y2B一个 | 英语gydF4y2B一个 |
科代罗等人[gydF4y2B一个 |
2017gydF4y2B一个 | 葡萄牙gydF4y2B一个 | 英语gydF4y2B一个 |
加西姆扎德等人[gydF4y2B一个 |
2015gydF4y2B一个 | 伊朗gydF4y2B一个 | 英语gydF4y2B一个 |
Godino-Llorente和Gómez-Vilda [gydF4y2B一个 |
2004gydF4y2B一个 | 西班牙gydF4y2B一个 | 英语gydF4y2B一个 |
哈吉多罗夫等人[gydF4y2B一个 |
2000gydF4y2B一个 | 保加利亚和法国gydF4y2B一个 | 英语gydF4y2B一个 |
哈里哈兰等人[gydF4y2B一个 |
2014gydF4y2B一个 | 火鸡gydF4y2B一个 | 英语gydF4y2B一个 |
Lopes等人[gydF4y2B一个 |
2017gydF4y2B一个 | 巴西gydF4y2B一个 | 英语gydF4y2B一个 |
穆罕穆德等人[gydF4y2B一个 |
2020gydF4y2B一个 | 沙特阿拉伯和马来西亚gydF4y2B一个 | 英语gydF4y2B一个 |
苏伊西和谢里夫[gydF4y2B一个 |
2016gydF4y2B一个 | 突尼斯gydF4y2B一个 | 英语gydF4y2B一个 |
王等人[gydF4y2B一个 |
2011gydF4y2B一个 | 中国gydF4y2B一个 | 英语gydF4y2B一个 |
参加者或声音样本数目由40至960不等,共4019人,平均309人(gydF4y2B一个
参与者或样本的特征。gydF4y2B一个
研究gydF4y2B一个 | 声音样本大小,ngydF4y2B一个 | 年龄(年),范围gydF4y2B一个 | 男性(%)gydF4y2B一个 | 设置或数据库gydF4y2B一个 | 数据库的可访问性gydF4y2B一个 |
Akbari和Arjmandi [gydF4y2B一个 |
293gydF4y2B一个 | 13 - 82gydF4y2B一个 | 40gydF4y2B一个 | MEEIgydF4y2B一个ag)ydF4y2B一个数据库gydF4y2B一个 | 私人gydF4y2B一个 |
Arias-Londoño等[gydF4y2B一个 |
628gydF4y2B一个 | 19 - 70gydF4y2B一个 | - - - - - -gydF4y2B一个bgydF4y2B一个 | MEEI公司芬欧汇川集团和gydF4y2B一个cgydF4y2B一个数据库gydF4y2B一个 | 私人gydF4y2B一个 |
Arjmandi和Pooyan [gydF4y2B一个 |
120gydF4y2B一个 | 18 - 86gydF4y2B一个 | 56gydF4y2B一个 | MEEI数据库gydF4y2B一个 | 私人gydF4y2B一个 |
Arjmandi等人[gydF4y2B一个 |
One hundred.gydF4y2B一个 | 16 - 85gydF4y2B一个 | 67gydF4y2B一个 | MEEI数据库gydF4y2B一个 | 私人gydF4y2B一个 |
科代罗等人[gydF4y2B一个 |
154gydF4y2B一个 | - - - - - -gydF4y2B一个 | 34gydF4y2B一个 | MEEI数据库gydF4y2B一个 | 私人gydF4y2B一个 |
加西姆扎德等人[gydF4y2B一个 |
393gydF4y2B一个 | - - - - - -gydF4y2B一个 | - - - - - -gydF4y2B一个 | MEEI数据库gydF4y2B一个 | 私人gydF4y2B一个 |
Godino-Llorente和Gómez-Vilda [gydF4y2B一个 |
135gydF4y2B一个 | - - - - - -gydF4y2B一个 | - - - - - -gydF4y2B一个 | MEEI数据库gydF4y2B一个 | 私人gydF4y2B一个 |
哈吉多罗夫等人[gydF4y2B一个 |
400gydF4y2B一个 | - - - - - -gydF4y2B一个 | - - - - - -gydF4y2B一个 | 索菲亚大学医院语音科gydF4y2B一个 | 私人gydF4y2B一个 |
哈里哈兰等人[gydF4y2B一个 |
274gydF4y2B一个 | 20 - 68gydF4y2B一个 | - - - - - -gydF4y2B一个 | MEEI和MAPACI数据库gydF4y2B一个 | 私人gydF4y2B一个 |
Lopes等人[gydF4y2B一个 |
279gydF4y2B一个 | 18 - 65gydF4y2B一个 | 0gydF4y2B一个 | 语音实验室gydF4y2B一个 | 私人gydF4y2B一个 |
穆罕穆德等人[gydF4y2B一个 |
960gydF4y2B一个 | - - - - - -gydF4y2B一个 | - - - - - -gydF4y2B一个 | 圣言会gydF4y2B一个dgydF4y2B一个 | 私人gydF4y2B一个 |
苏伊西和谢里夫[gydF4y2B一个 |
120gydF4y2B一个 | - - - - - -gydF4y2B一个 | - - - - - -gydF4y2B一个 | 圣言会gydF4y2B一个 | 私人gydF4y2B一个 |
王等人[gydF4y2B一个 |
226gydF4y2B一个 | 26-58gydF4y2B一个 | - - - - - -gydF4y2B一个 | MEEI数据库gydF4y2B一个 | 私人gydF4y2B一个 |
ag)ydF4y2B一个马萨诸塞州眼耳医院。gydF4y2B一个
bgydF4y2B一个不可用。gydF4y2B一个
cgydF4y2B一个UPM: Universidad Autónoma de Madrid。gydF4y2B一个
dgydF4y2B一个SVD: Saarbruecken语音数据库。gydF4y2B一个
纳入的研究使用12ml算法(gydF4y2B一个
指数测试特性。gydF4y2B一个
研究gydF4y2B一个 | 机器学习方法gydF4y2B一个 | 特征提取gydF4y2B一个 | 功能降低gydF4y2B一个 | 验证gydF4y2B一个 |
Akbari和Arjmandi [gydF4y2B一个 |
回归模型gydF4y2B一个ag)ydF4y2B一个 | 均值,方差,偏度,系数峰度,小波子带系数gydF4y2B一个 | 线性预测分析和LDAgydF4y2B一个bgydF4y2B一个 | 70%的培训和30% 0%的测试gydF4y2B一个 |
Arias-Londoño等[gydF4y2B一个 |
回归模型gydF4y2B一个 | 12 MFCCgydF4y2B一个cgydF4y2B一个和MSMRgydF4y2B一个dgydF4y2B一个 | MSMR和二gydF4y2B一个 | 75%的培训和25%的测试(交叉验证-测试分离验证)gydF4y2B一个 |
Arjmandi和Pooyan [gydF4y2B一个 |
QDAgydF4y2B一个egydF4y2B一个, NMCgydF4y2B一个fgydF4y2B一个基于事例,gydF4y2B一个ggydF4y2B一个二,ML-NNgydF4y2B一个hgydF4y2B一个,电脑gydF4y2B一个我gydF4y2B一个 | 主成分分析gydF4y2B一个jgydF4y2B一个与乔治;功能选择:如果gydF4y2B一个kgydF4y2B一个, FFSgydF4y2B一个lgydF4y2B一个,石gydF4y2B一个米gydF4y2B一个, bbfgydF4y2B一个ngydF4y2B一个 | PCA与乔治gydF4y2B一个 | 70%的培训和30%的验证gydF4y2B一个 |
Arjmandi等人[gydF4y2B一个 |
QDA, NMC, PC, K-NN, LS-SVM和ML-NNgydF4y2B一个 | 基本频率(平均,高,低变化),STDgydF4y2B一个ogydF4y2B一个,再生能源gydF4y2B一个pgydF4y2B一个,抖动,微光,RAPgydF4y2B一个问gydF4y2B一个, PPQgydF4y2B一个rgydF4y2B一个,平滑PPQ, vAmgydF4y2B一个年代gydF4y2B一个, NHRgydF4y2B一个tgydF4y2B一个方法,gydF4y2B一个ugydF4y2B一个, SPIgydF4y2B一个vgydF4y2B一个, FTRIgydF4y2B一个wgydF4y2B一个,阿特gydF4y2B一个xgydF4y2B一个, TsamgydF4y2B一个ygydF4y2B一个, T0gydF4y2B一个zgydF4y2B一个,闪烁在dB, DVBgydF4y2B一个aagydF4y2B一个近年来,gydF4y2B一个abgydF4y2B一个, DUVgydF4y2B一个交流gydF4y2B一个, NVBgydF4y2B一个广告gydF4y2B一个, NSHgydF4y2B一个aegydF4y2B一个,周期间基音提取过程中基音周期的总片段数gydF4y2B一个 | PCA与乔治gydF4y2B一个 | 70%的培训和30%的测试gydF4y2B一个 |
科代罗等人[gydF4y2B一个 |
支持向量机和达gydF4y2B一个房颤gydF4y2B一个 | MFCCs,线谱频率,和δ mfccgydF4y2B一个 | N/AgydF4y2B一个ag)gydF4y2B一个 | 75%训练和25%测试(k-fold交叉验证法,k=4;训练测试验证)gydF4y2B一个 |
加西姆扎德等人[gydF4y2B一个 |
安gydF4y2B一个ag)ydF4y2B一个hgydF4y2B一个和二gydF4y2B一个 | 伪邻分数和互信息gydF4y2B一个 | LDA和二gydF4y2B一个 | 70%的训练和30%的测试使用交叉验证gydF4y2B一个 |
Godino-Llorente和Gómez-Vilda [gydF4y2B一个 |
LVQgydF4y2B一个ag)ydF4y2B一个我gydF4y2B一个 | MFCC系数,能量,一阶和二阶时间导数gydF4y2B一个 | MFCCgydF4y2B一个 | 70%的训练和30%的测试分离验证gydF4y2B一个 |
哈吉多罗夫等人[gydF4y2B一个 |
事例gydF4y2B一个 | Pitch period (To), PPQ, APQgydF4y2B一个ajgydF4y2B一个,刺gydF4y2B一个ag)ydF4y2B一个kgydF4y2B一个,形状的不相似程度[gydF4y2B一个 |
乔治。gydF4y2B一个 | 训练-测试分离验证阶段(200发音);测试(200发声)gydF4y2B一个 |
哈里哈兰等人[gydF4y2B一个 |
K-NN, LS-SVM和GRNNgydF4y2B一个一个gydF4y2B一个 | 5级WPTgydF4y2B一个aogydF4y2B一个分解gydF4y2B一个 | N/AgydF4y2B一个 | 70%的训练和30%的测试使用常规验证和交叉验证gydF4y2B一个 |
Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | F0测量(平均值和SD、抖动、微光和GNEgydF4y2B一个美联社gydF4y2B一个)gydF4y2B一个 | N/AgydF4y2B一个 | 交叉验证gydF4y2B一个 |
穆罕穆德等人[gydF4y2B一个 |
美国有线电视新闻网gydF4y2B一个aqgydF4y2B一个 | 八度及其一阶和二阶导数gydF4y2B一个 | N/AgydF4y2B一个 | 10倍交叉验证gydF4y2B一个 |
苏伊西和谢里夫[gydF4y2B一个 |
回归模型和安gydF4y2B一个 | MFCC和一阶二阶导数gydF4y2B一个 | MFCC, LDA和deltagydF4y2B一个 | 70%的培训;和30%的测试gydF4y2B一个 |
王等人[gydF4y2B一个 |
生物法gydF4y2B一个ag)ydF4y2B一个rgydF4y2B一个 | 每帧18-倒谱系数计算36维1导数的MFCC参数gydF4y2B一个 | 8 16 32的混合物gydF4y2B一个 | 10倍交叉验证gydF4y2B一个 |
ag)ydF4y2B一个LS-SVM:最小二乘支持向量机。gydF4y2B一个
bgydF4y2B一个LDA:线性判别分析。gydF4y2B一个
cgydF4y2B一个MFCC:梅尔频率倒谱系数。gydF4y2B一个
dgydF4y2B一个MSMR:调制光谱最小冗余。gydF4y2B一个
egydF4y2B一个QDA:二次判别分析。gydF4y2B一个
fgydF4y2B一个NMC:神经形态计算。gydF4y2B一个
ggydF4y2B一个事例:再。gydF4y2B一个
hgydF4y2B一个ML-NN:多层神经网络。gydF4y2B一个
我gydF4y2B一个PC: Parzen分类器。gydF4y2B一个
jgydF4y2B一个主成分分析:主成分分析。gydF4y2B一个
kgydF4y2B一个IFS:个体特征选择。gydF4y2B一个
lgydF4y2B一个FFS:正向特征选择。gydF4y2B一个
米gydF4y2B一个BFS:反向特征选择。gydF4y2B一个
ngydF4y2B一个BBFS:分支定界特性选择。gydF4y2B一个
ogydF4y2B一个STD:基频的标准差。gydF4y2B一个
pgydF4y2B一个PFR:发音基频。gydF4y2B一个
问gydF4y2B一个相对平均摄动。gydF4y2B一个
rgydF4y2B一个PPQ:基音摄动商。gydF4y2B一个
年代gydF4y2B一个vAm:峰值振幅变化。gydF4y2B一个
tgydF4y2B一个NHR: noise-to-harmonic比率。gydF4y2B一个
ugydF4y2B一个VTI:语音乱流指数。gydF4y2B一个
vgydF4y2B一个SPI:软语音索引。gydF4y2B一个
wgydF4y2B一个FTRI:地震强度指数。gydF4y2B一个
xgydF4y2B一个ATRI:振幅震颤强度指数。gydF4y2B一个
ygydF4y2B一个Tsam:以秒为单位的分析语音数据样本的长度。gydF4y2B一个
zgydF4y2B一个T0:声门平均周期。gydF4y2B一个
aagydF4y2B一个DVB:语音中断的程度。gydF4y2B一个
abgydF4y2B一个次谐波度。gydF4y2B一个
交流gydF4y2B一个DUV:无声程度。gydF4y2B一个
广告gydF4y2B一个NVB:语音中断次数。gydF4y2B一个
aegydF4y2B一个NSH:次谐波段数。gydF4y2B一个
房颤gydF4y2B一个大卫·爱登堡:判别分析。gydF4y2B一个
ag)gydF4y2B一个N / A:不适用。gydF4y2B一个
啊gydF4y2B一个人工神经网络。gydF4y2B一个
人工智能gydF4y2B一个LVQ:学习矢量量化。gydF4y2B一个
ajgydF4y2B一个APQ:螺距脉冲的振幅。gydF4y2B一个
正义与发展党gydF4y2B一个STAB:表示t0代的稳定性。gydF4y2B一个
艾尔gydF4y2B一个LHER:高低能比。gydF4y2B一个
我gydF4y2B一个HNR:谐波噪声比。gydF4y2B一个
一个gydF4y2B一个一般回归神经网络。gydF4y2B一个
aogydF4y2B一个WPT:小波包变换。gydF4y2B一个
美联社gydF4y2B一个GNE:声门噪声激励。gydF4y2B一个
aqgydF4y2B一个CNN:传统神经网络。gydF4y2B一个
基于“增大化现实”技术gydF4y2B一个GMM:高斯混合模型。gydF4y2B一个
在患者选择领域,只有38%(5/13)的研究被判定在患者采样中有较低的偏差风险,因为他们使用了适当的采样过程来选择声音样本(gydF4y2B一个
在所有纳入的研究中,患者是如何被选择的,不存在适用性问题,因为患者的特征、条件和每个测试的设置都符合回顾问题和标准(gydF4y2B一个
只有8%(1/13)的研究使用QDA算法来区分2 [gydF4y2B一个
机器学习在诊断语音障碍中的表现。gydF4y2B一个
算法gydF4y2B一个 | 检测疾病gydF4y2B一个 | 精度(%)gydF4y2B一个 | 灵敏度(%)gydF4y2B一个 | 特异性(%)gydF4y2B一个 | 研究gydF4y2B一个 |
QDAgydF4y2B一个ag)ydF4y2B一个 | 声带息肉vs健康gydF4y2B一个 | 70.56gydF4y2B一个 | 50gydF4y2B一个 | 74.76gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带囊肿vs健康gydF4y2B一个 | 72.67gydF4y2B一个 | 60.83gydF4y2B一个 | 78.1gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 单边VFgydF4y2B一个bgydF4y2B一个麻痹或健康gydF4y2B一个 | 79.82gydF4y2B一个 | 20.gydF4y2B一个 | 92.38gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 中后三角间隙vs健康gydF4y2B一个 | 71.11gydF4y2B一个 | 45gydF4y2B一个 | 80.43gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带沟vs健康gydF4y2B一个 | 78.75gydF4y2B一个 | 50gydF4y2B一个 | 83.33gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | VDDGERgydF4y2B一个cgydF4y2B一个与健康gydF4y2B一个 | 72.44gydF4y2B一个 | 33.33gydF4y2B一个 | 90.71gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带结节vs单侧VF麻痹gydF4y2B一个 | 76.61gydF4y2B一个 | 20.gydF4y2B一个 | 88.57gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带小结vs声带沟gydF4y2B一个 | 72.68gydF4y2B一个 | 50gydF4y2B一个 | 75.95gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带结节vs VDDGERgydF4y2B一个 | 71gydF4y2B一个 | 33.33gydF4y2B一个 | 89.05gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带小结vs声带沟gydF4y2B一个 | 70gydF4y2B一个 | 30.gydF4y2B一个 | 95gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带息肉vs健康gydF4y2B一个 | 75.14gydF4y2B一个 | 65gydF4y2B一个 | 78.33gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
QDAgydF4y2B一个 | 声带囊肿vs健康gydF4y2B一个 | 73.22gydF4y2B一个 | 62.5gydF4y2B一个 | 78.57gydF4y2B一个 | Lopes等人[gydF4y2B一个 |
ag)ydF4y2B一个QDA:二次判别分析。gydF4y2B一个
bgydF4y2B一个VF:声襞。gydF4y2B一个
cgydF4y2B一个VDDGER:胃食管反流引起的声音障碍。gydF4y2B一个
在系统综述纳入的13项研究中,10项(77%)纳入meta分析,3项(23%)被排除[gydF4y2B一个
在77%(10/13)的研究中,ML技术在评估语音障碍方面的准确性被报道。这些研究检查了9ml技术的准确性。9 ML技术的合并准确性为96% (95% CI 93%-98%;gydF4y2B一个
森林图显示了机器学习算法在语音障碍筛选中的准确性。人工神经网络;GRNN:一般回归神经网络;事例:再;LS-SVM:最小二乘支持向量机;ML-NN:多层神经网络;NMC:神经形态计算;PC: parzan分类器;QDA:二次判别分析;支持向量机:支持向量机。gydF4y2Ba
77%(10/13)的研究报告了ML技术在评估语音障碍方面的敏感性。这些研究检查了3ml技术的敏感性。3ml技术的合并灵敏度为96% (95% CI 91%-100%;gydF4y2B一个
森林图显示了机器学习算法在语音障碍筛选中的敏感性。事例:再;QDA:二次判别分析;支持向量机:支持向量机。gydF4y2B一个
77%(10/13)的研究检查了ML技术在评估语音障碍方面的特异性,其中包括3种ML技术的特异性。3ml技术的集合特异性为93% (95% CI 88%-97%;gydF4y2B一个
森林图显示了机器学习算法在语音障碍筛选中的特殊性。事例:再;QDA:二次判别分析;支持向量机:支持向量机。gydF4y2B一个
我们探索了合并绩效异质性的可能来源,以及使用短期参数的研究,如Arjmandi等人的研究[gydF4y2B一个
该研究系统地回顾了ML在评估语音障碍方面的表现,与Syed等人的另一项研究相似[gydF4y2B一个
分析结果表明,K-NN和LS-SVM的准确率最高。K-NN的特异性增强;然而,LS-SVM被发现能更好地检测真阳性病例。因为在纳入的研究中,ML被用作筛查工具(病态声音vs健康声音),ML更敏感的能力可能比特异性的能力更重要。这可能是由于将健康的嗓音患者诊断为病理性嗓音的后果,这只会导致进一步的检查(频频检查)。此外,它不会给病人造成任何痛苦,因为诊断不是最终的,病人只会被转介作进一步检查。然而,在不太敏感的检测中,对患者的误诊可能导致有害的后果。gydF4y2Ba
当一个人的力量、灵活性和声带结构导致病理性噪音和音色降低时,他们的声音病理可能严重到足以被认定为声音障碍。这些疾病可由组织疾病和组织变化、机械应力、表面不适、全身变化、肌肉和神经变化以及许多其他因素引起[gydF4y2B一个
主观评估可能由临床医生进行,因为他们关注患者的声音,并使用不同的仪器来辨别各种声音障碍的诊断。ML可作为临床医生进行听觉-知觉评估的决策支持工具[gydF4y2B一个
使用ML作为评估工具可以减少有经验和无经验的临床医生之间的学习差距。巴西奇和勒德洛[gydF4y2B一个
该综述显示ML在甄别和诊断语音障碍方面提供了最佳性能,可以通知临床医生异常。由于每项研究的特点不同,建议对ML算法的性能进行比较,包括准确性、特异性和敏感性。目前最常用的语音障碍的ML诊断方法是LS-SVM和人工神经网络算法。然而,在研究中没有明确解释使用1毫升方法对另一个方法的偏好。所有研究都使用内部验证(训练和测试分割和交叉验证)来评估ML质量。然而,外部验证是评估新数据ML预测真实质量的必要步骤。因此,在日常临床实践中实施ML诊断语音障碍,外部验证是必不可少的。因此,在使用ML进行任何临床诊断之前,必须进行外部验证。本综述中所研究的ML方法都没有使用外部验证。gydF4y2Ba
本文分析了使用ML算法筛选和诊断语音障碍的有效性相关文献。它不仅提供了对过去20年进行的研究类型的洞察,而且还强调了需要进一步实验和分析的研究领域。研究者和实践者可以利用这项研究来提高他们对言语病理的客观筛选或诊断。例如,声音障碍[gydF4y2B一个
因为在纳入的研究中ML被用作筛查工具(病态声音vs健康声音),ML更敏感的能力可能比它更具体的能力更重要。这可能是由于将健康患者诊断为不健康(嗓音有病态的患者)的后果,这将导致进一步的检查(频频检查),而不会造成患者痛苦,因为此时的诊断还不是最终的,患者将被转到进一步的检查。误诊病人(较不敏感的检查)可能导致有害的后果和痛苦,例如,如果喉癌等威胁生命的疾病被误诊。gydF4y2B一个
还应考虑ML可以作为临床医生的决策支持工具,同时主观判断患者的声音,以决定是否需要进一步检查。应用ML算法作为筛选工具可以帮助预先确定患者的语音状况。因此,这可以支持临床医生在嗓音障碍评估中的整个管理过程,特别是在他们决定是否为患者应用仪器检查时,这一决定目前是主观的。因此,将ML作为筛查工具可以减少有经验和无经验临床医生之间的差距(一致性<75%)[gydF4y2B一个
我们的发现也暗示ML可以用于基于网络的方法来检测语音障碍。这意味着算法可以用于智能手机应用程序或用户的电话,以检测语音障碍的存在,甚至跟踪他们的治疗进展。这可能会减少临床医生用于筛查、诊断或记录每次随访进展的时间。这项研究还发现,研究人员可能需要考虑调查各种ML算法在识别和诊断语音障碍方面的适用性。此外,建议添加到先前建立的数据库,这包括添加不同的语言,如阿拉伯语音病理数据库,到其他主流存储库。gydF4y2B一个
这一审查的关键优势在于它遵循了DTA系统审查和搜索策略。首先,这篇综述是根据Cochrane图书馆DTA系统综述,其次,它使用了各种医学、计算机和工程数据库。这增加了审查的敏感性,扩大了搜索范围,克服了有关文章数量有限的问题。此外,在筛选过程中,如果摘要的相关性不明确,则将该研究纳入全文扫描。这就消除了从评论中删除相关文章的任何机会。此外,在参考标准试验中,纳入标准被限制在受控环境中,这可能会确保更准确和可靠的结果。gydF4y2B一个
这是第一次系统评估不同ML算法在语音障碍评估和诊断中的性能。共纳入13项观察性研究,这些研究招募了来自不同性别和不同年龄组(13-85岁)的患者。总共测试了14种ML技术,其中9种被纳入meta分析,并对其综合准确性、敏感性和特异性进行了估计。gydF4y2B一个
这篇综述的主要缺点是初级研究报告的局限性;例如,从数据库或患者招募过程中选择声音样本的标准,样本人口统计学特征的不良报告,以及每个病例中声音障碍的严重程度。这妨碍了发现异质性来源的能力,因为无法调查基于性别、年龄组或类型或每种疾病严重性的亚组分析。此外,审查的主要结果不能更具体地针对某一性别或年龄组或疾病的类型或严重程度。提及这些细节可以让我们进一步研究哪些因素——声音障碍、性别或年龄组——决定了ML表现的准确性。在患者选择领域,超过一半(8/ 13,60%)纳入的研究显示存在不明确的偏倚风险。关于如何从数据库中选择声音样本的糟糕报告导致估计的准确性受到偏差的影响。当声音样本不是随机选择的时候,偏差就会增加,因为它们可能是根据未报告的严重程度选择的。然而,由于纳入的研究数量有限,不可能将这些研究从meta分析中删除。gydF4y2Ba
所有纳入的研究(13/13,100%)都没有报告参考标准是如何使用的,因此导致总体参考标准的偏倚评估风险“不明确”。这主要是因为使用了数据库中的声音样本;因此,临床医生的评估不是由主要研究的作者进行的。此外,临床医生的评估被选择的数据库所应用,并没有在研究中报告。不知道评估是如何进行的增加了偏见的风险,审查的结果被发现是不明确的。虽然联系了作者要求更多关于声音样本选择和参考标准评估的细节,但没有收到任何回复。在几乎所有纳入的研究中(12/13,92%),报告不到位导致了患者流量和时间上的不明确偏见风险,特别是缺乏临床医生评估和患者声音记录之间的时间间隔的报告。例如,如果在临床医生评估后的几个月间隔录制一次录音,患者的病情可能与第一次录音时有所不同。因此,这增加了错误分类或误诊的机会,因为声音样本的诊断可能与临床医生的诊断不同。更好地报告患者的诊断和招募过程将导致更明确的偏见评估风险。gydF4y2Ba
ML在筛查中表现出良好的结果,其准确性、敏感性和特异性均较高。研究结果还表明,ML可以进一步用于新的智能手机应用程序的筛选目的,并且可以在网络上进行筛选。在学术研究中,建议对特定的患者人口统计和疾病进行更多的研究。然而,由于研究数量有限(仅1篇),尚不能就ML在诊断中的有效性得出明确的结论。因此,我们建议临床医生在筛查时使用ML作为决策支持工具。为获得更明确的结论,建议进行更多的研究,并鼓励进行适合ML在医疗目的应用和监督ML的偏倚风险评估。gydF4y2B一个
Web of Science的搜索策略。gydF4y2B一个
MEDLINE的搜索策略。gydF4y2B一个
提取表。gydF4y2B一个
诊断准确性研究质量评估2工具;病人选择域。gydF4y2B一个
诊断准确性研究质量评估2工具;指数测试领域。gydF4y2B一个
诊断准确性研究质量评估2工具;参考标准域。gydF4y2B一个
诊断准确性研究质量评估2工具;流和时间域。gydF4y2B一个
改进的诊断准确性研究质量评估2工具用于本系统综述。gydF4y2B一个
诊断准确性研究的质量评估2 .在所有领域和适用性关注的每个纳入的研究中,偏见判断的工具风险。gydF4y2B一个
用于诊断的机器学习算法的性能总结。gydF4y2B一个
机器学习算法在筛选中的性能总结。gydF4y2B一个
剔除各林样地的异质性研究后的异质性值。gydF4y2B一个
诊断测试精度gydF4y2B一个
再gydF4y2B一个
最小二乘支持向量机gydF4y2B一个
马萨诸塞州眼耳医院gydF4y2B一个
机器学习gydF4y2B一个
二次判别分析gydF4y2B一个
诊断准确性研究的质量评估gydF4y2B一个
言语和语言治疗师gydF4y2B一个
马德里大学AutónomagydF4y2B一个
作者对生物医学工程师Munerah Al-Abdulsalam的支持和指导表示诚挚的感谢。gydF4y2B一个
没有宣布。gydF4y2B一个