这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到http://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
12导联心电图(ECG)是诊断心血管疾病最常用的方法。然而,有一些可能的心电图误解可能是由几个不同的因素引起的,比如胸部电极的错位。
本研究的目的是建立先进的算法来检测心前(胸部)电极错位。
在这项研究中,我们使用传统的机器学习(ML)和深度学习(DL)来自动检测电极V1和V2的错位。算法使用从诊断为心肌梗死、诊断为左心室肥厚或ECG正常的患者的高分辨率体表电位图中提取的数据进行训练。
在本研究中,DL检测V1和V2电极错位的准确率最高,第二肋间隙错位的准确率为93.0% (95% CI 91.46-94.53)。对第二肋间隙DL的表现进行基准测试的医生(n=11,年龄47.3岁,SD 15.5)具有阅读心电图的经验(过去一年阅读心电图的平均次数为436.54,SD 397.9)。医生在心电图上识别胸电极错位的能力较差,平均准确率为60% (95% CI 56.09-63.90),明显低于DL (
与经验丰富的医生相比,DL在检测胸部电极错位方面提供了最好的表现。深度学习和机器学习可以用来帮助标记被错误记录的心电图,并标记数据可能存在缺陷,这可以减少错误诊断的数量。
临床医生经常面临的挑战是如何理解大量高维和异构的数据,以便为他们的临床决策提供信息。糟糕的临床决策可能无法提供正确的诊断和治疗,这可能对患者安全和医疗保健费用产生重大影响[
心血管疾病在本质上是异质性和复杂性的,因为它们可以由过多的环境、遗传或行为因素引起。为了诊断心脏病,提供不正确的数据,如心电图(ECG)数据会对临床决策产生很大影响。已知的错误是由于将心前电极(胸部电极:V1、V2、V3、V4、V5和V6)放置在错误的位置而导致的心电图记录错误,导致错误的ECG信号被医生解释为告知患者诊断体征和治疗计划。护士或心电图技师记录心电图时,许多内科医生和心脏病专家通常不在场,这使情况变得更加复杂[
研究表明,电极V2记录的信号对错位非常敏感,其次是电极V3、V1和V4,而电极V5和V6的心电图形态变化不大[
根据一项研究,不正确的电极放置可能导致17%至24%的患者诊断错误[
迄今为止,该领域的研究主要集中在检测肢体电极交换的算法开发上[
本研究的目的是确定记录心电图时检测V1和V2电极错位的ML和DL算法的性能(因为V1和V2电极错位也可能导致其他胸部电极错位[V3-V6]),并对一组医生的性能进行基准测试。
脑电图(V1和V2电极)从高分辨率BSPM (
体表电位图。字母后面的符号表示列号,数字后面的符号表示行号。
心电数据集由三种不同的受试者类型组成,包括正常心电图和显示心肌梗死和左室左室的心电图。在这项研究中,我们对453例患者进行了心电图检查(正常:n=151, LVH: n=151, MI: n=151)。每个心电图以300 Hz的采样频率采集。对于每个BSPM,我们提取了一个正确的ECG和一个错误的ECG(电极V1和V2错位)。这提供了一个自然的类平衡,其中50%的情况是正确的,50%是不正确的。这一点很重要,因为当算法在每个类中暴露于相同数量的案例时,它们的性能会得到提高,从而避免偏差和最大化
本研究的数据管道使用了3个阶段(数据工程、分析和交付)。(a)数据工程阶段,包括数据收集(从体表电位图中提取心电图)和数据准备(从提取的数据中去除噪声)。(b)分析阶段,包括传统机器学习(线性支持向量机、二次支持向量机、精细决策树、粗决策树、逻辑回归、袋状树)和深度学习(卷积神经网络、双向长短期记忆网络)。(c)用于展示传统机器学习和深度学习模型推断的交付阶段。双向长短期记忆;CNN:卷积神经网络;心电图:心电图。
考虑到每个患者有一个ECG周期,使用公式1将信号归一化以减少信号失真和基线漂移。
其中s[n]为输入信号,y[n]为输出信号。
在特征提取方面,采用3种不同的方法提取了共16个心电特征:(1)时域特征(我们考虑了6个时域特征,包括p波幅度、PR间隔、QRS起始值、r波峰值幅度、QRS偏移量和s波幅度);(2)统计域特征(包括心电信号的均值、SD、偏度和峰度;皮尔逊相关系数;以及V1和V2电极之间的均方根误差(考虑到这些电极通常错位在一起),以及(3)时频特征。后者涉及使用4个级别和一个符号母小波函数的离散小波变换,4个详细系数(D1, D2, D3和D4)和4个近似系数(A1, A2, A3和A4)。我们还考虑了D4的最大值、最小值和平均值作为特征。
在特征选择方面,采用滤波和包装相结合的混合特征选择算法。采用互信息特征选择、最大相关最小冗余、联合互信息(JMI)、熵和救济等不同的滤波方法对16个特征进行排序。其次,对排序特征执行反向消除算法,以找到一组最优特征作为ML分类器的输入。反向消去算法从全部16个特征开始,逐个特征去除,直到获得最佳结果。
对于分类,我们使用了6个ML分类器。这涉及到三种不同类型决策树(DT)的使用:(1)精细DT,它用于制作许多叶子,使树能够在类别之间做出细微的区分;(2)粗DT (CDT),用于生成少量叶子,使树能够粗略区分类别;(3)袋装树,使用带替换的自举生成多个训练数据集,并从多个树中获取大部分结果。数据将用公式2表示。
其中X代表特征,Y代表类。
基尼杂质(Gini杂质,GI)是将树分成树枝的分裂标准。在本研究中,有两个类别:(1)标签0代表不正确的电极放置类别,(2)标签1代表正确的电极放置类别。公式3用于计算每个类的GI。
其中n为类别的数量,PI为数据集中标记为类别I的受试者的比例。
除了DT技术,我们还使用了支持向量机(SVM)和逻辑回归(LR)的变体。这包括一个线性支持向量机,它包含两个平行的超平面,这些超平面被选择用于将数据集分成两个类,其中超平面之间的距离(边距)应该尽可能大。方程4和5描述了两个超平面。
其中w表示每个特征对应的权值,x表示数据集的特征,b表示偏项。在这个超平面之上或在这个超平面上的情况应该属于类1,而在这个超平面之下的情况应该属于类0。
采用二次支持向量机,利用二次核函数将数据集分成两类。线性支持向量机与二次支持向量机的区别在于使用核函数来分割案例。最后,我们使用了LR或logit,因为这是一种用于二元分类的常用统计技术。该技术使用公式6计算的对数赔率(L),它表示特征和模型参数的线性组合。
在α0系数为模型参数,xn为特征。
Odds (o)计算是使用式7计算赔率时使用的指数,对应的概率使用式8计算。
深度学习不需要特征工程(即特征提取和选择)。因此,原始的心电信号在不指定特征的情况下被送入深度神经网络。深度学习可以包含不同类型的网络和架构。本研究使用了两种不同的深度学习网络:(1)卷积神经网络(cnn)和(2)双向长短期记忆(BLSTM)网络。CNN已经使用15层组成1输入层(ECG信号用来喂养),3隐藏卷积层(它使用一个过滤器与一个可变长度将输入信号转换成一个卷积层),3批标准化层(用于正常化前一层的输出减去均值的批处理和划分这批的SD), 3修正线性单元层(一个激活函数,用于删除负值),2个max-pool层(将前一层的序列输出合并成一个单一的值,以减少网络中的参数和计算量),1个全连接层(将一层中的每个神经元连接到下一层的每个神经元),1个soft-max层(使用LR为每个类生成概率),1个最终分类输出层。BLSTM网络包括1个序列输入层、2个BLSTM隐藏层(用于在每个时间步长通过每个完整的时间序列学习网络)、1个全连接层、1个soft-max层和1个分类输出层。
一项基于网络的调查,包括30张随机的V1和V2心电图(V1和V2正确放置的心电图[n=15]和V1和V2不正确放置的心电图[n=15]),通过电子邮件发送给2019年国际计算机心电学会会议和2019年心脏病学计算会议的20名参与者。在20名参与者中,有11人回应了调查。他们被要求对V1和V2进行分类,以及它们是否被正确放置。此外,他们还被问及他们的年龄、就业状况和阅读心电图的经历(他们在过去一年中阅读的心电图次数)。共有11名医生回应了这项基于网络的调查。由英国北爱尔兰阿尔斯特大学计算机、工程和建筑环境学院批准。
如前所述,使用三个不同的域(1)时域,(2)统计域和(3)时频域提取16个特征。
经过特征选择后,对6种分类器进行了应用,在第2种ICS中,检测错位的分类器准确率最高的是bagged DT,其次是CDT、fine DT、LR、二次SVM和线性SVM。
特性id和描述。
特性ID | 域 | 功能描述 |
1 | 时间 | 纵波振幅 |
2 | 时间 | 公关间隔 |
3. | 时间 | QRS起始值 |
4 | 时间 | R振幅 |
5 | 时间 | QRS值结束 |
6 | 时间 | 横波振幅 |
7 | 统计 | 心电图平均值一个信号 |
8 | 统计 | 心电图方差 |
9 | 统计 | 心电信号SD |
10 | 统计 | 心电图偏度 |
11 | 统计 | 心电信号峰度 |
12 | 时频域 | D4的最大值b |
13 | 时频域 | D4的最小值 |
14 | 时频域 | D4的平均值 |
15 | 统计 | V1和V2心电图的相关系数 |
16 | 统计 | V1和V2心电图的均方根误差 |
一个心电图:心电图。
bD4:分解系数
对于第三种集成电路的电极错位检测,分类器准确率最高的也是袋装DT,其次是CDT、LR、二次支持向量机、线性支持向量机和精细DT。
使用机器学习的特征工程分类器的准确性。
分类器 | 第二个ICS的准确率百分比一个 | 第三次ICS的准确率 | |||||||||
|
Entropy15 | JMIb15 | mifc14 | MRMRd13 | RELIEF16 | ENTROPY14 | JMI16 | MIFS14 | MRMR15 | RELIEF16 | |
好树 | 85 | 85 | 85 | 82 | 84 | 60 | 59 | 60 | 58 | 59 | |
粗树 | 87 | 87 | 87 | 85 | 87 | 69 | 69 | 69 | 69 | 69 | |
物流 | 82 | 82 | 83 | 81 | 82 | 64 | 63 | 65 | 63 | 63 | |
支持向量机e | 78 | 78 | 75 | 76 | 78 | 59 | 60 | 61 | 61 | 60 | |
Q-SVMf | 79 | 79 | 78 | 79 | 79 | 58 | 60 | 62 | 60 | 60 | |
袋装 | 88 | 92 | 90 | 92 | 90 | 69 | 70 | 66 | 69 | 70 |
一个ICS:肋间隙。
bJMI:联合互信息。
cMIFS:互信息特征选择。
dMRMR:最大关联最小冗余。
eSVM:支持向量机。
fQ-SVM:二次支持向量机。
在特征选择算法中,MIFS13等上标代表了提供良好准确率的最佳特征数量。
如前所述,使用不同的体系结构开发了两个不同的深度学习网络。与CNN (
使用两个深度学习网络的分类精度。
分类器 | 第二个ICS的准确率百分比一个 | 第三次ICS的准确率 |
BLSTMb | 93.0 | 74.7 |
美国有线电视新闻网c | 92.3 | 73.5 |
一个ICS:肋间隙。
b双向长短期记忆。
cCNN:卷积神经网络。
接收器工作特性曲线和其他指标结果用于深度学习和机器学习,用于检测第二和第三肋间隙的电极错位。双向长短期记忆;CNN:卷积神经网络;PNT:阴性检验的预测能力;PPT:阳性检验的预测性。
对11名有阅读心电图经验的医生(年龄47.3岁,SD 15.5)(过去一年平均解读心电图数436.54,SD 397.9)的表现进行评价,采用F1(平均0.57,SD 0.14)、灵敏度(平均54.5%,SD 15)、特异性(平均65.4%,SD 21)和准确性(平均60%,SD 15)检测第二ICS (
医生将心电图分类为正确记录或在第二肋间隙记录V1和V2错位的表现:(a)医生的表现和(b)深度学习表现与医生在不同指标下的表现的比较。误差柱采用95% CI(常数=1.96)推导;淡红色条代表深度学习的表现,而其他颜色(绿色、浅蓝色和紫色)代表医生的表现(分别是最佳、平均和最低的表现)。
在医学文献综述的基础上,心电图电极错位是影响心电图解读的最关键问题之一[
更一般地说,这项研究是特别独特的,因为许多研究都集中在证明DL通过自动解释x射线或心电图来诊断患者的能力,而这项研究则侧重于使用DL来检测医疗错误。使用深度学习来诊断病人似乎受到了严厉的批评,因为深度学习缺乏透明度,而且它的决策逻辑不能轻易地向最终用户解释。因此,用于诊断的深度学习引发了许多信任问题,因此可能不会被广泛采用。然而,如果黑箱系统被用于其他子任务,比如检测错误,而不是提供患者诊断,医生可能会接受黑箱系统。
这项研究有一些局限性。数据集是有限的,仅包含三种类型的患者(心肌梗死、左心室肥厚或正常窦性心律)。因此,在进一步的研究中,需要包括新类型的患者病例,以增加数据集的大小,提高深度学习的性能。此外,人工检测到正确或不正确心电图的参与者数量很少(n=11),其局限性在于该队列可能不是ML算法基准测试的代表性样本。然而,这些结果可以作为未来研究的方向。所使用的算法本质上是二进制的,并且没有在许多不同类型的错位和ECG记录的变化上进行测试。因此,所有胸部电极(V1-V6)应包含一个小的随机变化。所提出的算法在现实环境中的表现可能不像研究中那样准确,因为算法需要在不同的环境中对患者病例和不同的数据集进行前瞻性测试。此外,由于V1和V2的错位也会导致剩余引线(V3-V6)的错位,因此还需要进一步了解V3-V6电极错位的影响。医生在检测V1和V2电极错位时的表现很可能在现实世界中比我们指示受试者的要低
实现本研究中发明的算法可以提高心电数据的质量,从而可以改善心脏护理的决策。我们可以得出结论,与基于ml的模型和经验丰富的医生的能力相比,深度学习在检测胸部电极错位方面提供了最好的性能。因此,医疗器械行业应考虑深度DL检测胸部电极错位。结果清楚地表明,错位越大(即在第二次ICS中),模型精度越高。因此,在我们未来的研究中,我们的目标是使用rSr ' prime替代技术提高第三次ICS中检测胸部电极错位的准确性。然而,在医疗保健中采用这些算法将需要时间和昂贵,因为它可能需要前瞻性测试作为试验的一部分,并得到不同监管机构(如食品和药物管理局)的批准。然而,考虑到该算法用于标记潜在错误,而不提供诊断或建议治疗,风险可能不那么严重。可能还有其他成本,包括员工培训和将算法集成到心电图机中。未来的工作还将涉及显著性图的生成,可以用来解释深度学习算法是如何做出决策的。这将促进知识发现,并可能导致新的心电图特征是电极错位的特征。
双向长短期记忆
体表电位图
粗决策树
卷积神经网络
深度学习
决策树
心电图
基尼杂质
肋间隙
联合互信息
逻辑回归
左室肥厚
心肌梗死
机器学习
欧盟特别计划机构
支持向量机
这项工作得到了欧盟INTERREG VA项目的支持,该项目由欧盟特别项目机构(SEUPB)管理。本研究中表达的观点和意见不一定反映欧洲委员会或SEUPB的观点和意见。
没有宣布。