发表在gydF4y2Ba在gydF4y2Ba9卷gydF4y2Ba10号gydF4y2Ba(2021)gydF4y2Ba: 10月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/28039gydF4y2Ba,首次出版gydF4y2Ba.gydF4y2Ba
基于集成学习的脉冲信号识别:分类模型开发研究gydF4y2Ba

基于集成学习的脉冲信号识别:分类模型开发研究gydF4y2Ba

基于集成学习的脉冲信号识别:分类模型开发研究gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba华东理工大学机械与动力工程学院智能感知与诊断研究所,上海gydF4y2Ba

2gydF4y2Ba上海中医药大学中医药诊断信息实验室,上海市健康识别与评估重点实验室,上海gydF4y2Ba

通讯作者:gydF4y2Ba

闫建军,DgydF4y2Ba

智能感知与诊断研究所“,gydF4y2Ba

机械与动力工程学院“,gydF4y2Ba

华东理工大学gydF4y2Ba

梅龙路130号gydF4y2Ba

上海,200237年gydF4y2Ba

中国gydF4y2Ba

电话:86 21 64252074gydF4y2Ba

电子邮件:gydF4y2Bajjyan@ecust.edu.cngydF4y2Ba


背景:gydF4y2Ba在脉冲信号分析与识别中,时域和时频域分析方法可以利用传统的机器学习方法获得可解释的结构化数据并建立分类模型。脉搏信号等非结构化数据包含丰富的心血管系统状态信息,利用深度学习可以提取非结构化数据的局部特征并进行分类。gydF4y2Ba

摘要目的:gydF4y2Ba本文的目标是综合运用机器学习和深度学习分类方法,充分挖掘脉搏信号的信息。gydF4y2Ba

方法:gydF4y2Ba采用时域和时频域分析方法获得结构化数据。采用支持向量机(SVM)构建分类模型,采用深度卷积神经网络(DCNN)核提取非结构化数据的局部特征,采用堆叠方法融合上述分类结果进行决策。gydF4y2Ba

结果:gydF4y2Ba使用单一分类器获得的平均准确率最高,为0.7914,而使用集成学习方法获得的平均准确率为0.8330。gydF4y2Ba

结论:gydF4y2Ba集成学习可以有效地利用结构化和非结构化数据中的信息,通过决策级融合提高分类精度。本研究为脉象信号分类提供了新的思路和方法,对脉象诊断客观化具有实用价值。gydF4y2Ba

JMIR Med Inform 2021;9(10):e28039gydF4y2Ba

doi: 10.2196/28039gydF4y2Ba

关键字gydF4y2Ba



脉搏信号包含大量的病理和生理信息[gydF4y2Ba1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba],且信号特征与疾病(高血压、动脉粥样硬化等),尤其是心血管疾病(CVD)和生理参数(脉搏波速、血压等)密切相关[gydF4y2Ba3.gydF4y2Ba,gydF4y2Ba4gydF4y2Ba].因此,脉象分析被广泛应用于心血管功能评估和CVD及相关并发症的无创早期诊断[gydF4y2Ba5gydF4y2Ba].它是一种方便、无创、有效的诊断方法,在中医中被广泛应用。近年来,智能可穿戴设备越来越受欢迎,可以让个人监测自己的脉搏状态。然而,脉象信号所包含的重要信息需要经验丰富的中医医师才能做出诊断,而诊断的变数很大[gydF4y2Ba6gydF4y2Ba].中医将脉冲分为28种单脉类型,主要依据4个因素:脉冲深度、脉冲频率、脉冲形状和脉冲强度[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba].病人的脉搏可能是几种单脉类型的组合,即复合脉搏[gydF4y2Ba8gydF4y2Ba],复合脉冲可能携带更多的生理信息,更难以区分和识别。例如,健康人主要以滑脉、平脉为主;脉搏微弱可能是由于用力过猛和气血不足所致;脉细可能与肝脏疾病有关;脉搏细滑可能与感冒有关;脉象细而细可能与肾脏疾病有关;而细滑的脉搏可能与咳嗽、头晕和虚弱有关。gydF4y2Ba

中医通过触摸患者手腕,用手指摸脉数分钟,根据经验确定患者的脉脉类型,并据此做出医疗决策。gydF4y2Ba

使用深度学习或机器学习方法,可以更好地对脉搏类型进行分类,以帮助医生进行诊断。对于没有医学背景和经验的个人,也可以通过可穿戴设备收集和分析获得的脉搏类型,初步了解其身体状况,可以更好地预防CVD。关于脉搏类型的分类已经有了大量的学术研究。许等[gydF4y2Ba9gydF4y2Ba]使用Lempel-Ziv复杂性分析来检测无节律脉冲。该方法应用于140个临床脉冲,检测出7种脉冲模式。张等[gydF4y2Ba10gydF4y2Ba]提到了基于实数惩罚的编辑距离(ERP)和k-近邻(KNN)分类器在脉冲波形分类中的应用进展。Garmaev等人[gydF4y2Ba11gydF4y2Ba]使用脉冲信号时间参数的聚类分析来对脉冲进行分类。聚类后,采用非参数Kruskel-Wallis检验对数据进行评价。李等[gydF4y2Ba12gydF4y2Ba]使用从医疗记录中提取的5种心血管疾病和并发症作为分类标准。该卷积神经网络(CNN)可以从脉冲信号中提取出更强的特征。黄等[gydF4y2Ba13gydF4y2Ba]开发了一种高维脉冲分类方法,以提高脉冲诊断的准确性。他们从时间、空间和频域提取了71个脉冲特征,以覆盖尽可能多的脉冲信息。gydF4y2Ba

但上述方法大多提取脉冲信号的结构化数据,适用于传统的机器学习模型;而非结构化数据,如脉冲信号,包含丰富的信息。利用不同的脉搏信号分析方法,结合机器学习和深度学习方法构建脉搏信号进行分类模型,可以帮助中医更好地诊断脉搏,帮助智能可穿戴设备更准确地评估人体健康状况。gydF4y2Ba

本文的目标是综合运用机器学习和深度学习分类方法,充分挖掘脉搏信号的信息。gydF4y2Ba


系统流图gydF4y2Ba

基于深度卷积神经网络(DCNN)和svm的堆叠网络(dsn)根据不同分析方法提取的结构化和非结构化数据,选择合适的算法构建分类模型,并采用堆叠方法进行整合;整体架构显示在gydF4y2Ba图1gydF4y2Ba.首先对脉冲信号进行预处理,提取时域和频域特征参数,并对脉冲信号的数据进行重组,为基础学习器的训练准备数据;选择一个SVM和一个DCNN作为基础学习器,建立三种分析方法对应的分类模型,并将输出结果组合在一起,形成新的数据集。最后,利用新生成的数据集对元学习器进行训练,构建dsn脉冲信号综合分类模型。gydF4y2Ba

‎gydF4y2Ba
图1。DSSN流程图。在数据预处理过程中,提取脉冲信号的时域和频域特征,并将所有脉冲数据组织成相同的长度。利用支持向量机分别训练时域特征和频域特征,得到预测结果。利用DCNN的一维数据得到预测结果。最后,利用FCNN对三种方法的脉冲类型预测结果进行整合。支持向量机:支持向量机;DCNN:深度卷积神经网络;dsn:基于DCNN和svm的堆叠网络;FCNN:全连接神经网络。gydF4y2Ba
查看此图gydF4y2Ba

数据gydF4y2Ba

本文实验数据由上海中医药大学四诊信息综合研究实验室提供,包括7类脉冲数据(4个单脉冲和3个复合脉冲),总样本量1812例;具体的脉冲类型和数字显示在gydF4y2Ba表1gydF4y2Ba.采集设备为Z-BOX I型脉冲采集仪,采样频率为720 Hz,采集最佳取脉压力下的脉冲信号,采集时间为60 s。两名或两名以上中医专家根据自己的经验对采集的脉象信号进行分类,当大多数专家同意分类时,脉象类型才被确定。gydF4y2Ba

表1。脉冲信号的类型和数据大小。有4个单脉冲和3个复脉冲。共收集了1812例病例。平衡样本数据后,样本总数达到4355个。gydF4y2Ba
脉冲类型代码gydF4y2Ba 脉冲类型名称gydF4y2Ba 样本量(n)gydF4y2Ba 平衡样本量(n)gydF4y2Ba
1gydF4y2Ba 湿滑的脉冲gydF4y2Ba 221gydF4y2Ba 637gydF4y2Ba
2gydF4y2Ba 平的脉冲gydF4y2Ba 96gydF4y2Ba 649gydF4y2Ba
3.gydF4y2Ba 纤细的脉冲gydF4y2Ba 92gydF4y2Ba 607gydF4y2Ba
4gydF4y2Ba 绳的脉冲gydF4y2Ba 657gydF4y2Ba 630gydF4y2Ba
5gydF4y2Ba 细滑的脉搏gydF4y2Ba 202gydF4y2Ba 583gydF4y2Ba
6gydF4y2Ba 细而细的脉冲gydF4y2Ba 325gydF4y2Ba 614gydF4y2Ba
7gydF4y2Ba 细滑的脉搏gydF4y2Ba 219gydF4y2Ba 635gydF4y2Ba

首先对实验数据进行预处理,对样本进行滤波降噪,对脉冲信号进行单周期分割,取平均单周期表示脉冲信号;中显示了七种类型的脉冲数据gydF4y2Ba图2gydF4y2Ba.这些数据集也存在样本不平衡的问题,采用合成少数群体过采样技术(SMOTE)算法对数据集进行均衡。对于样本不平衡的数据集,基本的方法是过采样和下采样(即复制少量样本,删除大量样本),但这两种方法都存在问题:复制样本容易使模型过拟合,而删除样本会导致样本数量减少。为了解决这类问题,综合新数据的采样SMOTE算法可以弥补样本的不平衡,同时尽量避免过拟合[gydF4y2Ba14gydF4y2Ba].gydF4y2Ba

‎gydF4y2Ba
图2。七种类型的脉搏。单脉冲有四种类型:光滑的、平坦的、细的和细的。复合脉冲有三种类型:细滑型、细滑型和细滑型。gydF4y2Ba
查看此图gydF4y2Ba

剔除数据集中采集失败且波形存在明显误差的样本后,均衡后的数据集中样本总数为4355个。每个类别的样本数量显示在gydF4y2Ba表1gydF4y2Ba.smte参数设置为gydF4y2BakgydF4y2Ba= 5;样本的多样性gydF4y2BaNgydF4y2Ba= 7的平坦,细脉冲;滑脉、细脉和滑脉、细脉和滑脉的样本多重数N = 3;和样本多重性gydF4y2BaNgydF4y2Ba= 2的细,弦脉冲。gydF4y2Ba

时域特征提取gydF4y2Ba

时域分析方法主要研究脉冲信号在一个典型周期内的波形[gydF4y2Ba15gydF4y2Ba],定义具有生理病理意义的特征点,然后提取相应的特征参数。在单周期脉冲信号中,波形的波峰点和波谷点具有一定的生理意义,主要有7个特征点,包括起始点和结束点,如图中标注的a - g所示gydF4y2Ba图3gydF4y2Ba.脉冲波形的参考点和意义显示在gydF4y2Ba表2gydF4y2Ba.利用信号处理算法可以自动进行时域特征提取。gydF4y2Ba

‎gydF4y2Ba
图3。单周期脉冲信号的基本信息。所述脉冲信号的幅度信息垂直表示,所述时间信息水平表示。gydF4y2Ba
查看此图gydF4y2Ba
表2。脉搏信号参考点的生理意义。这些点包括脉搏信号的起止点,以及脉搏信号的极值点,都在一定程度上反映了人体的生理信息。gydF4y2Ba
参考点gydF4y2Ba 意义gydF4y2Ba
收缩波形gydF4y2Ba

一个gydF4y2Ba 起点gydF4y2Ba

BgydF4y2Ba 主波峰gydF4y2Ba

CgydF4y2Ba 主波隙gydF4y2Ba

DgydF4y2Ba 重新与以前的浪尖作战gydF4y2Ba
舒张压波形gydF4y2Ba

EgydF4y2Ba 从中间峡谷向下gydF4y2Ba

FgydF4y2Ba 与浪潮抗争gydF4y2Ba

GgydF4y2Ba 终点gydF4y2Ba

本文共提取了脉冲信号的23个时域特征,包括1个斜率特征、2个面积特征、6个振幅特征、6个时间特征和8个比例特征;特征参数及其具体含义见gydF4y2Ba表3gydF4y2Ba.在提取脉冲波形参数时,为了更好地反映波形特征,添加了不同振幅之间的比值作为特征,如gydF4y2BahgydF4y2Ba2gydF4y2Ba/gydF4y2BahgydF4y2Ba1gydF4y2Ba而且gydF4y2BahgydF4y2Ba4gydF4y2Ba/gydF4y2BahgydF4y2Ba1gydF4y2Ba,因为不同脉冲波形之间的差异很大。同样,时间参数之间的比值增大,以更好地区分不同类型的脉冲信号。gydF4y2Ba

表3。脉冲信号的时域特征。这些特征包括1个坡度特征、2个面积特征、6个幅度特征、6个时间特征和8个比例特征。gydF4y2Ba
功能类型gydF4y2Ba 特性参数gydF4y2Ba 功能名称gydF4y2Ba
坡gydF4y2Ba kgydF4y2Ba 主波坡度gydF4y2Ba
区域gydF4y2Ba 一个gydF4y2Ba年代gydF4y2Ba 收缩面积gydF4y2Ba
一个gydF4y2BadgydF4y2Ba 舒张压区gydF4y2Ba
级gydF4y2Ba hgydF4y2Ba1gydF4y2Ba 主波振幅gydF4y2Ba
hgydF4y2Ba2gydF4y2Ba 主波谷振幅gydF4y2Ba
hgydF4y2Ba3.gydF4y2Ba 波前二旋幅值gydF4y2Ba
hgydF4y2Ba4gydF4y2Ba 二旋缺口振幅gydF4y2Ba
hgydF4y2Ba5gydF4y2Ba 二旋波振幅gydF4y2Ba
wgydF4y2Ba 1/3脉冲宽度gydF4y2Ba
时间gydF4y2Ba tgydF4y2Ba1gydF4y2Ba 主波相位gydF4y2Ba
tgydF4y2Ba2gydF4y2Ba 主波峡期gydF4y2Ba
tgydF4y2Ba3.gydF4y2Ba 波前二旋相gydF4y2Ba
tgydF4y2Ba4gydF4y2Ba 二硝基缺口相gydF4y2Ba
tgydF4y2Ba5gydF4y2Ba 二旋波相位gydF4y2Ba
TgydF4y2Ba 脉冲周期gydF4y2Ba
比例gydF4y2Ba tgydF4y2Ba1gydF4y2Ba/gydF4y2BaTgydF4y2Ba 时间比gydF4y2Ba
tgydF4y2Ba1gydF4y2Ba/gydF4y2BatgydF4y2Ba4gydF4y2Ba 时间比gydF4y2Ba
tgydF4y2Ba5gydF4y2Ba/gydF4y2BatgydF4y2Ba4gydF4y2Ba 时间比gydF4y2Ba
wgydF4y2Ba/ TgydF4y2Ba 脉宽周期比gydF4y2Ba
hgydF4y2Ba2gydF4y2Ba/gydF4y2BahgydF4y2Ba1gydF4y2Ba 主波峡谷主波振幅比gydF4y2Ba
hgydF4y2Ba4gydF4y2Ba/gydF4y2BahgydF4y2Ba1gydF4y2Ba 二棱缺口主波振幅比gydF4y2Ba
hgydF4y2Ba5gydF4y2Ba/gydF4y2BahgydF4y2Ba1gydF4y2Ba 二旋波主波振幅比gydF4y2Ba
一个gydF4y2Ba年代gydF4y2Ba/gydF4y2Ba一个gydF4y2BadgydF4y2Ba 收缩压:舒张面积比gydF4y2Ba

时频域特征提取gydF4y2Ba

小波包分析是一种利用不同小波基对信号进行分解的有效信号分析方法,在分析非平稳信号时具有较大的优势。小波包分析是一种时频分析方法,可以同时放大时域信息和频域信息,具有很好的时频局部分析能力。目前将其应用于脉冲信号的分析识别,取得了较好的效果[gydF4y2Ba16gydF4y2Ba].如gydF4y2Ba图4gydF4y2Ba作为小波包分解的示意图,小波包分析进一步分解了高频波段,同时分解了低频波段,提高了脉冲信号的时频分辨率。小波包分解的低频剖面和高频细节,gydF4y2BaugydF4y2BangydF4y2Ba(gydF4y2BatgydF4y2Ba),在不同频率下定义如下:gydF4y2Ba

在哪里gydF4y2BatgydF4y2Ba是时间,gydF4y2BakgydF4y2Ba时间是平移因子,和gydF4y2BaggydF4y2BakgydF4y2Ba而且gydF4y2BahgydF4y2BakgydF4y2Ba有一个正交关系,即,gydF4y2BaggydF4y2BakgydF4y2Ba= (1)gydF4y2BakgydF4y2BahgydF4y2Ba1 kgydF4y2Ba.定义系数的个数gydF4y2BajgydF4y2Ba层gydF4y2BangydF4y2BajgydF4y2Ba的能量gydF4y2BajgydF4y2Ba-th层如下所示:gydF4y2Ba

脉冲信号的采样频率为720hz,脉冲能量主要集中在10hz以内的频段。因此,通过8层小波包分解提取脉冲信号在不同频段的能量特征。对于生物信号的小波特征提取,sym8在小波的性能指标、特异性、灵敏度、准确性、时延和质量评估等方面均优于Haar、dB2和dB4 [gydF4y2Ba17gydF4y2Ba].sym8小波具有较好的规律性和对称性,可以减小计算过程中产生的相位畸变。结合上述分析,本文采用sym8小波对脉冲信号进行8层小波包分解,得到256维能量特征。信号处理算法可以自动提取信号的时域和频域特征。gydF4y2Ba

‎gydF4y2Ba
图4。小波包分解原理图。gydF4y2Ba
查看此图gydF4y2Ba

分类方法gydF4y2Ba

通过时域和时频域分析提取的脉冲信号特征为结构化数据,通过数据重组得到非结构化数据,得到脉冲信号的一维数据。对于结构化数据,应用了机器学习算法;对于非结构化数据,采用深度学习算法训练分类模型。最后,采用叠加法对所有结果进行整合。所使用的算法如下:gydF4y2Ba

1.SVM:该方法作为基础学习器,用于训练时域和时频域数据。惩罚参数C设为2.0,核设为rbf, gamma设为3.0。支持向量机分类器的输入是脉冲的时域特征和时频域特征。输出为七种脉冲类型的分类结果。gydF4y2Ba

2.DCNN:作为基础学习器,长度为800的脉冲信号是DCNN分类器的输入,输出是7种脉冲类型的分类结果。本文所使用的网络有三个卷积层。第一层设置为过滤器= 5,内核大小= 11。第二层设置为过滤器= 25,内核大小= 9。第三层设置为filters = 100, kernel size = 10。稠密层设置为units = 7, activation = softmax。gydF4y2Ba

3.FCNN:作为元学习器,输入是三个基本学习器的结果,标签与原始数据相同。输出为7种脉冲类型叠加后的分类结果。这个网络有四个密集的层。第一层和第二层设置为units = 1024和activation = relu。第三层设置为units = 512和activation = relu。最后一层设置为units = 7, activation = softmax。gydF4y2Ba

本文深层神经网络,包括FCNN被TensorFlow实现(谷歌)作为后端Keras框架,损失函数选为叉,批量大小的DCNN定于8日的批处理大小FCNN将32岁的迭代的数量是1000,最初的学习速率为0.001,随机梯度下降法(SGD)优化算法使用,动力为0.9,重量0.0001衰退,辍学参数为0.5,训练集、验证集和测试集的比例是6:2:2。为了避免网络训练带来的过拟合现象,采用了早期停止策略。当神经网络在验证集上的损失在10个周期内没有减少时,停止训练,选择验证集上损失最小的模型作为最终的训练结果。实验使用的CPU是Intel Core i7-8700K, 32 GB内存和NVIDIA Tesla V100 GPU显卡。gydF4y2Ba

本文的数据集包含多个脉冲类别,因此需要将每个类别的分类结果结合起来进行判断。本文以宏平均作为判断指标,计算平均准确率和平均召回率如下:gydF4y2Ba


SVM实验结果gydF4y2Ba

在训练SVM模型时,选择径向基函数(radial basis function, RBF)作为核函数,其中主要参数包括惩罚系数C和gamma。C表示对错误的接受程度;C值越大,训练过程中允许出现的分类误差越小,选择合适的C可以抑制模型的过拟合现象。这里,gamma是RBF的一个参数,用来调整模型支持向量的作用范围。gydF4y2Ba

为了找到对模型进行最佳分类的最佳参数,本文采用网格搜索法确定最优参数值。在训练具有时域特征和时频域特征的分类模型时,将C的参数范围设置为1-50,步长为1;gamma的参数范围为1 ~ 50,步长为0.5;其余参数使用默认值。优化分类模型的结果如图所示gydF4y2Ba表4gydF4y2Ba.gydF4y2Ba

表4。基于支持向量机的时频域特征分类结果gydF4y2Ba一个gydF4y2Ba.平均准确率是所有脉冲类型分类正确的百分比。平均召回率是分类结果中正确的脉冲类型与样本中脉冲类型的比率。精度是7种脉冲类型中每种脉冲精度的平均值。gydF4y2Ba
分类模型gydF4y2Ba 平均准确率(%)gydF4y2Ba 平均召回率(%)gydF4y2Ba 精度(%)gydF4y2Ba
时域特征+SVMgydF4y2Ba 79.2gydF4y2Ba 76.2gydF4y2Ba 76.1gydF4y2Ba
时频域特征+支持向量机gydF4y2Ba 74.6gydF4y2Ba 72.9gydF4y2Ba 72.8gydF4y2Ba

一个gydF4y2Ba支持向量机:支持向量机。gydF4y2Ba

从…可以看出gydF4y2Ba表4gydF4y2Ba时,时域分类模型的准确率高于相同分类器的时频域分类模型,达到76.1%,比时频域分类模型提高3.3%。同时,时域分类模型的平坦正确率和平均召回率分别为79.2%和76.2%,均高于时频域分类模型。gydF4y2Ba

DCNN实验结果gydF4y2Ba

为了验证本文使用的DCNN的分类性能,选取视觉几何组(Visual Geometry Group, VGG)-11和VGG-16两个神经网络进行对比实验。实验中,VGG-11采用标准网络结构,VGG-16采用改进的网络结构。两个cnn的初始学习率均为0.0001,其余参数均与DCNN相同。实验结果显示在gydF4y2Ba表5gydF4y2Ba.gydF4y2Ba

表5所示。不同CNN的分类结果gydF4y2Ba一个gydF4y2Ba结构。平均准确率是所有脉冲类型分类正确的百分比。平均召回率是分类结果中正确的脉冲类型与样本中脉冲类型的比率。精度是7种脉冲类型中每种脉冲精度的平均值。gydF4y2Ba
分类模型gydF4y2Ba 平均准确率(%)gydF4y2Ba 平均召回率(%)gydF4y2Ba 精度(%)gydF4y2Ba
VGGgydF4y2BabgydF4y2Ba-11年gydF4y2Ba 74.4gydF4y2Ba 74.7gydF4y2Ba 74.7gydF4y2Ba
VGG-16gydF4y2Ba 77.3gydF4y2Ba 77.3gydF4y2Ba 77.4gydF4y2Ba
DCNNgydF4y2BacgydF4y2Ba 79.1gydF4y2Ba 78.9gydF4y2Ba 79.1gydF4y2Ba

一个gydF4y2BaCNN:卷积神经网络。gydF4y2Ba

bgydF4y2BaVGG:视觉几何组。gydF4y2Ba

cgydF4y2BaDCNN:深度卷积神经网络。gydF4y2Ba

从…可以看出gydF4y2Ba表5gydF4y2Ba, DCNN的准确率最高,为4.4%,较VGG-11和VGG-16分别提高1.7%。在平均准确率和平均召回率方面,VGG-11网络在三种模型中最低,分别比最高的DCNN低4.7%和1.8%。gydF4y2Ba

dsn实验结果gydF4y2Ba

为了客观评价本文提出的dsn模型的有效性,比较了模型的基本学习器,实验结果如图所示gydF4y2Ba表6gydF4y2Ba.gydF4y2Ba

表6所示。不同算法的分类结果。平均准确率是所有脉冲类型分类正确的百分比。平均召回率是分类结果中正确的脉冲类型与样本中脉冲类型的比率。精度是7种脉冲类型中每种脉冲精度的平均值。gydF4y2Ba
分类模型gydF4y2Ba 平均准确率(%)gydF4y2Ba 平均召回率(%)gydF4y2Ba 精度(%)gydF4y2Ba
时频域特征+支持向量机gydF4y2Ba一个gydF4y2Ba 74.6gydF4y2Ba 72.9gydF4y2Ba 72.8gydF4y2Ba
时域特征+SVMgydF4y2Ba 79.2gydF4y2Ba 76.2gydF4y2Ba 76.1gydF4y2Ba
DCNNgydF4y2BabgydF4y2Ba 79.1gydF4y2Ba 78.9gydF4y2Ba 79.1gydF4y2Ba
DSSNgydF4y2BacgydF4y2Ba 83.2gydF4y2Ba 82.9gydF4y2Ba 83.3gydF4y2Ba

一个gydF4y2Ba支持向量机:支持向量机。gydF4y2Ba

bgydF4y2BaDCNN:深度卷积神经网络。gydF4y2Ba

cgydF4y2Badsn:基于DCNN和svm的堆叠网络。gydF4y2Ba

从…可以看出gydF4y2Ba表6gydF4y2BaDSSN模型的分类准确率在五种方法中最高,达到83.3%。在平均准确率和平均召回率方面,dsn模型率比最低时频域特征模型分别提高了8.6%和10%,比其余最高DCNN模型分别提高了4.1%和4%。gydF4y2Ba


单独使用机器学习或深度学习对脉冲信号进行分类效果不佳,将两者结合起来进行学习可以提高脉冲信号的分类精度。同时,可以吸收已有的关于脉搏信号可解释特征的研究成果,利用科技开发的深度学习算法进一步挖掘脉搏信号所承载的信息。gydF4y2Ba

基于支持向量机的七种脉冲类型分类结果比较gydF4y2Ba

从…可以看出gydF4y2Ba图5gydF4y2Ba而且gydF4y2Ba6gydF4y2Ba,在光滑、细滑、细滑、细滑、细滑、细滑、细滑、细滑、细滑、细滑、细滑脉冲中,时域分类模型的识别精度均高于时频域分类模型,分别达到83%、78%、77%、59%、67%、76%,较时频域分类模型提高2% ~ 8%。而时频域分类模型对平坦脉冲的识别率最高,达到95%,比时域分类模型提高了1%。gydF4y2Ba

‎gydF4y2Ba
图5。支持向量机分类的时域特征混淆矩阵。支持向量机:支持向量机。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图6。基于支持向量机的时频域特征混淆矩阵分类。支持向量机:支持向量机。gydF4y2Ba
查看此图gydF4y2Ba

总体而言,时域分类模型略优于时频域分类模型。除细线脉冲外,其余脉冲类型的识别精度没有显著差异。从图中还可以看出,细绳脉冲和细滑脉冲是分类精度最低的脉冲类型,其中大部分被错误地归类为细绳脉冲。在时域分类模型中,细脉冲、细脉冲和滑脉冲的识别错误率分别为27%和23%;在时频域分类模型中,识别错误率分别为27%和20%。出现这种情况的原因可能是细线、细线脉冲和细滑脉冲都具有细线脉冲的特征,分类器难以准确判断其脉冲类型,导致误分类。gydF4y2Ba

由于本文提取了大量的时域特征,因此只选取了部分特征进行统计分析,如图所示gydF4y2Ba表7gydF4y2Ba.在七种脉冲数据中,主要波形为斜率gydF4y2BakgydF4y2Ba其中滑脉最大,且主波振幅最大gydF4y2BahgydF4y2Ba1gydF4y2Ba仅次于弦状滑脉,表现出滑脉主波高陡的特点。三分之一脉冲宽度gydF4y2BawgydF4y2Ba和脉宽周期比gydF4y2BawgydF4y2Ba/gydF4y2BaTgydF4y2Ba的弦脉冲在七种脉冲中最大,显示了弦脉冲宽主波的波形特征。主波振幅gydF4y2BahgydF4y2Ba1gydF4y2Ba在细脉、滑脉中,主波坡度最大gydF4y2BakgydF4y2Ba只比滑脉低了1 / 3的脉宽gydF4y2BawgydF4y2Ba和脉宽周期比gydF4y2BawgydF4y2Ba/gydF4y2BaTgydF4y2Ba较大,说明弦滑脉冲同时具有弦滑脉冲的波形特征,这与两种脉冲的特征一致。gydF4y2Ba

表7所示。部分时域特征的统计分析结果。7种脉冲类型的特征参数为h1、k、w和w/T。gydF4y2Ba
特征参数gydF4y2Ba 湿滑的脉冲gydF4y2Ba 平的脉冲gydF4y2Ba 细滑的脉搏gydF4y2Ba 纤细的脉冲gydF4y2Ba 细而细的脉冲gydF4y2Ba 细滑的脉搏gydF4y2Ba 绳的脉冲gydF4y2Ba
hgydF4y2Ba1gydF4y2Ba 610.701±206.724gydF4y2Ba 514.706±121.698gydF4y2Ba 356.757±93.869gydF4y2Ba 400.857±139.692gydF4y2Ba 407.703±157.803gydF4y2Ba 636.707±227.226gydF4y2Ba 592.404±228.413gydF4y2Ba
kgydF4y2Ba 6.609±2.241gydF4y2Ba 5.886±1.394gydF4y2Ba 3.912±1.002gydF4y2Ba 3.662±1.161gydF4y2Ba 3.957±1.468gydF4y2Ba 6.329±2.420gydF4y2Ba 5.919±2.543gydF4y2Ba
wgydF4y2Ba 0.126±0.018gydF4y2Ba 0.143±0.031gydF4y2Ba 0.140±0.030gydF4y2Ba 0.199±0.034gydF4y2Ba 0.205±0.043gydF4y2Ba 0.176±0.036gydF4y2Ba 0.207±0.044gydF4y2Ba
wgydF4y2Ba/gydF4y2BaTgydF4y2Ba 0.162±0.023gydF4y2Ba 0.165±0.036gydF4y2Ba 0.185±0.040gydF4y2Ba 0.214±0.035gydF4y2Ba 0.247±0.038gydF4y2Ba 0.220±0.033gydF4y2Ba 0.245±0.038gydF4y2Ba

时域特征不仅反映了脉冲信号的波形特征,而且具有一定的生理和病理意义。主波的振幅,gydF4y2BahgydF4y2Ba1gydF4y2Ba,反映左心室的射血功能和主动脉的顺应性;主波地峡的振幅,gydF4y2BahgydF4y2Ba2gydF4y2Ba,与预排斥波振幅具有相同的意义,gydF4y2BahgydF4y2Ba3.gydF4y2Ba,血管硬化或外周阻力增加导致振幅增加gydF4y2BahgydF4y2Ba2gydF4y2Ba而且gydF4y2BahgydF4y2Ba3.gydF4y2Ba.下降地峡的振幅,gydF4y2BahgydF4y2Ba4gydF4y2Ba,反映外围阻力的大小。排斥波的大小,gydF4y2BahgydF4y2Ba5gydF4y2Ba,反映主动脉的顺应性水平。相位的大小gydF4y2BatgydF4y2Ba1gydF4y2Ba反映左室射血时间的快速性;地峡降相的大小gydF4y2BatgydF4y2Ba4gydF4y2Ba和排斥波相位gydF4y2BatgydF4y2Ba5gydF4y2Ba分别反映左心室收缩期和舒张期的长度。脉冲周期gydF4y2BaTgydF4y2Ba表示脉搏的一个周期,对应左心室的一个心脏周期。降地峡主波振幅、gydF4y2BahgydF4y2Ba4gydF4y2Ba/gydF4y2BahgydF4y2Ba1gydF4y2Ba,反映外围阻力水平;排斥波主波振幅之比,gydF4y2BahgydF4y2Ba5gydF4y2Ba/gydF4y2BahgydF4y2Ba1gydF4y2Ba,反映血管顺应性。时间比gydF4y2BatgydF4y2Ba1gydF4y2Ba/gydF4y2BaTgydF4y2Ba反映心脏射血功能的速率,当射血功能速率降低时,射血功能速率增加[gydF4y2Ba18gydF4y2Ba].时频域分析中采用小波包分析提取脉冲信号在不同频段的能量幅度,其分布反映了血管的弹性变化[gydF4y2Ba19gydF4y2Ba],这也有一定的生理意义。gydF4y2Ba

在分类算法中,SVM使用核RBF将特征参数映射到高维空间中,以提供不同类别之间更好的可区分性。在此空间下训练分割超平面,使分类模型具有识别不同脉冲类型的能力。因此,时域和时频域特征从不同角度表征脉冲信号,可以与SVM算法相结合,获得更好的分类结果。gydF4y2Ba

VGG-11、vg -16和DCNN 7种脉冲类型分类结果比较gydF4y2Ba

图7gydF4y2Ba-gydF4y2Ba9gydF4y2Ba显示三种神经网络在七种脉冲数据集上的混淆矩阵图。从图中可以看出,DCNN在除平坦脉冲外的所有类别脉冲的识别精度均较VGG-11和VGG-16有不同程度的提高。与VGG-11相比,DCNN对细滑脉冲和细滑脉冲的识别率提高了6%,对细滑脉冲和细滑脉冲的识别率提高了5%。与VGG-16相比,除平坦脉冲外,其余各类脉冲识别率均提高1% ~ 4%。在平坦脉冲识别率方面,VGG-16的准确率最高,达到98%,比DCNN提高了3%。复合脉冲的整体识别率较低,大部分误分类样本被归类为复合脉冲所包含的单脉冲类型,这可能是由于复合脉冲具有构成其单脉冲类型中的两种特征,导致分类器无法正确识别其脉冲类型,这与时域和时频域分类模型的结果相似。总体而言,DCNN的分类性能优于vg -11和vg -16。gydF4y2Ba

‎gydF4y2Ba
图7。VGG-11测得的七种脉冲的混淆矩阵。矩阵的对角线元素表示不同类型脉冲的预测精度。VGG:视觉几何组。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图8。VGG-16测得7种脉冲的混淆矩阵。矩阵的对角线元素表示不同类型脉冲的预测精度。VGG:视觉几何组。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图9。DCNN对七种脉冲的混淆矩阵进行了分析。矩阵的对角线元素表示不同类型脉冲的预测精度。DCNN:深度卷积神经网络。gydF4y2Ba
查看此图gydF4y2Ba

七种脉冲类型DSSN分类结果的比较gydF4y2Ba

它可以从gydF4y2Ba图10gydF4y2Ba与三种基本学习器相比,dsn模型在所有七个脉冲类别的识别率都有不同程度的提高,与每种基本学习器类别的最高识别率相比,分别提高了3%、2%、4%、1%、10%、5%和10%。其中,细脉、细脉、滑脉、细脉的改善效果最高,更大程度上降低了识别错误率。此外,DSSN模型在各类别的识别精度均高于DCNN模型。其中,弦状脉冲的识别率比DCNN模型提高了10%,其余脉冲类型提高了1% ~ 7%。因此,DSSN可以整合多基学习器的优点,有效提高模型的识别精度。与现有的脉冲信号分类模型相比,DSSN也具有更好的分类识别效果。gydF4y2Ba

‎gydF4y2Ba
图10。dsn的混淆矩阵。DSSN:基于深度卷积神经网络(DCNN)和支持向量机(SVM)的堆叠网络。gydF4y2Ba
查看此图gydF4y2Ba

虽然中医教科书对脉搏类型有明确的描述,但不同的中医从业者往往根据自己的经验和对脉搏的理解,对脉诊的解释不同[gydF4y2Ba20.gydF4y2Ba].即使是同一位中医,在不同的情况下,对相似的脉象也可能做出不同的诊断。利用机器学习和深度学习方法进行脉象分类,可以帮助中医更好地进行脉象诊断,提高结果的客观性。采用dsn方法,复合脉冲的识别正确率可达70%以上,单脉冲的识别正确率可达85%以上,最好的可达97%。如果能丰富实验样本,提高样本的平衡性,就能进一步提高脉冲分类的精度,在可穿戴设备上有广阔的应用前景。gydF4y2Ba

局限性和结论gydF4y2Ba

现有的脉冲分类工作主要是通过机器学习或深度学习进行的。本文采用机器学习模型(SVM)和深度学习网络(DCNN)对脉冲进行分类,但结果并不理想。通过dsn方法,将机器学习和深度学习的分类结果进行集成,得到更准确的脉冲类型预测结果。中医从业人员可使用此方法辅助中医脉象诊断,避免主观性带来的不确定性。可穿戴设备还可以利用这种方法来确定用户的脉搏类型,从而预测用户的健康状况,这也与某些疾病的预防有关。同时,本实验也有一些需要改进的地方。首先,脉冲的样本数据要尽可能大,这将在一定程度上有助于提高准确率。其次,对所采集脉搏信号类型的诊断应与多位中医专家的诊断结果相结合,进一步提高数据的客观性。gydF4y2Ba

大量的原始脉冲波研究产生了许多可解释的特征,对脉冲波分类也取得了许多研究成果。如果只使用深度学习进行分类,将很难使用前人的研究成果。深度学习特征工程和结构化特征反映了不同的脉冲特征信息,两者可以互补。因此,中医学者可以在原始脉冲分析的基础上,结合技术发展的深度学习算法的优势,充分利用深度学习特征工程和人工构造特征获得的信息,构建集成的分类器,提供更好的分类结果。gydF4y2Ba

致谢gydF4y2Ba

国家自然科学基金项目(no. 82074332, 81673880, 81302913),上海市科委基金项目(no. 82074332, 81673880, 81302913)资助。19441901100),上海市科学技术基金资助项目(no.;21 dz2271000)。gydF4y2Ba

作者的贡献gydF4y2Ba

JY, XC和SC设计了这项研究。XC和SC进行数据分析。XC撰写稿件,JY对稿件进行修改,RG, HY, YW协助采集样本。所有作者均已阅读并批准稿件。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

  1. O'Rourke M, Pauca A,姜欣。中国临床药物学杂志2001 6;51(6):507-522 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  2. 李志强,李志强,李志强,等。Physiol Res 2009 Dec;58(4):473-479 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. Safar ME, Levy BI, Struijker-Boudier H.高血压和心血管疾病中动脉僵硬和脉压的当前观点。循环2003 6月10日;107(22):2864-2869。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. 山山A,富山H,新井T,广濑KI,幸治Y,平山Y,等。肱踝脉波速度作为动脉粥样硬化血管损伤和心血管风险的标志。Hypertens Res 2003 8月;26(8):615-622 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. 柯恩J,芬克尔斯坦S,麦克维G,摩根D, LeMay L,罗宾逊J,等。无创脉波分析用于早期发现血管疾病。高血压1995 9月26日(3):503-508。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  6. 安森CYT。中医脉诊定量研究综述。插入:补充当前运行状态。圣保罗:马塞洛·萨阿德;2012:61 - 80。gydF4y2Ba
  7. 李志勇,张敏,申帅。用心血管模拟器研究脉搏的深度、速率、形状和强度。Evid Based Complement Alternat Med 2017年12月;2017(11-12):2867191-2867800 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. 徐立林,孟MQ,王kq。基于模糊神经网络的脉冲图像识别。IEEE工程医学生物学报2007年12月;2007(11-12):3148-3151。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  9. 徐磊,张东,王凯,王磊。基于Lempel-Ziv复杂度分析的心律失常脉冲检测。EURASIP J Adv信号处理2006 3月26日;2006(1):1-12。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  10. 张东,左伟,张东,张宏,李宁。基于实罚编辑距离的脉冲波形分类。EURASIP J Adv信号处理2010年8月30日;2010(1):1-8。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  11. Garmaev BZ, Boronoev VV, Naguslaeva IV, Ompokov VD。基于时间参数聚类分析的脉冲波分类。J Phys: Conf Ser 2019 May 04;1210:012048-012048。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  12. 李国强,李国强,李国强。基于卷积神经网络的脉冲波模式分类方法。科学通报2019 10月17日;9(1):14930-14800 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. 黄春春,王玉梅,Smith S.基于高维特征的高精度脉象诊断。数学与生物科学学报2020 Oct 09;17(6):6775-6790 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  14. Fernandez A, Garcia S, Herrera F, Chawla N. SMOTE从不平衡数据中学习:进步与挑战,纪念15周年。jair 2018年4月20日;61:863-905。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  15. 陈永华,杨昌昌,曹庆峰,李婷婷,尚玉生。几种时频分析方法的比较。地球物理进展2006 12月21日(4):1180-1185。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  16. 郭强,王凯,张东。基于小波包的胆囊炎和肾病综合征诊断的脉冲波形分析。2008年发表于:小波分析与模式识别国际会议;2008;中国香港,第30-31页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  17. Deepa R, Rajaguru H, Ganesh Babu C.小波特征和Softmax判别分类器在癫痫检测中的分析。2020年12月发表于:IOP会议系列:材料科学与工程;2020.12.11;印度泰米尔纳德邦,p. 012036-012038。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  18. 张伟,张勇,张松。小波与神经网络在脑血管病脉搏表现分析与模式识别中的应用。上海生物医学工程学报2008;29(2):84-86。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  19. 胡霞,朱辉,徐娟。基于深度卷积神经网络的腕部脉搏信号分析。2014年发表于:IEEE生物信息学计算智能计算生物学会议;2014;檀香山,HI,美国,第21-24页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  20. 李丽玲,关斌,陈超,陈宏,孔凯,李伟,等。人工智能与中医相遇:开启脉象识别魔盒的桥梁。数字医学2021年3月;4(1):1-8 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
有线电视新闻网:gydF4y2Ba卷积神经网络gydF4y2Ba
心血管疾病:gydF4y2Ba心血管病gydF4y2Ba
DCNN:gydF4y2Ba深度卷积神经网络gydF4y2Ba
DSSN:gydF4y2Ba基于DCNN和svm的堆叠网络gydF4y2Ba
ERP:gydF4y2Ba编辑距离与实际惩罚gydF4y2Ba
FCNN:gydF4y2Ba全连接神经网络gydF4y2Ba
资讯:gydF4y2Ba再gydF4y2Ba
RBF:gydF4y2Ba径向基函数gydF4y2Ba
SGD:gydF4y2Ba随机梯度下降gydF4y2Ba
杀:gydF4y2Ba合成少数派过采样技术gydF4y2Ba
支持向量机:gydF4y2Ba支持向量机gydF4y2Ba
中医:gydF4y2Ba中药gydF4y2Ba
VGG:gydF4y2Ba视觉几何组gydF4y2Ba


C·洛维斯编辑;提交18.02.21;王l, D Oladele, D Hu同行评审;对作者10.07.21的评论;订正后收到12.08.21;接受25.09.21;发表21.10.21gydF4y2Ba

版权gydF4y2Ba

©闫建军,蔡湘蕾,陈松野,郭睿,闫海霞,王宜琴。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 2021年10月21日。gydF4y2Ba

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,https://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba


Baidu
map