JMIR皮肤病——人工智能成像模型的性能检测皮肤表现在高等Fitzpatrick肤色分类

短论文

普什卡Aggarwal, MBA

辛辛那提大学医学院,辛辛那提,哦,美国

通讯作者:

普什卡Aggarwal, MBA

医学院的

辛辛那提大学

伊甸园大街3230号

辛辛那提,哦,45267

美国

电话:1 2402000896

电子邮件:aggarwpr@mail.uc.edu

背景:深度学习图像识别模型的性能低于票面价值与Fitzpatrick分类应用于图像时皮肤类型4和5。

摘要目的:本研究的目的是评估图像识别模型是否执行不同的区分皮肤疾病在深色肤色的人(的肤质类型4和5)比白种人当区分相同的皮肤疾病(肤质类型1、2和3)两种模型训练时相同数量的图像。

方法:两个图像识别模型训练、验证和测试。每个模型的目的是区分黑色素瘤和基底细胞癌。开源黑色素瘤和基底细胞癌的图像从希腊获得皮肤地图集,皮肤病地图集,互动皮肤病地图集,DermNet新西兰。

结果:图像识别模型训练和验证与光图像肤色有更高的敏感性,特异性,阳性预测值,阴性预测值,和F1的分数比图像的图像识别模型训练和验证的皮肤颜色区分黑色素瘤和基底细胞癌。

结论:更高的个人的皮肤疾病的图片数量深色皮肤的颜色比图片的皮肤疾病患者光肤色需要执行同样聚集为人工智能模型。

JMIR北京医学2021;4 (2):e31697

doi: 10.2196/31697

关键字

深度学习; 黑素瘤; 基底细胞癌; 皮肤的颜色; 图像识别; 皮肤病学; 疾病; 卷积神经网络; 特异性; 预测; 人工智能; 皮肤的颜色; 肤色

背景

在皮肤,人工智能(AI)准备改善传统诊断方法的效率和准确性,包括外观检查、皮肤活检,病理组织检查(1]。深度学习图像识别模型在区分皮肤疾病有成功使用的图片浅肤色的人。然而,当这些模型测试图像的皮肤的颜色,性能下降(2]。人们认为这种差异的主要原因是缺乏可用的图像在深色肤色的人皮肤疾病(Fitzpatrick分类的皮肤类型4和5)(3]。然而,也可能即使相同数量的图像,图像识别模型将会更难区分皮肤疾病相比,个人的肤质类型4和5的皮肤类型1、2和3 ?

客观的

本研究的目的是评估图像识别模型是否执行不同的颜色区分皮肤疾病时个人(肤质类型4和5)比白种人当区分相同的皮肤疾病(肤质类型1、2和3)两种模型训练时同等数量的图像。

开源的黑色素瘤和基底细胞癌(BCC)从希腊获得皮肤阿特拉斯(4),皮肤病阿特拉斯(5],互动皮肤病地图集[6],DermNet新西兰(7]。两个图像识别模型训练、验证和测试使用方法如前所述[8]。TensorFlow [9),由谷歌开源软件库,用作深度学习框架,用于培训《盗梦空间》,版本3 (v3)。《盗梦空间》v3是深卷积神经网络。这个神经网络由多个计算层的层次结构,每个输入和输出。所有层除了最后一层的神经网络是pretrained超过120万的图像。最后一层的神经网络与聚集皮肤图像重新训练。在培训过程中,神经网络进行了训练和验证步骤。在训练步骤中,输入图像被用来训练神经网络。在验证步骤中,输入天真迭代图像被用来评估训练精度(10]。

后已经重新训练模型训练和验证,用户输入测试/评估步骤是执行测试图像输入和结果统计分析。项目评估输出的概率是用百分比来表示每个皮肤表现为每个测试图像输入。R软件(R统计计算的基础)11)被用来执行统计分析。敏感性,特异性,阳性预测值(PPV),阴性预测值(NPV), F1得分计算为每个皮肤表现。F1得分的调和平均数PPV敏感性和召回和精确的(平均)。

每个模型的目的是区分黑色素瘤和BCC。

第一个模型是:

训练150图片的浅肤色(肤质类型1、2和3),75黑素瘤和75 BCC图像;
验证在38个人与光的图像肤色(肤质类型1、2和3),19个黑色素瘤和19 BCC图像;
30日测试图像的浅肤色(肤质类型1、2和3),15个黑色素瘤和15 BCC图像。

第二个模型是:

训练150患者的皮肤图像的颜色(4和5的肤质类型),75黑素瘤和75 BCC图像;
验证在38个人皮肤的颜色的图片(4和5的肤质类型),19个黑色素瘤和19 BCC图像;
30日测试图像的皮肤的颜色(4和5的肤质类型),15个黑色素瘤和15 BCC图像。

接受者操作特征(AUC)曲线下面积为黑色素瘤和BCC计算来确定两个模型的性能。

当被要求区分黑色素瘤和BCC、图像识别模型训练和验证光的图像肤色有更高的敏感性,特异性,PPV, NPV, F1的分数比图像识别模型训练和验证图像的皮肤颜色(表1)。

在预测黑色素瘤,图像识别模型训练和验证图像的光肤色的敏感性为0.60,特异性为0.53,PPV的0.56,0.57的NPV, F1得分为0.58。另一方面,在预测黑色素瘤,相同的图像识别模型训练和验证图像的皮肤颜色的敏感性为0.53,特异性为0.47,PPV的0.50,0.50的NPV, F1得分为0.52分。

预测BCC、图像识别模型训练和验证图片的浅肤色的敏感性为0.53,特异性为0.60,PPV的0.57,0.56的NPV, F1得分为0.55。另一方面,BCC的预测,相同的图像识别模型训练和验证图像的皮肤颜色的敏感性为0.47,特异性为0.53,PPV的0.50,0.50的NPV, F1得分为0.48。

的平均AUC两个光肤色图像识别模型为0.598,相比0.500(值指出区别)的皮肤颜色图像识别模型(表1和图1)。

表1。统计措施深度学习模型的训练、测试和验证,在不同的肤质类型分类(类型1、2、3、4和5)类型评估黑色素瘤和基底细胞癌。

测量	黑色素瘤模型		基底细胞癌模型
	皮肤类型1、2和3	皮肤类型4和5	皮肤类型1、2和3	皮肤类型4和5
灵敏度	0.60	0.53	0.53	0.47
特异性	0.53	0.47	0.60	0.53
阳性预测值	0.56	0.50	0.57	0.50
消极的预测价值	0.57	0.50	0.56	0.50
F1的分数	0.58	0.52	0.55	0.48
接受者操作特征曲线下的面积	0.59	0.57	0.60	0.53

图1所示。接受者操作特性曲线为黑色素瘤和基底细胞癌(BCC)两个模型的每个不同的皮肤类型。舰队指挥官:Fitzpatrick分类。

限制

可用图像的数量有限的肤质类型4和5;因此,浅肤色和皮肤颜色模型研究了这个约束培训期间使用的图像。更大的样本量是更好的测试结果重现。

结论

当相同数量的图像用于培训、验证和测试,人工智能模型,提供皮肤黑色素瘤和BCC属于Fitzpatrick分类的图像类型1、2和3表现好于人工智能模型,提供皮肤中黑色素瘤和BCC的图像类型4和5。这可能是因为皮肤疾病可以有更多的变化表现在深色皮肤的人;此外,皮肤表现可能不是那么容易区别的周围皮肤深色皮肤的人。这样,更多的图像颜色的皮肤与皮肤疾病比图片浅肤色的皮肤疾病需要收集执行同样的人工智能模型。

的利益冲突

没有宣布。

帕特尔,王合资,Motaparthi K,李约翰。人工智能在皮肤科医生。在皮肤科诊所2021年3月,21日(8):e208 [免费的全文][CrossRef][Medline]
david Okello Kamulegeya LH, M, Bwanika JM, MusinguziD D, Lubega W, Rusoke D,等。使用人工智能在乌干达皮肤病条件:一个案例为机器学习训练数据集的多样性。bioRxiv。预印本网上发布2019年10月31日(免费的全文][CrossRef]
亚当森,史密斯答:机器学习和卫生保健皮肤之间的差距。JAMA北京医学2018年11月1日,154 (11):1247 - 1248。(CrossRef][Medline]
Verros CD。希腊皮肤地图集》2011。URL:http://www.hellenicdermatlas.com/en/[2021-09-02]访问
da Silva科幻。皮肤病学地图集》2021。URL:http://www.atlasdermatologico.com.br/[2021-09-02]访问
Usatine RP,马登BD。互动皮肤病地图集》2019。URL:https://www.dermatlas.net/[2021-09-02]访问
阿什顿奥克利,Suhonen R, R,新西兰怀卡托地区健康委员会,皮肤社会Inc . DermNet新西兰。URL:https://dermnetnz.org/[2021-09-02]访问
Aggarwal p .数据增加皮肤图像识别使用机器学习。皮肤Res抛光工艺2019;11月25 (6):815 - 820。(CrossRef][Medline]
陈Abadi M, Barham P,陈J, Z,戴维斯,院长J, et al。TensorFlow:大规模机器学习系统。出来了。预印本网上发布2016年5月27日(免费的全文]
张YC, Kagen AC。机器学习界面进行医学图像分析。J数字成像2017;10月30 (5):615 - 621 (免费的全文][CrossRef][Medline]
R核心团队。接待员:统计计算的语言和环境。奥地利维也纳:R统计计算的基础URL:http://www.R-project.org/[2021-09-02]访问

‎

人工智能:人工智能

AUC:接受者操作特征下的面积

BCC:基底细胞癌

净现值:消极的预测价值

PPV:阳性预测值

编辑R Dellavalle T Sivesind;提交30.06.21;同行评议的DN Mytle T Koritala;评论作者18.08.21;修订版本收到23.08.21;接受26.08.21;发表12.10.21

这是一个开放分布式根据条知识共享归属许可(https://creativecommons.org/licenses/by/4.0/),它允许无限制的使用、分配、和繁殖在任何媒介,提供原工作,首次出版于JMIR皮肤学研究,正确地引用。完整的书目信息,原始发布在http://derma.www.mybigtv.com上的链接,以及这个版权和许可信息必须包括在内。

本文在以下e-collection /主题问题:

人工智能成像模型的性能检测皮肤表现在高等Fitzpatrick肤色分类

人工智能成像模型的性能检测皮肤表现在高等Fitzpatrick肤色分类

短论文

通讯作者:

文摘

关键字

介绍

背景

客观的

方法

结果

讨论

限制

结论

的利益冲突

引用

缩写