卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIgydF4y2B一个

JMIR Med InformgydF4y2B一个

JMIR医学信息学gydF4y2B一个

2291 - 9694gydF4y2B一个

卡塔尔世界杯8强波胆分析

加拿大多伦多gydF4y2B一个

v10i8e36427gydF4y2B一个

35916701gydF4y2B一个

10.2196/36427gydF4y2B一个

审查gydF4y2B一个

医学图像分类中的不确定度估计:系统综述gydF4y2B一个

洛维斯gydF4y2B一个

基督教gydF4y2B一个

RezkgydF4y2B一个

埃曼gydF4y2B一个

NnejigydF4y2B一个

格蕾丝gydF4y2B一个

KurzgydF4y2B一个

亚历山大gydF4y2B一个

MScgydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0001-6175-9203gydF4y2B一个

豪泽gydF4y2B一个

卡佳gydF4y2B一个

MScgydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0001-9390-3505gydF4y2B一个

MehrtensgydF4y2B一个

•亚历山大gydF4y2B一个

MScgydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0003-1234-5041gydF4y2B一个

Krieghoff-HenninggydF4y2B一个

伊娃gydF4y2B一个

博士学位gydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0001-8381-3100gydF4y2B一个

HeklergydF4y2B一个

阿齐姆gydF4y2B一个

MScgydF4y2B一个 1gydF4y2B一个

https://orcid.org/0000-0002-4974-2457gydF4y2B一个

凯丝gydF4y2B一个

雅各布·尼古拉斯gydF4y2B一个

med教授gydF4y2B一个 2gydF4y2B一个

https://orcid.org/0000-0002-3730-5348gydF4y2B一个

FrohlinggydF4y2B一个

StefangydF4y2B一个

med教授gydF4y2B一个 3.gydF4y2B一个

https://orcid.org/0000-0001-7907-4595gydF4y2B一个

冯•勒•gydF4y2B一个

创造者gydF4y2B一个

med教授gydF4y2B一个 4gydF4y2B一个

https://orcid.org/0000-0001-9221-3297gydF4y2B一个

BrinkergydF4y2B一个

提图斯约瑟夫gydF4y2B一个

医学博士gydF4y2B一个 1gydF4y2B一个

肿瘤组数字生物标志物gydF4y2B一个德国癌症研究中心gydF4y2B一个

我是纽恩海默，280号gydF4y2B一个

海德堡69120gydF4y2B一个

德国gydF4y2B一个 49 62213219304gydF4y2B一个 titus.brinker@nct-heidelberg.degydF4y2B一个

https://orcid.org/0000-0002-3620-5919gydF4y2B一个

1gydF4y2B一个肿瘤组数字生物标志物gydF4y2B一个德国癌症研究中心gydF4y2B一个

海德堡gydF4y2B一个

德国gydF4y2B一个 2gydF4y2B一个医学三系gydF4y2B一个亚琛工业大学附属医院gydF4y2B一个

亚琛gydF4y2B一个

德国gydF4y2B一个 3.gydF4y2B一个转化医学肿瘤科gydF4y2B一个国家肿瘤疾病中心(NCT)gydF4y2B一个德国癌症研究中心gydF4y2B一个

海德堡gydF4y2B一个

德国gydF4y2B一个 4gydF4y2B一个临床转化科学系gydF4y2B一个柏林卫生研究所(BIH)gydF4y2B一个

柏林gydF4y2B一个

德国gydF4y2B一个

通讯作者:Titus Josef BrinkergydF4y2B一个 titus.brinker@nct-heidelberg.degydF4y2B一个

8gydF4y2B一个 2022gydF4y2B一个

2gydF4y2B一个 8gydF4y2B一个 2022gydF4y2B一个

10gydF4y2B一个 8gydF4y2B一个

e36427gydF4y2B一个

14gydF4y2B一个 1gydF4y2B一个 2022gydF4y2B一个 8gydF4y2B一个 3.gydF4y2B一个 2022gydF4y2B一个 11gydF4y2B一个 4gydF4y2B一个 2022gydF4y2B一个 4gydF4y2B一个 6gydF4y2B一个 2022gydF4y2B一个

©Alexander Kurz, Katja Hauser, Hendrik Alexander Mehrtens, Eva Krieghoff-Henning, Achim Hekler, Jakob Nikolas Kather, Stefan Fröhling, Christof von Kalle, Titus Josef Brinker。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com)， 02.08.2022。gydF4y2B一个

2022gydF4y2B一个

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息，到https://medinform.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。gydF4y2B一个

背景gydF4y2B一个

深度神经网络在不同的医学图像分类任务中显示出令人印象深刻的结果。然而，对于现实世界的应用，有必要估计网络的不确定性及其预测。gydF4y2B一个

客观的gydF4y2B一个

在这篇综述中，我们探讨了不确定度估计以何种形式应用于医学图像分类任务。我们还研究了使用哪些度量来描述应用的不确定性估计的有效性gydF4y2B一个

方法gydF4y2B一个

Google Scholar、PubMed、IEEE Xplore和ScienceDirect在2016年至2021年间发表的同行评审研究中进行了筛选，这些研究涉及医学图像分类中的不确定性估计。搜索词“不确定度”、“不确定度估计”、“网络校准”和“分布外检测”与术语“医学图像”、“医学图像分析”和“医学图像分类”结合使用。gydF4y2B一个

结果gydF4y2B一个

通过系统评价过程，共选择22篇论文进行详细分析。本文提供了一个表，以系统地比较所包括的关于估计不确定度的应用方法的工作。gydF4y2B一个

结论gydF4y2B一个

不确定性估计的方法多种多样，但最常用的是基于采样的蒙特卡罗Dropout和深度集成方法。我们的结论是，未来的工作可以研究不确定性估计在人工智能系统和人类专家协作设置中的好处。gydF4y2B一个

国际注册报告标识符(IRRID)gydF4y2B一个

rr2 - 10.2196/11936gydF4y2B一个

估计的不确定性gydF4y2B一个网络校准gydF4y2B一个 out-of-distribution检测gydF4y2B一个医学图像分类gydF4y2B一个深度学习gydF4y2B一个医学成像gydF4y2B一个

介绍gydF4y2B一个概述gydF4y2B一个

数字图像分析是一个有用的工具，支持医生在他们的临床决策。最初，数字图像分析是通过从输入图像中提取手工特征来完成的。这些特征可以调整到基础数据，这意味着对于特定的疾病，只能在观察到的图像中寻找特定的特征。然而，随着深度学习的出现，已经建立了一个“黑盒子”，可以在监督学习的设置下，从本质上从标记数据中学习这些特征。近年来，基于深度学习的方法大大优于依赖手工特征的传统方法。使用基于学习的方法，重点已经从手动定义图像特征转移到为学习系统提供干净和正确注释的数据。然而，对于以数据为中心的方法，出现了新的挑战。gydF4y2Ba

在临床环境中，当这些算法被用作诊断辅助工具时，用户必须能够理解人工智能(AI)系统是如何得出诊断的。这方面的一个关键组成部分是衡量人工智能系统对其预测的信心。这种措施对于增加对人工智能系统的信任非常重要，并且可能会改善临床决策[gydF4y2B一个 1gydF4y2B一个］.我们将使用术语“不确定性估计”来评估模型置信度。当人工智能系统为其不确定性提供衡量标准时，医疗专家可以格外小心地对待高度不确定性的预测。另一方面，人类专家可以更好地信任人工智能系统的预测，因为它报告的不确定性很低。在本研究中，我们回顾了近年来在医学图像分类任务中应用不确定性估计方法的出版物。深度神经网络中的不确定性估计是一个活跃的研究领域，目前最流行的方法是从2016年开始提出的。在下一节中，我们将概述最突出的不确定性估计方法。gydF4y2Ba

在结果部分，我们通过它们应用的不确定性估计方法对评审作品进行分类。我们提供了一个表格，作为所有纳入研究的概述。在最后一节中，我们讨论了评估不确定性评估收益的最常用指标，并展望了未来可能的研究方向，重点是人机协作。gydF4y2B一个

技术背景gydF4y2B一个

在分类任务中，神经网络应该预测给定输入的可能性gydF4y2B一个 xgydF4y2B一个属于阶级gydF4y2B一个 ygydF4y2B一个从固定数量的可能类别中。神经网络的输出可以解释为所有类的概率分布，每个单独的值表明输入属于各自类的可能性有多大。gydF4y2B一个

在公式中，预测分布可表示为:gydF4y2B一个

给定输入的预测分布gydF4y2B一个 xgydF4y2B一个训练数据gydF4y2B一个 DgydF4y2B一个被描述为对似然的积分gydF4y2B一个 p (y | x,θ)gydF4y2B一个与以前的gydF4y2B一个 p(θ| D)gydF4y2B一个根据模型参数计算gydF4y2B一个 θgydF4y2B一个．在深度神经网络中，这个积分不能解析计算。因此，试图在神经网络中捕捉不确定性的方法试图近似预测分布。gydF4y2B一个

根据模型的不确定性，预测不确定性可分为任意不确定性和认知不确定性。任意不确定性描述了数据中固有的不确定性，而认知不确定性捕获了模型的不确定性。典型分类网络的softmax输出只能捕获任意不确定性[gydF4y2B一个 2gydF4y2B一个］.gydF4y2B一个

不确定度估计方法gydF4y2B一个

Ovadia等[gydF4y2B一个 3.gydF4y2B一个比较了几种常用的不确定度估计方法。在这项工作中，我们命名了我们发现最受欢迎的方法，并请读者参考各自的作品，以详细描述所提出的方法。我们将这些方法分为(1)模型抽样，(2)单网络方法和(c)数据增强。gydF4y2B一个

模型抽样gydF4y2B一个

基于抽样的方法很容易实现，因为它们利用了现有的网络架构。最流行的两种方法是蒙特卡罗退出法(MCDO) [gydF4y2B一个 4gydF4y2B一个]及深层合奏[gydF4y2B一个 5gydF4y2B一个］.这两种方法都依赖于多个神经网络的集合或带有dropout层的神经网络的多次预测运行来计算预测的不确定性。gydF4y2B一个

单网方式gydF4y2B一个

直接修改网络结构以改进不确定性估计的领域是相当多样化的。在MCDO的推导中，作者将他们的方法与高斯过程(GPs)进行了比较。GP是一种估计函数分布的方法[gydF4y2B一个 6gydF4y2B一个]，可用于估计神经网络中的不确定性。gydF4y2B一个

被Ovadia等人纳入比较的方法[gydF4y2B一个 3.gydF4y2B一个]包括随机变分推理(SVI) [gydF4y2B一个 7gydF4y2B一个]及温标(TS) [gydF4y2B一个 8gydF4y2B一个］.SVI将变分推理的概念应用于深度神经网络，而TS是一种事后方法。通过对网络输出应用比例因子，TS可以改善网络校准。另一个值得一提的方法是证据深度学习(EDL) [gydF4y2B一个 9gydF4y2B一个］.EDL拟合网络输出的狄利克雷分布来估计网络的不确定性。gydF4y2B一个

数据增加gydF4y2B一个

与采样多个模型相比，也可以通过在输入数据的不同增量上运行网络来计算预测的分布。艾汉和贝伦斯[gydF4y2B一个 10gydF4y2B一个提出了一种改进任意不确定性估计的方法，称为测试时间数据增强(TTA)。gydF4y2B一个

方法gydF4y2B一个数据提取gydF4y2B一个

在系统综述中，我们通过Google Scholar、PubMed、IEEE Xplore和ScienceDirect进行检索，找出将不确定度估计方法应用于医学图像分类的相关作品。我们将搜索范围限制在2016年1月至2021年10月之间出现的作品。作为搜索词，我们使用了“不确定性”、“不确定性估计”、“网络校准”和“分布外检测”，并将它们与术语“医学图像”、“医学图像分析”和“医学图像分类”结合起来。gydF4y2B一个

选择过程gydF4y2B一个

甄选过程是根据“系统评审及综合分析首选报告项目”指引[gydF4y2B一个 11gydF4y2B一个］.我们从数据库搜索中找到了320篇可能相关的出版物。在标题和摘要筛选过程中，我们丢弃了大部分作品，因为它们要么根本没有估计不确定性，要么处理了其他图像分析问题，如图像分割。从第一轮筛选中，选出65篇论文进行全文分析。在全文分析过程中，我们丢弃了其他几个作品，因为它们被证明要处理其他问题，包括语义分割。最终，22篇论文被纳入综述。gydF4y2B一个图1gydF4y2B一个可视化选择过程。gydF4y2B一个

图1gydF4y2B一个

PRISMA(系统评价和荟萃分析的首选报告项目)流程图。gydF4y2B一个

结果gydF4y2B一个论文分类gydF4y2B一个

图2gydF4y2B一个提供在所有审查的作品中应用方法的概述。请注意，大多数包括的工作应用不止一种方法进行不确定度估计。我们观察到，大多数工作应用基于采样的方法(即MCDO和Deep Ensembles)。在我们表示为单一网络方法的类别中，所有相应的方法几乎都是相等的。最后，我们包括的4个作品应用TTA来计算不确定性估计。gydF4y2B一个

图2gydF4y2B一个

应用各自不确定性估计方法的出版物数量。EDL:证据深度学习;GP:高斯过程;MCDO:蒙特卡洛辍学生;SVI:随机变分推理;TS:温度结垢;TTA:测试时数据增强。gydF4y2Ba

所包括的大多数工作通过计算不确定性度量(主要是预测方差或预测熵)来评估应用的方法。这种不确定度度量通常用于生成保留数据和准确性评估。gydF4y2B一个图3gydF4y2B一个显示了Filos等人研究中保留数据与准确性图的示例[gydF4y2B一个 2gydF4y2B一个］.从图中可以看出，当只保留更确定的样本时，保留数据的准确性增加。不确定度估计的方法根据它们在保留的数据上提高精度的程度进行排序。gydF4y2B一个

图3gydF4y2B一个

保留数据与Filos等人的准确度图[gydF4y2B一个 2gydF4y2B一个］.平均场变分推理。gydF4y2B一个

其中一些研究着重于网络校准，并试图在实验中降低预期校准误差(ECE)。其他一些工作使用计算的不确定度测量来检测偏离分布(OOD)的样本。gydF4y2B一个表1gydF4y2B一个提供所有包含作品的概述。在接下来的章节中，我们将简要介绍每个研究的内容。gydF4y2B一个

表1gydF4y2B一个

所选研究的概述。gydF4y2B一个

方法gydF4y2B一个	器官或疾病gydF4y2B一个	传感器gydF4y2B一个	网络体系结构gydF4y2B一个	报告的度量标准gydF4y2B一个	数据访问gydF4y2B一个	代码gydF4y2B一个	参考gydF4y2B一个
MCDOgydF4y2B一个^{一个gydF4y2B一个},医生gydF4y2B一个^{bgydF4y2B一个}	眼底图像显示的糖尿病视网膜病变gydF4y2B一个	相机gydF4y2B一个	自定义有线电视新闻网gydF4y2B一个^{cgydF4y2B一个}	保留数据或准确性，不确定性或密度gydF4y2B一个	公众(Kaggle比赛)gydF4y2B一个	是的gydF4y2B一个	Leibig等[gydF4y2B一个 12gydF4y2B一个］gydF4y2B一个
MCDO, SVIgydF4y2B一个^{dgydF4y2B一个}	视网膜gydF4y2B一个	光学相干层析成像gydF4y2B一个	ResNet-18gydF4y2B一个	预测方差gydF4y2B一个	公共gydF4y2B一个	是的gydF4y2B一个	Laves等人[gydF4y2B一个 13gydF4y2B一个］gydF4y2B一个
MCDOgydF4y2B一个	皮肤癌gydF4y2B一个	相机gydF4y2B一个	VGG-16, ResNet-50, DenseNet-169gydF4y2B一个	不确定度或密度，保留数据或准确性，不确定度，混淆矩阵gydF4y2B一个	公共gydF4y2B一个	是的gydF4y2B一个	Mobiny等[gydF4y2B一个 14gydF4y2B一个］gydF4y2B一个
MCDOgydF4y2B一个	大脑gydF4y2B一个	核磁共振成像gydF4y2B一个^{egydF4y2B一个}	修改VGGNetgydF4y2B一个	可靠性图，AUROCgydF4y2B一个^{fgydF4y2B一个}	私人gydF4y2B一个	是的gydF4y2B一个	Herzog等[gydF4y2B一个 15gydF4y2B一个］gydF4y2B一个
MCDOgydF4y2B一个	乳腺癌gydF4y2B一个	乳房x光检查gydF4y2B一个	VGG-19gydF4y2B一个	不确定性，混淆矩阵gydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	Caldéron-Ramírez等[gydF4y2B一个 16gydF4y2B一个］gydF4y2B一个
MCDO, DUQgydF4y2B一个^{ggydF4y2B一个}	新型冠状病毒肺炎gydF4y2B一个	x射线gydF4y2B一个	WideResNetgydF4y2B一个	Jensen-Shannon散度gydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	Caldéron-Ramírez等[gydF4y2B一个 17gydF4y2B一个］gydF4y2B一个
MCDO，合奏，MFVIgydF4y2B一个^{hgydF4y2B一个}	眼底图像显示的糖尿病视网膜病变gydF4y2B一个	相机gydF4y2B一个	VGG变体gydF4y2B一个	保留数据或准确性，保留数据或AUROC, ROCgydF4y2B一个^{我gydF4y2B一个}	公众(Kaggle比赛)gydF4y2B一个	是的gydF4y2B一个	Filos等[gydF4y2B一个 2gydF4y2B一个］gydF4y2B一个
MCDO，集合，m头gydF4y2B一个	组织病理学的幻灯片gydF4y2B一个	显微镜gydF4y2B一个	DenseNetgydF4y2B一个	保留数据或AUROCgydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	Linmans等[gydF4y2B一个 18gydF4y2B一个］gydF4y2B一个
MCDO，合奏，混乱gydF4y2B一个	组织病理学的幻灯片gydF4y2B一个	显微镜gydF4y2B一个	ResNet-50gydF4y2B一个	ECEgydF4y2B一个^{jgydF4y2B一个}auroc, auprcgydF4y2B一个^{kgydF4y2B一个}	私人gydF4y2B一个	没有gydF4y2B一个	Thagaard等[gydF4y2B一个 19gydF4y2B一个］gydF4y2B一个
MCDO,乐团gydF4y2B一个	COVID-19，组织病理学载玻片(乳腺癌)gydF4y2B一个	CTgydF4y2B一个^{lgydF4y2B一个},显微镜gydF4y2B一个	ResNet-152-V2、Inception-V3、Inception-ResNet-V2gydF4y2B一个	预测熵，保留的数据或准确性gydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	杨氏和冯氏[gydF4y2B一个 20.gydF4y2B一个］gydF4y2B一个
MCDO，合奏，TWDgydF4y2B一个^{米gydF4y2B一个}	皮肤癌gydF4y2B一个	相机gydF4y2B一个	ResNet-152, Inception- ResNet-V2, DenseNet-201, MobileNet-V2gydF4y2B一个	熵,AUROCgydF4y2B一个	公众(Kaggle竞赛，ISIC数据集)gydF4y2B一个	没有gydF4y2B一个	Abdar等[gydF4y2B一个 21gydF4y2B一个］gydF4y2B一个
MCDO，合奏，其他gydF4y2B一个	肺gydF4y2B一个	x射线gydF4y2B一个	WideResNetgydF4y2B一个	AUROC, AUPRCgydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	Berger等[gydF4y2B一个 22gydF4y2B一个］gydF4y2B一个
全科医生gydF4y2B一个	眼底图像显示的糖尿病视网膜病变gydF4y2B一个	相机gydF4y2B一个	Inception-V3gydF4y2B一个	AUROCgydF4y2B一个	公众(Kaggle比赛)gydF4y2B一个	是的gydF4y2B一个	托莱多-科特斯等[gydF4y2B一个 23gydF4y2B一个］gydF4y2B一个
联盟gydF4y2B一个^{ngydF4y2B一个}+集合体gydF4y2B一个	胸部gydF4y2B一个	x射线gydF4y2B一个	densenet - 121gydF4y2B一个	AUROCgydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	盖苏等[gydF4y2B一个 24gydF4y2B一个］gydF4y2B一个
Edl + MCDOgydF4y2B一个	乳腺癌gydF4y2B一个	乳房x光检查gydF4y2B一个	VGGNetgydF4y2B一个	AUROCgydF4y2B一个	公共+私有gydF4y2B一个	没有gydF4y2B一个	Tardy等[gydF4y2B一个 25gydF4y2B一个］gydF4y2B一个
联盟gydF4y2B一个	胸部，腹部和脑部gydF4y2B一个	x光，超声波，核磁共振gydF4y2B一个	densenet - 121gydF4y2B一个	AUROC，覆盖面或F1得分，覆盖面或AUROCgydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	盖苏等[gydF4y2B一个 26gydF4y2B一个］gydF4y2B一个
TSgydF4y2B一个^{ogydF4y2B一个}, MCDOgydF4y2B一个	息肉gydF4y2B一个	结肠镜检查(相机)gydF4y2B一个	densenet resnet - 101 - 121gydF4y2B一个	ECE，预测熵，预测方差gydF4y2B一个	公共+私有gydF4y2B一个	没有gydF4y2B一个	Carneiro等[gydF4y2B一个 27gydF4y2B一个］gydF4y2B一个
TS, DCAgydF4y2B一个^{pgydF4y2B一个}	头部CT，乳房x光，胸部x光，组织学gydF4y2B一个	多通道gydF4y2B一个	AlexNet,gydF4y2B一个ResNet-50,gydF4y2B一个densenet - 121,gydF4y2B一个SqueezeNetgydF4y2B一个	ECEgydF4y2B一个	公共gydF4y2B一个	没有gydF4y2B一个	Liang等[gydF4y2B一个 28gydF4y2B一个］gydF4y2B一个
TTAgydF4y2B一个^{问gydF4y2B一个}	眼底图像显示的糖尿病视网膜病变gydF4y2B一个	相机gydF4y2B一个	ResNet-50gydF4y2B一个	不确定度或密度，保留数据或AUROCgydF4y2B一个	公众(Kaggle比赛)gydF4y2B一个	是的gydF4y2B一个	艾汉和贝伦斯[gydF4y2B一个 10gydF4y2B一个］gydF4y2B一个
TTA,gydF4y2B一个MCDO,gydF4y2B一个MCBNgydF4y2B一个^{rgydF4y2B一个}，gydF4y2B一个乐团gydF4y2B一个	皮肤癌gydF4y2B一个	相机gydF4y2B一个	ResNet-50gydF4y2B一个	ECEgydF4y2B一个	私人(31,000张注释图像)gydF4y2B一个	没有gydF4y2B一个	Jensen等[gydF4y2B一个 29gydF4y2B一个］gydF4y2B一个
Tta + MCDOgydF4y2B一个	皮肤癌gydF4y2B一个	相机gydF4y2B一个	Efficient-Net-B0gydF4y2B一个	预测熵，预测方差，巴塔查里亚系数，保留数据或准确性gydF4y2B一个	公共(ISIC数据集)gydF4y2B一个	没有gydF4y2B一个	Combalia等[gydF4y2B一个 30.gydF4y2B一个］gydF4y2B一个
TTA, TS，合奏gydF4y2B一个	眼底图像显示的糖尿病视网膜病变gydF4y2B一个	相机gydF4y2B一个	修改ResNetgydF4y2B一个	可靠性图，AECEgydF4y2B一个^{年代gydF4y2B一个}，保留数据或AUROCgydF4y2B一个	公众(Kaggle比赛)gydF4y2B一个	是的gydF4y2B一个	Ayhan等[gydF4y2B一个 31gydF4y2B一个］gydF4y2B一个

^{一个gydF4y2B一个}蒙特卡洛辍学生。gydF4y2B一个

^{bgydF4y2B一个}GP:高斯过程。gydF4y2B一个

^{cgydF4y2B一个}CNN:卷积神经网络。gydF4y2B一个

^{dgydF4y2B一个}SVI:随机变分推理。gydF4y2B一个

^{egydF4y2B一个}MRI:磁共振成像。gydF4y2B一个

^{fgydF4y2B一个}AUROC:受者工作曲线下的面积。gydF4y2B一个

^{ggydF4y2B一个}DUQ:确定性不确定性量化。gydF4y2B一个

^{hgydF4y2B一个}平均场变分推理。gydF4y2B一个

^{我gydF4y2B一个}ROC:接受者工作曲线。gydF4y2B一个

^{jgydF4y2B一个}ECE:预期校准误差。gydF4y2B一个

^{kgydF4y2B一个}AUPRC:精确召回曲线下面积。gydF4y2B一个

^{lgydF4y2B一个}CT:计算机断层扫描。gydF4y2B一个

^{米gydF4y2B一个}三向决策理论。gydF4y2B一个

^{ngydF4y2B一个}EDL:证据深度学习。gydF4y2B一个

^{ogydF4y2B一个}TS:温标。gydF4y2B一个

^{pgydF4y2B一个}DCA:置信度与准确度之差。gydF4y2B一个

^{问gydF4y2B一个}TTA:测试时数据增强。gydF4y2B一个

^{rgydF4y2B一个}MCBN:蒙特卡罗批规范。gydF4y2B一个

^{年代gydF4y2B一个}AECE:自适应预期校准误差。gydF4y2B一个

Sampling-Based方法gydF4y2B一个

我们纳入的第一个工作是Leibig等人的研究[gydF4y2B一个 12gydF4y2B一个]，将MCDO应用于糖尿病视网膜病变的分类任务。为了评估应用的不确定性估计方法的影响，作者报告了保留数据与精度曲线。这意味着不确定预测的一小部分被丢弃，并评估丢弃不确定样本如何提高测试数据集的准确性。结果表明，丢弃20%或更多的最不确定样本可以显著提高神经网络的准确性。在他们的工作中，作者将MCDO的性能与另一种实现的GP进行了比较，发现MCDO在保留数据上的准确性优于准确性评估。gydF4y2B一个

Laves等人[gydF4y2B一个 13gydF4y2B一个将MCDO和SVI应用于光学相干断层扫描观察到的视网膜扫描。作者表明，与真阳性预测相比，这两种方法导致假阳性预测的标准偏差更高。这表明，标准偏差可以为具有高不确定性的预测提供参考，以提高人类专家的分类精度。gydF4y2B一个

Mobiny等[gydF4y2B一个 14gydF4y2B一个]使用MCDO估算不同类型网络(包括VGGNet)的不确定性[gydF4y2B一个 32gydF4y2B一个]、ResNet [gydF4y2B一个 33gydF4y2B一个]和DenseNet [gydF4y2B一个 34gydF4y2B一个]对8种不同皮肤病变类型的皮肤镜图像。类似于Leibig等人[gydF4y2B一个 12gydF4y2B一个]，作者报告了保留数据与准确性曲线，并表明当将一小部分不确定样本提交给医学专家时，准确性可以提高。作为不确定性的度量，计算归一化预测熵。作为额外的度量，作者还计算了一个与不确定性相关的混淆矩阵，其中包括正确-确定、正确-不确定、不正确-确定和不正确-不确定预测的数量。当不确定性阈值改变时，各自的数字会发生变化。这种评估的一个可能目标是尽可能减少不正确预测的数量。gydF4y2B一个

Herzog等人的另一项研究[gydF4y2B一个 15gydF4y2B一个]将MCDO应用于脑磁共振成像(MRI)图像的分类。他们的工作目标是从多个图像的预测中推断出患者级别的诊断。因此，作者计算了每张图像的5种不确定度。为了在患者层面得出结论，作者运行了另一个神经网络，处理属于一个患者的所有图像的不确定性。gydF4y2B一个

在另外两篇已发表的著作中，Caldéron-Ramírez等[gydF4y2B一个 16gydF4y2B一个，gydF4y2B一个 17gydF4y2B一个将MCDO应用于乳房x线摄影图像的乳腺癌分类任务和胸部x线扫描的COVID-19分类任务。不幸的是，即使在这两部作品中，作者也报告了不同的指标，这就妨碍了对结果的比较。在乳腺癌分类任务中，作者使用了一种称为不确定性平衡精度的度量，该度量建立在与不确定性相关的混淆矩阵上，Mobiny等人也使用了该矩阵[gydF4y2B一个 14gydF4y2B一个］.在与COVID-19检测相关的工作中，作者将Jensen-Shannon分歧报告为不确定性度量，我们在任何其他审查的作品中都没有遇到过。gydF4y2B一个

另一组研究将MCDO与Deep Ensembles(进一步简称为Ensembles)进行了比较，并部分与其他方法进行了比较。Filos等[gydF4y2B一个 2gydF4y2B一个]将MCDO与Ensembles和平均场变分推理(mean field variational inference, MFVI) (SVI的一种变体)进行比较，并将其应用于糖尿病视网膜病变分类任务。除了单独比较MCDO和Ensembles之外，他们还将两种方法结合起来，并将组合包括在评估中，表示为“Ensemble MCDO”。作为神经网络架构，作者使用了VGGNet的变体[gydF4y2B一个 32gydF4y2B一个］.保留的数据与精度图显示，“集成MCDO”具有最佳性能，其次是单独应用MCDO和Ensembles。MFVI没有达到与基于抽样的方法相同的性能。gydF4y2B一个

Linmans等[gydF4y2B一个 18gydF4y2B一个]对公开可用的Camelyon数据集进行不确定性估计，用于组织病理切片上的乳腺癌检测。作者提出了一种新的不确定性估计方法，称为“m -头”，它向卷积神经网络(CNN)添加多个输出头。他们将他们的方法分别与5个和10个网络的MCDO和Ensembles进行了比较。从不同的评估来看，置信度与准确度图表明，只有保持高置信度的预测时，准确度才会增加。这些方法从m -head中排名最佳，其次是5和10个网络的Ensembles。在报告的结果中，MCDO并不比香草softmax输出表现更好。gydF4y2B一个

Thagaard等[gydF4y2B一个 19gydF4y2B一个将Ensembles和MCDO应用于乳腺癌检测的组织病理学切片的私有数据集。在他们的工作中，作者专注于OOD检测，同时分析不同内部数据集的组合。为了比较不确定度估计方法，在3个不同的数据集上计算了ECE。对于所有3个数据集，5个ResNet-50网络的Ensemble达到了最好的ECE分数。gydF4y2B一个

在另一部作品中，杨和芬斯[gydF4y2B一个 20.gydF4y2B一个将MCDO、Ensembles以及两者的组合应用于几个公开可用的数据集。方法包括通过x射线扫描对COVID-19进行分类，通过MRI图像对脑肿瘤进行分类，以及通过组织病理学切片检测乳腺癌。在组织病理学图像上，作者给出了保留数据与准确性的对比图。对于报告的精度，集成MCDO方法与5个Inception-ResNet网络导致最好的结果。gydF4y2B一个

Abdar等[gydF4y2B一个 21gydF4y2B一个将MCDO、Ensembles和Ensemble MCDO应用于皮肤镜图像的皮肤癌分类。作者报告了在2个不同的公开数据集上4种不同网络架构的应用方法的熵和标准差。从报告的值，作者得出结论，合奏整体表现最好。在另一个设置中，作者将两种不确定性估计方法(Ensembles和Ensembles MCDO)结合在一个决策树中，他们称之为三向决策理论。gydF4y2B一个

在另一项研究中，Berger等[gydF4y2B一个 22gydF4y2B一个评估基于置信度的肺部疾病x射线扫描OOD检测。作者比较了MCDO、Ensembles和OOD检测的特定方法，包括基于马氏距离的方法和“神经网络的分布外检测器”[gydF4y2B一个 35gydF4y2B一个］.在他们的实验中，作者发现神经网络的OOD检测器在接收操作曲线下的面积(AUROC)和精确召回曲线下的面积(AUPRC)值方面产生了最佳的OOD检测结果。gydF4y2B一个

单网方式gydF4y2B一个

在介绍了几个专注于基于抽样的不确定性估计方法的工作之后，我们现在将研究直接应用于网络分类输出来估计不确定性的工作。托莱多-科特萨斯等人的研究就是一个例子[gydF4y2B一个 23gydF4y2B一个将GP应用于他们实施的Inception-V3网络的输出[gydF4y2B一个 36gydF4y2B一个］.类似于Laves等人[gydF4y2B一个 13gydF4y2B一个]，作者报告了真阳性和假阳性预测的标准偏差。由于两种情况的标准差非常相似，因此必须得出结论，所应用的GP不适合于有用的不确定性估计。gydF4y2B一个

一系列其他工作应用EDL来估计不确定性。在他们的第一部作品中，盖苏等人[gydF4y2B一个 24gydF4y2B一个用x射线扫描胸部，然后扩展到腹部的超声波图像和大脑的核磁共振成像[gydF4y2B一个 26gydF4y2B一个］.结果表明，丢弃部分最不确定的预测可以显著提高不同x射线分类任务的AUROC平均得分。gydF4y2B一个

相比之下，Tardy等[gydF4y2B一个 25gydF4y2B一个将EDL应用于乳房x线摄影图像的乳腺癌分类任务。作者还报告了在丢弃一小部分不确定样本时改进的AUROC和AUPRC值。gydF4y2B一个

我们纳入的两个作品将TS应用于医学图像分类任务。Carneiro等[gydF4y2B一个 27gydF4y2B一个]将TS和MCDO结合起来，以预测熵和预测方差的形式计算校准的置信度度量以及不确定性度量。作者评估了两组不同的结肠镜检查图像中5级息肉分类任务的方法。报告的ECE和精度值表明，具有MCDO和TS的DenseNet-121架构可获得最佳结果。gydF4y2B一个

Liang等[gydF4y2B一个 28gydF4y2B一个提出了一种新的网络校准方法，其形式是一种辅助损失项，称为“置信度与准确性之差”(DCA)，可以集成到现有的CNN训练过程中。作者将他们的方法与具有几种不同网络架构的不同医疗数据集的TS和未校准网络进行了比较。结果表明，在大多数情况下，DCA产生最好的ECE值。研究还表明，根据数据集和模型结构的不同，TS并不总能提高预期的校准误差。gydF4y2B一个

测试时间数据增强(TTA)gydF4y2B一个

TTA的概念是由Ayhan和Behrens [gydF4y2B一个 10gydF4y2B一个]，在那里它被应用于眼底图像的糖尿病视网膜病变的任务。作者应用了128种不同的增强，从裁剪和调整大小到不同的颜色增强。作为不确定性的度量，计算预测的四分位数范围。类似于Leibig等人[gydF4y2B一个 12gydF4y2B一个]，作者报告了保留的数据与AUROC曲线的对比，并表明当将不确定的样本提交给医学专家时，AUROC值有所提高。gydF4y2B一个

Jensen等人的另一项研究[gydF4y2B一个 29gydF4y2B一个着重于评估不同皮肤病变的皮肤镜图像的一致性。在实验中，多个专家为各自的图像提供了标签，每个样本的标签可能因专家而异。因此，比较了标签融合和标签采样两种训练神经网络的方法。这些方法与估计不确定度的方法相结合，以评估组合方法对网络校准的影响。结果表明，在特定的实验环境下，标签采样和TTA相结合的分类准确率在所有数据分割中最高。gydF4y2B一个

Combalia等[gydF4y2B一个 30.gydF4y2B一个]，也与皮肤镜图像合作，结合TTA和MCDO来评估任意和认知的不确定性。在他们的实验中，作者表明这两种方法的结合导致OOD检测以及保留数据与准确性评估的最佳结果。对于评估，使用TTA或MCDO或两种方法组合在网络中执行100次正向传递。通过计算预测熵、预测方差以及Bhattacharyya系数来量化不确定性[gydF4y2B一个 30.gydF4y2B一个］.gydF4y2B一个

在他们最初工作的后续研究中，Ayhan等人[gydF4y2B一个 31gydF4y2B一个]用其他不确定性估计方法对糖尿病视网膜病变分类进行了扩展实验。除了TTA，作者还包括TS和3个改进的ResNet网络的集合。为了比较结果，作者计算了自适应期望校准误差[gydF4y2B一个 37gydF4y2B一个］.在自适应期望校准误差方面，128次前向传递不同数据增强的中位数概率得到最佳校准结果。在保留数据和AUROC曲线上，TTA和Deep Ensembles表现同样好。在不同的眼底图像队列上进行的实验表明，与TTA和Deep Ensembles相比，TS对新数据的泛化效果更差。gydF4y2B一个

讨论gydF4y2B一个

通过对文献的回顾，我们对医学图像分类领域中最常用的不确定度估计方法进行了综述。我们发现基于采样的方法MCDO和Deep Ensembles是最常用的方法。使用基于抽样的方法，可以计算预测的分布，并从那里确定不确定性度量，通常以预测熵或预测方差的形式。这些措施有助于识别神经网络对其预测不确定的样本。gydF4y2B一个

除了基于采样的不确定度评估外，我们还观察到分析神经网络校准的评估。根据可靠性图和ECE进行校准评估，以确定神经网络的输出概率是否代表预测正确的实际可能性。在关于神经网络标定的原论文[gydF4y2B一个 8gydF4y2B一个]，作者声称，大多数现代cnn没有很好地校准，并产生过度自信的预测。在这篇综述中，我们看到包括TS和TTA在内的几种方法可以用于改进校准[gydF4y2B一个 31gydF4y2B一个］.gydF4y2B一个

我们还观察到，结合不确定性估计方法可以改善结果。这适用于组合Ensembles和MCDO [gydF4y2B一个 2gydF4y2B一个，gydF4y2B一个 20.gydF4y2B一个，gydF4y2B一个 21gydF4y2B一个]、TS及MCDO [gydF4y2B一个 27gydF4y2B一个]，或TTA和MCDO [gydF4y2B一个 30.gydF4y2B一个］.gydF4y2B一个

通过呈现保留数据与精度曲线，一些工作[gydF4y2B一个 2gydF4y2B一个，gydF4y2B一个 10gydF4y2B一个，gydF4y2B一个 12gydF4y2B一个，gydF4y2B一个 14gydF4y2B一个，gydF4y2B一个 20.gydF4y2B一个，gydF4y2B一个 26gydF4y2B一个，gydF4y2B一个 30.gydF4y2B一个]表明，丢弃不确定的预测会提高神经网络在剩余样本上的准确性。这种见解适用于所有三种不确定性估计方法，我们将其表示为(1)模型抽样，(2)单网络方法和(3)数据增强。从这一观察中得到的一个重要信息是，不确定性估计可以用作改善人工智能系统与人类专家之间协作的工具。到目前为止，所有的研究都是在非常人工的环境中进行的。因此，未来的工作应该分析不确定性感知人工智能系统与人类专家在更接近诊所现实情况的场景中合作的性能改进。gydF4y2B一个

缩写gydF4y2B一个

人工智能gydF4y2B一个

AUPRCgydF4y2B一个

精确召回曲线下面积gydF4y2B一个

AUROCgydF4y2B一个

接收器工作曲线下的面积gydF4y2B一个

美国有线电视新闻网gydF4y2B一个

卷积神经网络gydF4y2B一个

DCAgydF4y2B一个

信心和准确性的区别gydF4y2B一个

ECEgydF4y2B一个

预期校准误差gydF4y2B一个

联盟gydF4y2B一个

证据深度学习gydF4y2B一个

全科医生gydF4y2B一个

高斯过程gydF4y2B一个

MCDOgydF4y2B一个

蒙特卡洛辍学gydF4y2B一个

MFVIgydF4y2B一个

平均场变分推理gydF4y2B一个

核磁共振成像gydF4y2B一个

磁共振成像gydF4y2B一个

OODgydF4y2B一个

out-of-distributiongydF4y2B一个

棱镜gydF4y2B一个

系统评价和荟萃分析的首选报告项目gydF4y2B一个

SVIgydF4y2B一个

随机变分推理gydF4y2B一个

TSgydF4y2B一个

温度定标gydF4y2B一个

TTAgydF4y2B一个

测试时数据增强gydF4y2B一个

这项研究由德国巴登州社会与一体化部资助。gydF4y2B一个

AK, AH和TJB负责概念和设计。AK和KH负责研究选择。HM, EKH, JNK, SF和CvK对稿件进行了严格的修改，并提供了宝贵的反馈。gydF4y2B一个

TJB是海德堡智能健康有限公司(Handschuhsheimer Landstr. 9/1, 69120 Heidelberg, Germany, https://smarthealth.de)的所有者，该公司开发远程医疗移动应用程序(如AppDoc;https://online-hautarzt.net和Intimarzt;https://intimarzt.de)，在提交的作品之外。gydF4y2B一个

1gydF4y2B一个

BegoligydF4y2B一个

EgydF4y2B一个

巴塔查里亚gydF4y2B一个

TgydF4y2B一个

KusnezovgydF4y2B一个

DgydF4y2B一个

机器辅助医疗决策中不确定性量化的必要性gydF4y2B一个

纳特马赫英特尔gydF4y2B一个 2019gydF4y2B一个 1gydF4y2B一个 7gydF4y2B一个 1gydF4y2B一个 1gydF4y2B一个 20.gydF4y2B一个 23gydF4y2B一个

10.1038 / s42256 - 018 - 0004 - 1gydF4y2B一个

2gydF4y2B一个

费罗gydF4y2B一个

一个gydF4y2B一个

法夸尔gydF4y2B一个

年代gydF4y2B一个

戈麦斯gydF4y2B一个

一个gydF4y2B一个

RudnergydF4y2B一个

TgydF4y2B一个

肯特gydF4y2B一个

ZgydF4y2B一个

史密斯gydF4y2B一个

lgydF4y2B一个

AlizadehgydF4y2B一个

米gydF4y2B一个

德gydF4y2B一个

卡gydF4y2B一个

加gydF4y2B一个

YgydF4y2B一个

糖尿病视网膜病变任务中贝叶斯深度学习鲁棒性的系统比较gydF4y2B一个

2019gydF4y2B一个

神经信息处理系统会议(NeurIPS)gydF4y2B一个

12月8 - 14gydF4y2B一个

加拿大温哥华gydF4y2B一个

3.gydF4y2B一个

OvadiagydF4y2B一个

YgydF4y2B一个

多数时候gydF4y2B一个

EgydF4y2B一个

任gydF4y2B一个

JgydF4y2B一个

NadogydF4y2B一个

ZgydF4y2B一个

斯卡利gydF4y2B一个

DgydF4y2B一个

NowozingydF4y2B一个

年代gydF4y2B一个

狄龙gydF4y2B一个

JgydF4y2B一个

LakshminarayanangydF4y2B一个

BgydF4y2B一个

杖鱼gydF4y2B一个

JgydF4y2B一个

你能相信你的模型的不确定性吗?评估数据集移位下的预测不确定性gydF4y2B一个

2019gydF4y2B一个

神经信息处理系统(NeurIPS)年会gydF4y2B一个

12月8 - 14gydF4y2B一个

加拿大温哥华gydF4y2B一个

4gydF4y2B一个

加gydF4y2B一个

YgydF4y2B一个

GhahramanigydF4y2B一个

ZgydF4y2B一个

作为贝叶斯近似的Dropout:表示深度学习中的模型不确定性gydF4y2B一个

2016gydF4y2B一个

国际机器学习会议(ICML)gydF4y2B一个

6月19到24gydF4y2B一个

纽约gydF4y2B一个

5gydF4y2B一个

LakshminarayanangydF4y2B一个

BgydF4y2B一个

PritzelgydF4y2B一个

一个gydF4y2B一个

BlundellgydF4y2B一个

CgydF4y2B一个

使用深度集成的简单和可扩展的预测不确定性估计gydF4y2B一个

2017gydF4y2B一个

神经信息处理系统(NeurIPS)年会gydF4y2B一个

12月4 - 9日gydF4y2B一个

长滩，加州gydF4y2B一个

6gydF4y2B一个

拉斯穆森gydF4y2B一个

CEgydF4y2B一个

机器学习中的高斯过程gydF4y2B一个

机器学习高级讲座gydF4y2B一个 2003gydF4y2B一个

海德堡gydF4y2B一个

施普林格柏林gydF4y2B一个

63gydF4y2B一个 71gydF4y2B一个

7gydF4y2B一个

BlundellgydF4y2B一个

CgydF4y2B一个

CornebisegydF4y2B一个

JgydF4y2B一个

KavukcuoglugydF4y2B一个

KgydF4y2B一个

WierstragydF4y2B一个

DgydF4y2B一个

神经网络中的权重不确定性gydF4y2B一个

第32届机器学习国际会议论文集gydF4y2B一个 2015gydF4y2B一个

PMLRgydF4y2B一个

7月7 - 9日gydF4y2B一个

法国里尔gydF4y2B一个

8gydF4y2B一个

郭gydF4y2B一个

CgydF4y2B一个

PleissgydF4y2B一个

GgydF4y2B一个

太阳gydF4y2B一个

YgydF4y2B一个

温伯格gydF4y2B一个

KgydF4y2B一个

现代神经网络的标定gydF4y2B一个

出来了。预印本于2017年6月14日在线发布gydF4y2B一个

10.48550 / arXiv.1706.04599gydF4y2B一个

9gydF4y2B一个

SensoygydF4y2B一个

米gydF4y2B一个

卡普兰gydF4y2B一个

lgydF4y2B一个

KandemirgydF4y2B一个

米gydF4y2B一个

量化分类不确定性的证据深度学习gydF4y2B一个

2018gydF4y2B一个

神经信息处理系统(NeurIPS)年会gydF4y2B一个

12月2 - 8gydF4y2B一个

加拿大蒙特利尔gydF4y2B一个

10gydF4y2B一个

世界货币基金gydF4y2B一个

米gydF4y2B一个

焦点gydF4y2B一个

PgydF4y2B一个

深度神经网络中异方差任意不确定性估计的测试时间数据增强gydF4y2B一个

2018gydF4y2B一个

MIDL 2018gydF4y2B一个

7月4 - 6gydF4y2B一个

阿姆斯特丹，荷兰gydF4y2B一个

11gydF4y2B一个

页面gydF4y2B一个

乔丹gydF4y2B一个

麦肯齐gydF4y2B一个

我gydF4y2B一个

BossuytgydF4y2B一个

点gydF4y2B一个

BoutrongydF4y2B一个

我gydF4y2B一个

霍夫曼gydF4y2B一个

TCgydF4y2B一个

MulrowgydF4y2B一个

CDgydF4y2B一个

ShamseergydF4y2B一个

lgydF4y2B一个

TetzlaffgydF4y2B一个

JMgydF4y2B一个

阿克勒说道gydF4y2B一个

EAgydF4y2B一个

布伦南gydF4y2B一个

SEgydF4y2B一个

周gydF4y2B一个

RgydF4y2B一个

一个被gydF4y2B一个

JgydF4y2B一个

GrimshawgydF4y2B一个

JMgydF4y2B一个

HrobjartssongydF4y2B一个

一个gydF4y2B一个

涵碧楼gydF4y2B一个

毫米gydF4y2B一个

李gydF4y2B一个

TgydF4y2B一个

洛德gydF4y2B一个

电子战gydF4y2B一个

Mayo-WilsongydF4y2B一个

EgydF4y2B一个

麦当劳gydF4y2B一个

年代gydF4y2B一个

麦吉尼斯gydF4y2B一个

拉gydF4y2B一个

斯图尔特gydF4y2B一个

拉gydF4y2B一个

托马斯。gydF4y2B一个

JgydF4y2B一个

TriccogydF4y2B一个

交流gydF4y2B一个

韦尔奇gydF4y2B一个

弗吉尼亚州gydF4y2B一个

怀廷gydF4y2B一个

PgydF4y2B一个

莫赫gydF4y2B一个

DgydF4y2B一个

PRISMA 2020声明:更新的系统审查报告指南gydF4y2B一个

科学硕士gydF4y2B一个 2021gydF4y2B一个 03gydF4y2B一个 18gydF4y2B一个 3.gydF4y2B一个 e1003583gydF4y2B一个

10.1371 / journal.pmed.1003583gydF4y2B一个

33780438gydF4y2B一个

pmedicine - d - 21 - 01172gydF4y2B一个

PMC8007028gydF4y2B一个

12gydF4y2B一个

LeibiggydF4y2B一个

CgydF4y2B一个

AllkengydF4y2B一个

VgydF4y2B一个

世界货币基金gydF4y2B一个

女士gydF4y2B一个

焦点gydF4y2B一个

PgydF4y2B一个

WahlgydF4y2B一个

年代gydF4y2B一个

利用深度神经网络的不确定性信息进行疾病检测gydF4y2B一个

Sci代表gydF4y2B一个 2017gydF4y2B一个 12gydF4y2B一个 19gydF4y2B一个 7gydF4y2B一个 1gydF4y2B一个 17816gydF4y2B一个

10.1038 / s41598 - 017 - 17876 - zgydF4y2B一个

29259224gydF4y2B一个

10.1038 / s41598 - 017 - 17876 - zgydF4y2B一个

PMC5736701gydF4y2B一个

13gydF4y2B一个

莱夫斯gydF4y2B一个

米gydF4y2B一个

IhlergydF4y2B一个

年代gydF4y2B一个

OrtmaiergydF4y2B一个

TgydF4y2B一个

计算机辅助诊断中的不确定性量化:让你的模型对模棱两可的病例说“我不知道”gydF4y2B一个

2019gydF4y2B一个

深度学习医学成像会议(MIDL)gydF4y2B一个

7月8 - 10日gydF4y2B一个

英国伦敦gydF4y2B一个

14gydF4y2B一个

MobinygydF4y2B一个

一个gydF4y2B一个

辛格gydF4y2B一个

一个gydF4y2B一个

范阮gydF4y2B一个

HgydF4y2B一个

基于风险感知的皮肤病变诊断机器学习分类器gydF4y2B一个

临床医学杂志gydF4y2B一个 2019gydF4y2B一个 08gydF4y2B一个 17gydF4y2B一个 8gydF4y2B一个 8gydF4y2B一个 1241gydF4y2B一个

10.3390 / jcm8081241gydF4y2B一个

31426482gydF4y2B一个

jcm8081241gydF4y2B一个

PMC6723257gydF4y2B一个

15gydF4y2B一个

赫尔佐格gydF4y2B一个

lgydF4y2B一个

MurinagydF4y2B一个

EgydF4y2B一个

·杜尔gydF4y2B一个

OgydF4y2B一个

韦格纳gydF4y2B一个

年代gydF4y2B一个

生病的gydF4y2B一个

BgydF4y2B一个

基于MRI脑卒中分析的深度神经网络不确定性集成gydF4y2B一个

医学影像肛门gydF4y2B一个 2020gydF4y2B一个 10gydF4y2B一个 65gydF4y2B一个 101790gydF4y2B一个

10.1016 / j.media.2020.101790gydF4y2B一个

32801096gydF4y2B一个

s1361 - 8415 (20) 30154 - 7gydF4y2B一个

16gydF4y2B一个

Calderon-RamirezgydF4y2B一个

年代gydF4y2B一个

Murillo-HernandezgydF4y2B一个

DgydF4y2B一个

Rojas-SalazargydF4y2B一个

KgydF4y2B一个

Molina-CabellogydF4y2B一个

米gydF4y2B一个

利用半监督学习改进乳房x线照片分类的不确定性估计gydF4y2B一个

2021gydF4y2B一个

国际神经网络联合会议(IJCNN)gydF4y2B一个

7月在18到22岁gydF4y2B一个

深圳,中国gydF4y2B一个

10.1109 / ijcnn52387.2021.9533719gydF4y2B一个

17gydF4y2B一个

Calderon-RamirezgydF4y2B一个

年代gydF4y2B一个

杨gydF4y2B一个

年代gydF4y2B一个

MoemenigydF4y2B一个

一个gydF4y2B一个

Colreavy-DonnellygydF4y2B一个

年代gydF4y2B一个

艾利赞多gydF4y2B一个

达gydF4y2B一个

•OalagydF4y2B一个

lgydF4y2B一个

Rodriguez-CapitangydF4y2B一个

JgydF4y2B一个

Jimenez-NavarrogydF4y2B一个

米gydF4y2B一个

Lopez-RubiogydF4y2B一个

EgydF4y2B一个

Molina-CabellogydF4y2B一个

妈gydF4y2B一个

利用半监督深度学习改进胸部x线图像检测COVID-19的不确定性估计gydF4y2B一个

IEEE访问gydF4y2B一个 2021gydF4y2B一个 9gydF4y2B一个 85442gydF4y2B一个 85454gydF4y2B一个

10.1109 / access.2021.3085418gydF4y2B一个

18gydF4y2B一个

有gydF4y2B一个

JgydF4y2B一个

范gydF4y2B一个

帝杰gydF4y2B一个

LitjensgydF4y2B一个

GgydF4y2B一个

基于多头卷积神经网络的数字病理分布外检测gydF4y2B一个

2020gydF4y2B一个

深度学习医学成像(MIDL)gydF4y2B一个

7月6 - 9gydF4y2B一个

加拿大蒙特利尔gydF4y2B一个

19gydF4y2B一个

ThagaardgydF4y2B一个

JgydF4y2B一个

HauberggydF4y2B一个

年代gydF4y2B一个

范gydF4y2B一个

DVBgydF4y2B一个

EbstrupgydF4y2B一个

TgydF4y2B一个

汉森gydF4y2B一个

JgydF4y2B一个

达尔gydF4y2B一个

一个gydF4y2B一个

你能相信数字病理学中真实数据集变化下的预测不确定性吗?gydF4y2B一个

医学图像计算和计算机辅助干预gydF4y2B一个 2020gydF4y2B一个

MICCAIgydF4y2B一个

10月4 - 8gydF4y2B一个

秘鲁利马gydF4y2B一个

824gydF4y2B一个 833gydF4y2B一个

10.1007 / 978 - 3 - 030 - 59710 - 8 - _80gydF4y2B一个

20.gydF4y2B一个

杨gydF4y2B一个

年代gydF4y2B一个

FevensgydF4y2B一个

TgydF4y2B一个

医学图像分类中不确定度的量化与估计gydF4y2B一个

人工神经网络和机器学习gydF4y2B一个 2021gydF4y2B一个

ICANN 2021gydF4y2B一个

9月14日至17日gydF4y2B一个

伯拉第斯拉瓦(捷克斯洛伐克gydF4y2B一个

671gydF4y2B一个 683gydF4y2B一个

10.1007 / 978 - 3 - 030 - 86365 - 4 - _54gydF4y2B一个

21gydF4y2B一个

AbdargydF4y2B一个

米gydF4y2B一个

SamamigydF4y2B一个

米gydF4y2B一个

Dehghani MahmoodabadgydF4y2B一个

年代gydF4y2B一个

DoangydF4y2B一个

TgydF4y2B一个

MazouregydF4y2B一个

BgydF4y2B一个

HashemifesharakigydF4y2B一个

RgydF4y2B一个

刘gydF4y2B一个

lgydF4y2B一个

KhosravigydF4y2B一个

一个gydF4y2B一个

阿查里雅gydF4y2B一个

你的gydF4y2B一个

MakarenkovgydF4y2B一个

VgydF4y2B一个

NahavandigydF4y2B一个

年代gydF4y2B一个

基于三向决策的贝叶斯深度学习在皮肤癌分类中的不确定性量化gydF4y2B一个

计算机生物医学gydF4y2B一个 2021gydF4y2B一个 08gydF4y2B一个 135gydF4y2B一个 104418gydF4y2B一个

10.1016 / j.compbiomed.2021.104418gydF4y2B一个

34052016gydF4y2B一个

s0010 - 4825 (21) 00212 - 2gydF4y2B一个

22gydF4y2B一个

伯杰gydF4y2B一个

CgydF4y2B一个

PaschaligydF4y2B一个

米gydF4y2B一个

格洛克gydF4y2B一个

BgydF4y2B一个

KamnitsasgydF4y2B一个

KgydF4y2B一个

基于置信度的分布外检测:比较研究与分析gydF4y2B一个

机器学习在医学成像、围产期成像、胎盘和早产儿图像分析中安全使用的不确定性gydF4y2B一个 2021gydF4y2B一个

确定2021年gydF4y2B一个

10月1日gydF4y2B一个

斯特拉斯堡FarncegydF4y2B一个

122gydF4y2B一个 132gydF4y2B一个

10.1007 / 978 - 3 - 030 - 87735 - 4 - _12gydF4y2B一个

23gydF4y2B一个

Toledo-CortesgydF4y2B一个

年代gydF4y2B一个

德gydF4y2B一个

行分钟gydF4y2B一个

佩尔多莫坚称gydF4y2B一个

OgydF4y2B一个

冈萨雷斯gydF4y2B一个

FgydF4y2B一个

混合深度学习高斯过程在糖尿病视网膜病变诊断及不确定性量化中的应用gydF4y2B一个

眼科医学图像分析gydF4y2B一个 2020gydF4y2B一个

OMIA 2020gydF4y2B一个

10月8gydF4y2B一个

秘鲁利马gydF4y2B一个

206gydF4y2B一个 215gydF4y2B一个

10.1007 / 978 - 3 - 030 - 63419 - 3 - _21gydF4y2B一个

24gydF4y2B一个

GhesugydF4y2B一个

FgydF4y2B一个

GeorgescugydF4y2B一个

BgydF4y2B一个

吉布森gydF4y2B一个

EgydF4y2B一个

GuendelgydF4y2B一个

年代gydF4y2B一个

卡尔拉gydF4y2B一个

米gydF4y2B一个

辛格gydF4y2B一个

RgydF4y2B一个

DigumarthygydF4y2B一个

年代gydF4y2B一个

GrbicgydF4y2B一个

年代gydF4y2B一个

ComaniciugydF4y2B一个

DgydF4y2B一个

量化和利用胸片评估的分类不确定性gydF4y2B一个

医学图像计算和计算机辅助干预gydF4y2B一个 2019gydF4y2B一个

MICCAIgydF4y2B一个

10月13 - 17gydF4y2B一个

深圳,中国gydF4y2B一个

676gydF4y2B一个 684gydF4y2B一个

10.1007 / 978 - 3 - 030 - 32226 - 7 - _75gydF4y2B一个

25gydF4y2B一个

迟到的gydF4y2B一个

米gydF4y2B一个

雅伯gydF4y2B一个

BgydF4y2B一个

MateusgydF4y2B一个

DgydF4y2B一个

乳房x线照片可靠分类的不确定度测量gydF4y2B一个

医学图像计算和计算机辅助干预gydF4y2B一个 2019gydF4y2B一个

MICCAIgydF4y2B一个

10月13 - 17gydF4y2B一个

深圳,中国gydF4y2B一个

495gydF4y2B一个 503gydF4y2B一个

10.1007 / 978 - 3 - 030 - 32226 - 7 - _55gydF4y2B一个

26gydF4y2B一个

GhesugydF4y2B一个

足球俱乐部gydF4y2B一个

GeorgescugydF4y2B一个

BgydF4y2B一个

MansoorgydF4y2B一个

一个gydF4y2B一个

柳gydF4y2B一个

YgydF4y2B一个

吉布森gydF4y2B一个

EgydF4y2B一个

史瓦gydF4y2B一个

RSgydF4y2B一个

BalachandrangydF4y2B一个

一个gydF4y2B一个

BaltergydF4y2B一个

JMgydF4y2B一个

曹gydF4y2B一个

YgydF4y2B一个

辛格gydF4y2B一个

RgydF4y2B一个

DigumarthygydF4y2B一个

老gydF4y2B一个

卡尔拉gydF4y2B一个

可gydF4y2B一个

GrbicgydF4y2B一个

年代gydF4y2B一个

ComaniciugydF4y2B一个

DgydF4y2B一个

量化和利用医学图像评估的预测不确定性gydF4y2B一个

医学影像肛门gydF4y2B一个 2021gydF4y2B一个 02gydF4y2B一个 68gydF4y2B一个 101855gydF4y2B一个

10.1016 / j.media.2020.101855gydF4y2B一个

33260116gydF4y2B一个

s1361 - 8415 (20) 30219 - xgydF4y2B一个

27gydF4y2B一个

CarneirogydF4y2B一个

GgydF4y2B一个

程涛，朴佐伦gydF4y2B一个

lgydF4y2B一个

辛格gydF4y2B一个

RgydF4y2B一个

伯特gydF4y2B一个

一个gydF4y2B一个

结肠镜五类息肉分类的深度学习不确定性和置信度校准gydF4y2B一个

医学影像肛门gydF4y2B一个 2020gydF4y2B一个 05gydF4y2B一个 62gydF4y2B一个 101653gydF4y2B一个

10.1016 / j.media.2020.101653gydF4y2B一个

32172037gydF4y2B一个

s1361 - 8415 (20) 30020 - 7gydF4y2B一个

28gydF4y2B一个

梁gydF4y2B一个

GgydF4y2B一个

张gydF4y2B一个

YgydF4y2B一个

雅可布gydF4y2B一个

NgydF4y2B一个

基于DCA正则化的医学影像分类神经网络标定gydF4y2B一个

2020gydF4y2B一个

国际机器学习会议(ICML)gydF4y2B一个

7月17日gydF4y2B一个

虚拟车间gydF4y2B一个

29gydF4y2B一个

詹森gydF4y2B一个

米gydF4y2B一个

JørgensengydF4y2B一个

DgydF4y2B一个

JalaboigydF4y2B一个

RgydF4y2B一个

汉森gydF4y2B一个

米gydF4y2B一个

奥尔森gydF4y2B一个

米gydF4y2B一个

利用Inter-rater协议改进卷积神经网络的不确定性估计gydF4y2B一个

医学图像计算和计算机辅助干预gydF4y2B一个 2019gydF4y2B一个

MICCAIgydF4y2B一个

10月13 - 17gydF4y2B一个

深圳,中国gydF4y2B一个

540gydF4y2B一个 548gydF4y2B一个

10.1007 / 978 - 3 - 030 - 32251 - 9 - _59gydF4y2B一个

30.gydF4y2B一个

CombaliagydF4y2B一个

米gydF4y2B一个

HuetogydF4y2B一个

FgydF4y2B一个

普伊格gydF4y2B一个

年代gydF4y2B一个

MalvehygydF4y2B一个

JgydF4y2B一个

VilaplanagydF4y2B一个

VgydF4y2B一个

皮肤镜图像分类中深度神经网络的不确定性估计gydF4y2B一个

2020gydF4y2B一个

IEEE计算机视觉与模式识别研讨会(CVPRW)gydF4y2B一个

14 - 19 6月gydF4y2B一个

西雅图,华盛顿州gydF4y2B一个

10.1109 / cvprw50498.2020.00380gydF4y2B一个

31gydF4y2B一个

世界货币基金gydF4y2B一个

女士gydF4y2B一个

KuhleweingydF4y2B一个

lgydF4y2B一个

AliyevagydF4y2B一个

GgydF4y2B一个

InhoffengydF4y2B一个

WgydF4y2B一个

ZiemssengydF4y2B一个

FgydF4y2B一个

焦点gydF4y2B一个

PgydF4y2B一个

糖尿病视网膜病变检测中深度神经网络诊断不确定性的专家验证估计gydF4y2B一个

医学影像肛门gydF4y2B一个 2020gydF4y2B一个 08gydF4y2B一个 64gydF4y2B一个 101724gydF4y2B一个

10.1016 / j.media.2020.101724gydF4y2B一个

32497870gydF4y2B一个

s1361 - 8415 (20) 30088 - 8gydF4y2B一个

32gydF4y2B一个

SimonyangydF4y2B一个

KgydF4y2B一个

ZissermangydF4y2B一个

一个gydF4y2B一个

用于大规模图像识别的深度卷积网络gydF4y2B一个

出来了。预印本发布于2014年9月4日gydF4y2B一个

10.48550 / arXiv.1907.11692gydF4y2B一个

33gydF4y2B一个

他gydF4y2B一个

KgydF4y2B一个

张gydF4y2B一个

XgydF4y2B一个

任gydF4y2B一个

年代gydF4y2B一个

太阳gydF4y2B一个

JgydF4y2B一个

图像识别的深度残差学习gydF4y2B一个

2016gydF4y2B一个

IEEE计算机视觉与模式识别会议(CVPR)gydF4y2B一个

6月的观众gydF4y2B一个

拉斯维加斯，美国gydF4y2B一个

10.1109 / CVPR.2016.90gydF4y2B一个

34gydF4y2B一个

黄gydF4y2B一个

GgydF4y2B一个

刘gydF4y2B一个

ZgydF4y2B一个

范gydF4y2B一个

DMLgydF4y2B一个

温伯格gydF4y2B一个

KgydF4y2B一个

密集连接的卷积网络gydF4y2B一个

2017gydF4y2B一个

IEEE计算机视觉与模式识别会议(CVPR)gydF4y2B一个

7月21-26gydF4y2B一个

火奴鲁鲁,哈gydF4y2B一个

10.1109 / cvpr.2017.243gydF4y2B一个

35gydF4y2B一个

梁gydF4y2B一个

年代gydF4y2B一个

李gydF4y2B一个

YgydF4y2B一个

SrikantgydF4y2B一个

RgydF4y2B一个

提高神经网络超分布图像检测的可靠性gydF4y2B一个

2018gydF4y2B一个

第六届国际学习表征会议(ICLR)gydF4y2B一个

4月30日- 5月3日gydF4y2B一个

加拿大温哥华gydF4y2B一个

36gydF4y2B一个

SzegedygydF4y2B一个

CgydF4y2B一个

VanhouckegydF4y2B一个

VgydF4y2B一个

约飞gydF4y2B一个

年代gydF4y2B一个

重新思考计算机视觉的初始架构gydF4y2B一个

2016gydF4y2B一个

IEEE计算机视觉与模式识别会议(CVPR)gydF4y2B一个

6月的观众gydF4y2B一个

拉斯维加斯，美国gydF4y2B一个

10.1109 / cvpr.2016.308gydF4y2B一个

37gydF4y2B一个

丁gydF4y2B一个

YgydF4y2B一个

刘gydF4y2B一个

JgydF4y2B一个

熊gydF4y2B一个

JgydF4y2B一个

史gydF4y2B一个

YgydF4y2B一个

回顾不确定性估计的评估及其应用，探索模型复杂性-不确定性权衡gydF4y2B一个

2020gydF4y2B一个

IEEE计算机视觉与模式识别研讨会(CVPRW)gydF4y2B一个

14 - 19 6月gydF4y2B一个

西雅图,华盛顿州gydF4y2B一个

10.1109 / cvprw50498.2020.00010gydF4y2B一个