Dice系数(Dice coefficient)与mIoU与Dice Loss | 您所在的位置:网站首页 › dics是什么意思 › Dice系数(Dice coefficient)与mIoU与Dice Loss |
Dice系数和mIoU是语义分割的评价指标,在这里进行了简单知识介绍。讲到了Dice顺便在最后提一下Dice Loss,以后有时间区分一下在语义分割中两个常用的损失函数,交叉熵和Dice Loss。 一、Dice系数 1.概念理解 Dice系数是一种集合相似度度量函数,通常用于计算两个样本的相似度,取值范围在[0,1]: 其中 |X∩Y| 是X和Y之间的交集,|X|和|Y|分表表示X和Y的元素的个数,其中,分子的系数为2,是因为分母存在重复计算X和Y之间的共同元素的原因。 对于语义分割问题而言,X-GT分割图像(Ground Truth),Y-Pred分割图像 看图一直观理解一下 ![]() 公式就可以理解为 2.实际计算 首先将 |X∩Y| 近似为预测图pred和label GT 之间的点乘,并将点乘的元素的结果相加: (1)预测分割图与 GT 分割图的点乘: (2)逐元素相乘的结果元素的相加和: 对于二分类问题,GT分割图是只有0,1两个值的,因此 |X∩Y| 可以有效的将在 Pred 分割图中未在 GT 分割图中激活的所有像素清零. 对于激活的像素,主要是惩罚低置信度的预测,较高值会得到更好的 Dice 系数. (3)计算|X|和|Y|,这里可以采用直接元素相加,也可以采用元素平方求和的方法: 3.PyTorch代码 def dice_coeff(pred, target): smooth = 1. num = pred.size(0) m1 = pred.view(num, -1) # Flatten m2 = target.view(num, -1) # Flatten intersection = (m1 * m2).sum() return (2. * intersection + smooth) / (m1.sum() + m2.sum() + smooth)
二、mIoU 1.语义分割元素分类的四种情况 true positive(TP):预测正确, 预测结果是正类, 真实是正类 false positive(FP):预测错误, 预测结果是正类, 真实是负类 true negative(TN):预测正确, 预测结果是负类, 真实是负类 false negative(FN):预测错误, 预测结果是负类, 真实是正类 2.mIoU定义与单个IoU理解 计算真实值和预测值两个集合的交集和并集之比。这个比例可以变形为TP(交集)比上TP、FP、FN之和(并集)。即:mIoU=TP/(FP+FN+TP)。 这里还是直接上个图理解一下,详细解释看图二,我觉得讲的非常棒了。 对于pascal数据集来说, 对于21个类别, 分别求IoU: 对于某一个类别的IoU计算公式如下: ![]() mIoU:计算两圆交集(橙色部分)与两圆并集(红色+橙色+黄色)之间的比例,理想情况下两圆重合,比例为1。 3.mIoU计算 (1)首先是计算混淆矩阵(误差矩阵) (2)计算mIoU 这里代码比较多,以后有时间单独拿出来。也可以参考这个链接中的代码部分:https://blog.csdn.net/u012370185/article/details/94409933 以及这个github:https://github.com/dilligencer-zrj/code_zoo/blob/master/compute_mIOU
三、Dice Loss Dice Loss的计算公式非常简单如下: 这种损失函数被称为 Soft Dice Loss,因为我们直接使用预测概率而不是使用阈值或将它们转换为二进制mask。 Soft Dice Loss 将每个类别分开考虑,然后平均得到最后结果。比较直观如图三所示。 ![]() 需要注意的是Dice Loss存在两个问题: (1)训练误差曲线非常混乱,很难看出关于收敛的信息。尽管可以检查在验证集上的误差来避开此问题。 (2)Dice Loss比较适用于样本极度不均的情况,一般的情况下,使用 Dice Loss 会对反向传播造成不利的影响,容易使训练变得不稳定。 所以在一般情况下,还是使用交叉熵损失函数。 PyTorch参考代码 import torch.nn as nn import torch.nn.functional as F class SoftDiceLoss(nn.Module): def __init__(self, weight=None, size_average=True): super(SoftDiceLoss, self).__init__() def forward(self, logits, targets): num = targets.size(0) smooth = 1 probs = F.sigmoid(logits) m1 = probs.view(num, -1) m2 = targets.view(num, -1) intersection = (m1 * m2) score = 2. * (intersection.sum(1) + smooth) / (m1.sum(1) + m2.sum(1) + smooth) score = 1 - score.sum() / num return score
参考链接: https://zhuanlan.zhihu.com/p/86704421 https://blog.csdn.net/weixin_43346901/article/details/99880278?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~baidu_landing_v2~default-1-99880278.nonecase&utm_term=mi%E4%B8%8Edice&spm=1000.2123.3001.4430 https://blog.csdn.net/gjk0223/article/details/2314844 https://blog.csdn.net/Biyoner/article/details/84728417 https://www.aiuai.cn/aifarm1159.html https://zhuanlan.zhihu.com/p/88805121 https://blog.csdn.net/u012370185/article/details/94409933 |
今日新闻 |
推荐新闻 |
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 |