非极大值抑制（non

2024-07-16 05:12| 来源: 网络整理| 查看: 265

最近在学习RCNN时看到了非极大值抑制，一开始有点不明白，在网上学习了之后记录一下。

非极大值抑制就是一个寻找局部最大值的过程。

在进行目标检测时一般会采取窗口滑动的方式，在图像上生成很多的候选框，然后把这些候选框进行特征提取后送入分类器，一般会得出一个得分（score），比如人脸检测，会在很多框上都有得分，然后把这些得分全部排序。选取得分最高的那个框，接下来计算其他的框与当前框的重合程度（iou），如果重合程度大于一定阈值就删除，因为在同一个脸上可能会有好几个高得分的框，都是人脸但是不需要那么框我们只需要一个就够了。

那么肯定有人会好奇，如果图片中有好几个人脸，你这选取一个最大的，那第二个人脸怎么办呢。

实际上这是一个迭代的过程，第一步的非极大值抑制就是选取了某一个最大的得分，然后删除了他周边的几个框，第二次迭代的时候在剩下的框里面选取一个最大的，然后再删除它周围iou区域大于一定阈值的，这样不停的迭代下去就会得到所有想要找到的目标物体的区域。

假设有ABCDEF这么多个得分框（已经按照得分从小到大排序）。

1、从最大概率矩形框F开始，分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;

2、假设B、D与F的重叠度超过阈值，那么就扔掉B、D；并标记第一个矩形框F，是我们保留下来的。

3、从剩下的矩形框A、C、E中，选择概率最大的E，然后判断E与A、C的重叠度，重叠度大于一定的阈值，那么就扔掉；并标记E是我们保留下来的第二个矩形框。

4、一直重复这个过程，找到所有曾经被保留下来的矩形框。

第一步寻找得分框：

第一次迭代找到一个：

第二次迭代找到另外一个：

参考：https://blog.csdn.net/shuzfan/article/details/52711706

https://blog.csdn.net/zchang81/article/details/70211851

【本文地址】

公司简介

联系我们