图像特征提取5：SURF特征提取算法的

2024-05-24 05:23| 来源: 网络整理| 查看: 265

一 SURF算法的概述

SURF，英文的全称为Speed Up Robust Features,直译为:加速版的具有鲁棒特性的特征算法，是由Bay在2006年首次提出的。该算法对经典的尺度不变特征变换算法(SIFT算法)进行了改进，SIFT算法最大的缺点就是如果不借助硬件或者专门的图像处理器进行加速的话，SIFT算法很难达到实时处理的效果。SURF算法最大的特征在于采用了Haar特征以及积分图像的概念，这大大的加速了程序的运行时间。SURF算法不仅保持了SIFT算法的尺度不变和旋转不变的特性，而且对光照变化和放射变化同样具有很强的鲁棒性。SURF算法一般应用于计算机视觉中的物体识别、图像拼接、图像配准以及3D重建中。

二积分图像

积分图像的概念是由Viola和Jones提出的。积分图像中的任意一点（i，j）像素的值为原图像左上角(图像原点)到任意点（i，j）相应的对焦区域的灰度值的总和，其数学公式如图1所示:

那么，当我们想要计算图像中一个区域的积分，就只需计算这个区域的四个顶点在积分图像里的值，便可以通过2步加法和2步减法计算得出，其数学公式如下：

三 SURF算法的原理

3.1 斑点检测

斑点:与周围有着颜色和灰度差别的区域。在一个一维信号中，让它和高斯二阶导数进行卷积，也就是拉普拉斯变换，那么在信号的边缘处就会出现过零点的现象(其实就是:基于二阶微分算子---拉普拉斯算子的边缘检测)。如下图所示：

高斯拉普拉斯Log边缘检测算子的响应值就是在衡量图像的相似性，如下图是一个图像的高斯拉普拉斯变换的三维图和灰度图的显示，在图像中的斑点尺寸与高斯拉普拉斯函数的形状趋于一致时，图像的拉普拉斯的响应值达到最大。

Hession矩阵就是利用二阶微分来进行斑点检测，其矩阵如下：

3.2 构建Hessian矩阵构建高斯图像金字塔

其实SURF构造的金字塔图像与SIFT构造的金字塔图像有很大的不同，正是因为这些不同才加快了SURF算法关键点的检测速度。SIFT采用的是DOG(高斯差分图像)图像，而SURF采用的是Hessian矩阵行列式近似值图像。Hessian矩阵式SURF算法的核心。在数学中，Hessian矩阵是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵。为了方便运算，假设函数f(x,y)，Hessian矩阵H是函数的二阶偏导数组成的方块矩阵。首先来看看图像中某个像素点的Hessian矩阵，如下图所示:

即，我们在图像中的每一个像素点，都可以求出一个Hessian矩阵，然后，我们再根据Hessian矩阵的判别式det(H)的正负号，来判别该点是不是极值点，Hessian矩阵的判别式如下所示:

但是，由于特征点需要具备尺度无关性，所在我们在Hessian矩阵的构造前，需要首先对图像进行高斯平滑滤波。这样，在经过高斯平滑滤波之后，在对图像中的每一个像素点进行Hessian矩阵的求解，具体的计算公式图下所示:

L(x,y) = G(t)*I(x,t)

其中L(x,t)表示的是一幅图像在不同解析度下的表示，其本质表示的就是原始图像在不同尺度高斯核平滑之后的高斯平滑图像，可以利用高斯核G(t)和图像函数I(x)在点x的卷积来实现，其中的高斯核G(t)的计算公式为：高斯函数g(x)对变量x的二阶导数。

为了方便应用，Herbert Bay提出用近似值代替L(x,t)。为了平衡准确值与近似值之间的误差引入了权值，权值随着尺度的变化而变化，此时，Hessian矩阵的判别公式如下所示:

由于求Hessian时，首先要先进行高斯平滑，然后求二阶导数，这在离散的像素点中应用模板的卷积就可以形成，那么，我们就在想能不能用一个模板就可以将高斯平滑过程中的高斯平滑模板和在求图像二阶导数过程中的拉普拉斯算子的二阶微分模板代替，答案是：这是可以的！然后，作者就提出了一种新的模板代替了这两宗模板的组合。比如说Y方向上的模板就可以用下图中的第二行的第二个模板代替；X方向上的模板就可以用第二行的第一个模板代替；X和Y方向上的二阶混合偏导就可以用第一行中的第三个模板代替。其实，这就是Haar特征中的:积分图+边缘模板、对角模板、中心环绕模板。至此，我们就用一个积分图+模板的方式代替了高斯平滑和图像的二阶求导的过程。具体的模板可以参考如下所示：

上面讲了这么多，其实就只为了得到一张近似Hessian矩阵的行列式图像，SURF算法中的Hessian矩阵行列式的图像就相当于SIFT算法中的高斯差分图像，即DOG图像。但是，在金字塔图像中分为很多层，每一层叫一个Octave，每一个Octave中，又有几张尺度不同的图片(解析度不同，即高斯核函数的sigma不同)。在SIFT算法中，同一个Octave层中的图片尺寸相同，但是图片的解析度(即图片的模糊程度)不同。而不同的Octave层中的图片尺寸大小也不相同，因为它是由上一层图片降采样得到的。在进行高斯模糊时，SIFT的高斯模板的大小是始终不变的，只是在不同的Octave之间，图片的大小不一样。而在SURF中，图片的大小是一直不变的，不同Octave层待检测图片是改变了高斯模糊尺寸的大小得到的，当然了，同一个Octave中不同图片用到的高斯模板的尺度(模糊程度)也是不同的。算法允许尺度空间多层图像同时被处理，不需要对图像进行二次抽样，从而提高了算法的性能。当然在求解Hessian矩阵行列式图像的过程中，积分图像的使用，也是SURF算法性能突飞猛进的原因之一。

四利用非极大值抑制初步确定关键点的位置(特征点)

4.1 尺度金字塔构造

在SURF中，采用不断增大盒子滤波器模板尺寸与积分图像求取Hession矩阵响应，然后在响应图像上采用3D非极大值抑制，求取各种不同尺度的斑点，以下是两种不同的金字塔，SURF的金字塔属于第二种：

SURF中采用9X9尺寸的滤波器作为起始滤波器，之后的滤波器尺寸可由以下公式计算得出：

octave、interval在公式中都是从1开始，也就是当第0组第0层时，在公式中octave = 1， interval = 1。

采用这种方式来定义滤波器尺寸的理由如下;

滤波器响应长度、滤波器尺寸、组索引O、层索引S尺度sigma之间的关系如下：

采用类似的方法来处理其他几组的模板序列。其方法是将滤波器尺寸增加量翻倍（6，12，24，38）。这样，可以得到第二组的滤波器尺寸，它们分别为15，27，39，51。第三组的滤波器尺寸为27，51，75，99。如果原始图像的尺寸仍然大于对应的滤波器尺寸，尺度空间的分析还可以进行第四组，其对应的模板尺寸分别为51，99，147，195。下图显示了第一组至第三组的滤波器尺寸变化：

在通常尺度分析情况下，随着尺度的增大，被检测到的斑点数量迅速衰减。所以一般进行3-4组就可以了，与此同时，为了减少运算量，提高计算的速度，可以考虑在滤波时，将采样间隔设为2。4. 2 为了在图像及不同尺寸中定位兴趣点，我们用了3×3×3邻域非最大值抑制：

此步骤和SIFT算法类似，将经过Hessian矩阵处理过的每个像素点与其三维领域的26个点的大小进行比较，如果它是这26个点中的最大值或者最小值，则保留下来，当做初步确定的关键点(特征点)。检测过程中，使用与该尺度图像解析度相对应大小的滤波器进行检测。以3*3的滤波器为例，该尺度层图像中的9个像素点之一的检测特征点与自身的8个特征点和其上下两个尺度层中的各9个点进行比较，共计与26个点比较。

4.3 局部极大值精确定位

这里也和SIFT算法类似，采用三维线性插值算法得到亚像素级别的特征点(关键点)，同时也去掉小于一定阈值的点，增加极值是检测到的特征点数量减少，最终只有几个特征最强的点被检测了出来。

五特征点描述符

5.1 特征点方向分配

以特征点为中心，计算半径为6s(S为特征点所在的尺度值)的邻域内的点在x、y方向的Haar小波(Haar小波边长取4s)响应，Harr小波

模板如图所示：

计算出图像在哈尔小波的x和y方向上的响应值之后，对两个值进行因子为2S的高斯加权，加权后的值分别表示在水平和垂直方向上的方向分量。

Harr特征值反应了图像灰度变化的情况，那么这个主方向就是描述那些灰度变化特别剧烈的区域方向。

接着，以特征点为中心，张角为π/3的扇形滑动，计算窗口内的Harr小波响应值dx、dy的累加：

扇形窗口的滑动如图所示：

在OpenSURF的C++代码实现如下：

for(int i = -6; i 0 && ang < ang2) || (ang > ang1 && ang < 2*pi) )) { sumX+=resX[k]; sumY+=resY[k]; } } // if the vector produced from this window is longer than all // previous vectors then this forms the new dominant direction if (sumX*sumX + sumY*sumY > max) { // store largest orientation max = sumX*sumX + sumY*sumY; orientation = getAngle(sumX, sumY); } }六构造SURF特征点的特征描述子

在SIFT算法中，是在特征点周围取16*16的邻域，并且把该邻域化为4*4的小区域，每个小区域统计8个方向的梯度，最后得到4*4*8=128维的向量，并且把该向量作为SIFT特征点的特征描述子。

在SURF算法中，也是在特征点周围取一个正方形框，框的边长为20s(s是所检测到该特征点所在的尺度)。该框带方向，方向当然就是上面一步检测出来的主方向。然后把该框分为16个子区域，每个子区域统计25个像素的水平方向和垂直方向的haar小波特征，这里的水平方向和垂直方向是相对于主方向而言的。该haar小波特征为水平方向值之和、水平方向绝对值之和和垂直方向之和、垂直方向绝对值之和。这样每个小区域就有4个值，所以每个特征点就是16*4维的向量，相比SIFT而言，少了一半，这在特征匹配的过程中会大大的加速匹配的速度。

以特征点为中心，沿主方向将20SX20S的图像划分为4X4个子块，每个子块用尺寸2S的Harr模板进行响应值计算，并统计每个子块中

这样就有4X4X4=64维的特征数据。如下图所示：

在计算这个矩形区域时并不是先把它旋转到主方向，而是先计算出每一个点的Harr响应值dx、dy并高斯加权处理后，把dx、dy进行旋转变换，计算

公式如下：

在OpenSURF的实现源码中采用的是另外一种方式，通过点旋转公式，把点旋转到主方向上并进行最近邻插值的对应点，公式如下：

七匹配

为了加速匹配过程，SURF借助Laplacian（在之前计算Hessian是可以顺便得出，不占用太多的时间）的符号使匹配过程索引加快。这样可以将下面的情况区分开，然后在进行描述符匹配：

八 OpenCV中SURF源码的分析/******************************************************************************************************** 文件说明: OpenCv中SURF源码的分析 *********************************************************************************************************/ #include #include #include #include #include #include using namespace cv; using namespace std; /******************************************************************************************************** 函数描述: OpenCv中，和SURF类相关的源码分析 1)在OpenCv中和SURF算法有关的源代码部分，常常涉及到的类有三个类，分别如下所示: 1)SURF 2)SurfFeatureDetector 3)SurfDescriptorExtractor 我们可以通过转到定义，在opencv2/nonfree/features2d.hpp头文件中，发现以下的代码，通过下面的代码，我们可以知道cv::SURF、cv::SurfFeatureDetector、cv::SurfDescriptorExtractor这三个类等价。然后，在这两行代码的上方，我们就可以看到定义SURF类的全部类声明代码，这也是有关SURF类最关键的代码部分，具体的代码如下所示: *********************************************************************************************************/ typedef SURF SurfFeatureDetector; typedef SURF SurfDescriptorExtractor; //【1】SURF类的定义 class CV_EXPORTS_W SURF : public Feature2D { public: //【1】SURF类的默认构造函数 CV_WRAP SURF(); //【2】SURF类的带参数的构造函数 explicit CV_WRAP SURF(double hessianThreshold, //【1】Hessian判别式的阈值 int nOctaves=4, //【2】SURF算法中，默认的金字塔层数Octave int nOctaveLayers=2, //【3】每层的图片数 bool extended=true, bool upright=false); //【3】返回SURF特征向量(特征描述子)的尺寸，是64维还是128维 CV_WRAP int descriptorSize() const; //【4】返回SURF特征描述子(或者说特征向量)的类型 CV_WRAP int descriptorType() const; //【5】在SURF算法中使用快速Hessian检测器检测出图像的关键点(特征点) void operator()(InputArray img, //【1】输入的、待检测的图像 InputArray mask, //【2】图像的掩膜 CV_OUT vector& keypoints) const; //【6】找到关键点，并且计算SUFR特征点的特征描述子 void operator()(InputArray img, InputArray mask, CV_OUT vector& keypoints, OutputArray descriptors, bool useProvidedKeypoints=false) const; //【7】输出算法的相关信息 AlgorithmInfo* info() const; CV_PROP_RW double hessianThreshold; //【1】设置Hessian矩阵判别式的阈值 CV_PROP_RW int nOctaves; //【2】金字塔图像的层数Octave CV_PROP_RW int nOctaveLayers; //【3】金字塔图像每层具有的图片数Layers CV_PROP_RW bool extended; CV_PROP_RW bool upright; protected: void detectImpl( const Mat& image, vector& keypoints, const Mat& mask=Mat() ) const; void computeImpl( const Mat& image, vector& keypoints, Mat& descriptors ) const; }; /******************************************************************************************************** 模块描述：除了上面所讲的代码之外，我们还可以看到SURF类是公有继承自Feature2D类；我们在以后的编程过程中，除了使用SURF源代码中出现的成员函数之外，我们通常还会经常使用两个函数，这两个函数如下所示: 1）detect() 2) computer() *********************************************************************************************************/ void detect( const Mat& image, CV_OUT vector& keypoints, const Mat& mask=Mat() ) const; void detect( const vector& images, vector& keypoints, const vector& masks=vector() ) const; /******************************************************************************************************** 模块描述：上面的detect是两个重载的函数,这两个函数的作用是,检测SURF算法中的关键点，具体的分析如下所示: *********************************************************************************************************/ void detect( const Mat& image, //【1】输入的待检测的图像 CV_OUT vector& keypoints, //【2】将检测出来的关键点存储数组keypoints const Mat& mask=Mat() ) const; void detect( const vector& images, //【1】要进行关键点检测的图像集合 vector& keypoints, //【2】存储检测出来的关键点的数组 const vector& masks=vector() ) const; /******************************************************************************************************** 模块描述：那么，在SURF算法中，用来检测SURF算法中关键点的函数是什么呢？具体的函数如下所示: *********************************************************************************************************/ void detectImpl( const Mat& image, //【1】输入待检测关键点的图像 vector& keypoints, //【2】保存SURF算法中关键点检测函数检测出来的关键点 const Mat& mask=Mat() ) const; /******************************************************************************************************** 模块描述：我们都知道，SURF算法中的关键点检测出来之后,我们需要根据SURF算法检测出来的关键点计算关键点对应的SURF特征描述子(或者说SURF算法的特征向量)，那么计算SURF算法特征向量的函数又是什么呢？具体的代码如下所示: 就是下面这两个函数，这两个函数就是根据关键点计算特征特征向量的函数。 *********************************************************************************************************/ void compute( const Mat& image, //【1】输入待计算关键点特征向量的图像 CV_OUT CV_IN_OUT vector& keypoints, //【2】输入上一步利用detect()函数检测出来的关键点 CV_OUT Mat& descriptors ) const; //【3】存储利用这个函数计算出来的特征点描述子或者说特征向量 void compute( const vector& images, vector& keypoints, vector& descriptors ) const; /******************************************************************************************************** 模块描述：下面就是SURF算法中，根据关键点计算特征向量的函数，具体函数如下所示: *********************************************************************************************************/ void computeImpl( const Mat& image, vector& keypoints, Mat& descriptors ) const; /******************************************************************************************************** 模块描述：绘制关键点的函数:drawKeypoints() *********************************************************************************************************/ void drawKeypoints( const Mat& image, //【1】输入图像 const vector& keypoints, //【2】输入关键点的坐标 CV_OUT Mat& outImage, //【3】输出图像，其内容取决于第五个参数 const Scalar& color=Scalar::all(-1), //【4】关键点的颜色值 int flags=DrawMatchesFlags::DEFAULT ); //【5】绘制关键点的标识符 class CV_EXPORTS_W_SIMPLE KeyPoint { public: CV_PROP_RW Point2f pt; //【1】关键点的坐标 CV_PROP_RW float size; //【2】关键点邻域直径 CV_PROP_RW float angle; //【3】特征点的方向 CV_PROP_RW float response; //【4】特征点的响应值 CV_PROP_RW int octave; //【5】特征点所在的层Octave CV_PROP_RW int class_id; //【6】用于聚类的id };

【本文地址】

公司简介

联系我们