第六节、双目视觉之相机标定

您所在的位置：网站首页 › labview图像像素坐标 › 第六节、双目视觉之相机标定

第六节、双目视觉之相机标定

2023-08-09 14:14| 来源: 网络整理| 查看: 265

去年三四月份实验室做了一个机器人与视觉识别系统的项目，主要就是利用双目摄像头进行物体空间坐标定位，然后利用机器人进行抓取物体。当时我才研一，还是个菜鸡，项目主要是几个学长负责做的，我也就是参与打打酱油，混混经验。现在过了一年多了，机器人一直在实验室放着，空着也是浪费，所以就想搞点事情。这里我们就先从利用双目摄像头进行空间定位说起，因为这是整个项目的核心部分。

双目视觉是建立在几何数学的基础上，数学推导是枯燥乏味的。因此这里不去过多的介绍数学原理，只是简要的叙述一下双目视觉的流程。

双目视觉主要包括相机标定、图片畸变矫正、摄像机校正、图片匹配、3D恢复五个部分。

下面我们从相机标定开始说起。相机标定的目的有两个。

第一，要还原摄像头成像的物体在真实世界的位置就需要知道世界中的物体到计算机图像平面是如何变换的，相机标定的目的之一就是为了搞清楚这种变换关系，求解内外参数矩阵。第二，摄像机的透视投影有个很大的问题——畸变。摄像头标定的另一个目的就是求解畸变系数，然后用于图像矫正。一、三大坐标系

谈到相机标定，我们不得不说起摄相机坐标系、世界坐标系、图像坐标系。

上图是三个坐标的示意简图，通过它大家可以对三个坐标有一个直观的认识。

世界坐标系$(X_w,Y_w,Z_w)$（等同$(x_w,y_w,z_w)$）：目标物体位置的参考系。除了无穷远，世界坐标可以根据运算方便与否自由放置，单位为长度单位如$mm$。在双目视觉中世界坐标系主要有三个用途：标定时确定标定物的位置；作为双目视觉的系统参考系，给出两个摄像机相对世界坐标系的关系，从而求出相机之间的相对关系；作为重建得到三维坐标的容器，存放重建后的物体的三维坐标。世界坐标系是将看见中物体纳入运算的第一站。摄像机坐标系$(X_c,Y_c,Z_c)$（等同$(x_c,y_c,z_c)$）：摄像机站在自己角度上衡量的物体的坐标系。摄像机坐标系的原点在摄像机的光心上，$z$轴与摄像机光轴平行。它是与拍摄物体发生联系的桥头堡，世界坐标系下的物体需先经历刚体变化转到摄像机坐标系，然后在和图像坐标系发生关系。它是图像坐标与世界坐标之间发生关系的纽带，沟通了世界上最远的距离。单位为长度单位如$mm$。图像坐标系$(x,y)$：以CCD 图像平面的中心为坐标原点，为了描述成像过程中物体从相机坐标系到图像坐标系的投影透射关系而引入，方便进一步得到像素坐标系下的坐标。图像坐标系是用物理单位（例如毫米）表示像素在图像中的位置。像素坐标系$(u,v)$：以 CCD 图像平面的左上角顶点为原点，为了描述物体成像后的像点在数字图像上（相片）的坐标而引入，是我们真正从相机内读取到的信息所在的坐标系。像素坐标系就是以像素为单位的图像坐标系。

备注：有很多人把图像坐标系和像素坐标系合在一起，称作三大坐标系，也有人分开，称为四大坐标系。

1.1 图像坐标系到像素坐标系

讲到这里，你可能会问有了图像坐标系为什么还要建一个像素坐标系？

我们以图像左上角为原点建立以像素为单位的直接坐标系$u$-$v$。像素的横坐标$u$与纵坐标$v$分别是在其图像数组中所在的列数与所在行数。

由于$(u,v)$只代表像素的列数与行数，而像素在图像中的位置并没有用物理单位表示出来，所以，我们还要建立以物理单位（如毫米）表示的图像坐标系$x$-$y$。

将相机光轴与图像平面的交点（一般位于图像平面的中心处，也称为图像的主点（principal point）定义为该坐标系的原点$O_1$，且$x$轴与$u$轴平行，$y$轴与$v$轴平行，假设$(u_0,v_0)$代表$O_1$在$u$-$v$坐标系下的坐标，$dx$与$dy$分别表示每个像素在横轴$x$和纵轴$y$上的物理尺寸，则图像中的每个像素在$u$-$v$坐标系中的坐标和在$x$-$y$坐标系中的坐标之间都存在如下的关系：

$$u=\frac{x}{dx}+u_0$$

$$v=\frac{y}{dy}+v_0$$

其中，我们假设物理坐标系中的单位为毫米，那么$dx$的的单位为:毫米/像素。那么$x/dx$的单位就是像素了，即和$u$的单位一样都是像素。为了使用方便，可将上式用齐次坐标与矩阵形式表示为：

$$\begin{bmatrix}u\\v\\1\end{bmatrix}=\begin{bmatrix}\frac{1}{dx}&0&u_0\\0&\frac{1}{dy}&v_0\\0&0&1\end{bmatrix}\begin{bmatrix}x\\y\\1\end{bmatrix}$$

为了让你更直接的理解这一块内容，我们举个例子，由于被摄像机摄物体的图像经过镜头投影到CCD芯片上(像平面)：

我们设CCD的大小为$8×6mm$,而拍摄到的图像大小为$640×480$，则$dx=\frac{1}{80}mm$/像素，$dy=\frac{1}{80}mm$/像素,$u_0=320$,$v_0=240$。

上面的矩阵公式运用了齐次坐标，初学者可能会感到有些迷惑。大家会问：怎样将普通坐标转换为齐次坐标呢？齐次坐标能带来什么好处呢？

这里对齐次坐标做一个通俗的解释。此处只讲怎么将普通坐标改写为齐次坐标及为什么引入齐次坐标。这里只做一个通俗但不太严谨的表述。力求简单明了。针对齐次坐标的严谨的纯数学推导，可参见“周兴和版的《高等几何》---1.3拓广平面上的齐次坐标”。玉米曾详细读过《高等几何》这本书，但觉得离计算机视觉有点远，是讲纯数学的投影关系的，较为生涩难懂。

齐次坐标可以理解为在原有坐标后面加一个“小尾巴”。将普通坐标转换为齐次坐标，通常就是在增加一个维度，这个维度上的数值为1。如图像坐标系$(u,v)$转换为$(u,v,1)$一样。对于无穷远点，小尾巴为0。注意，给零向量增加小尾巴，数学上无意义。

那么，为什么计算机视觉在坐标运算时要加上这个“小尾巴”呢？

将投影平面扩展到无穷远点。如对消隐点(vanishing point)的描述；使得计算更加规整；

如果用普通坐标来表达的话，会是下面的样子：

$$\begin{bmatrix}u\\v\end{bmatrix}=\begin{bmatrix}\frac{1}{dx}&0\\0&\frac{1}{dy}\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}+\begin{bmatrix}u_0\\v_0\end{bmatrix}$$

这样的运算形式会给后面的运算带来一定的麻烦，所以齐次坐标是一个更好的选择。

齐次坐标还有一个重要的性质，伸缩不变性。即：设齐次坐标$M$，则$αM=M$。

我们介绍过了像素坐标系之后，我们在此三大坐标系的问题上。我们想知道这三个坐标系有什么样的关系，我们先从下图说起：

图中显示，世界坐标系通过刚体变换到达摄像机坐标系，然后摄像机坐标系通过透视投影变换到达图像坐标系。可以看出，世界坐标与图像坐标的关系建立在刚体变换和透视投影变换的基础上。

1.2 世界坐标系到摄像机坐标系

首先，让我们来看一下刚体变换是如何将世界坐标系与图像坐标系联系起来的吧。这里，先对刚体变换做一个介绍：

刚体变换(regidbody motion)：三维空间中，当物体不发生形变时，对一个几何物体作旋转，平移的运动，称之为刚体变换。

因为世界坐标系和摄像机坐标都是右手坐标系，所以其不会发生形变。我们想把世界坐标系下的坐标转换到摄像机坐标下的坐标，如下图所示，可以通过刚体变换的方式。空间中一个坐标系，总可以通过刚体变换转换到另外一个个坐标系的。

下面看一下，二者之间刚体变换的数学表达：

$$\begin{bmatrix}X_c\\Y_c\\Z_c\end{bmatrix}=\begin{bmatrix}r_{00}&r_{01}&r_{02}\\r_{10}&r_{11}&r_{12}\\r_{20}&r_{21}&r_{22}\end{bmatrix}\begin{bmatrix}X_w\\Y_w\\Z_w\end{bmatrix}+\begin{bmatrix}T_x\\T_y\\T_z\end{bmatrix}$$

对应的齐次表达式为：

$$\begin{bmatrix}X_c\\Y_c\\Z_c\\1\end{bmatrix}=\begin{bmatrix}R&t\\0_3^T&1\end{bmatrix}\begin{bmatrix}X_w\\Y_w\\Z_w\\1\end{bmatrix}=\begin{bmatrix}r_1&r_2&r_3&t\end{bmatrix}\begin{bmatrix}X_w\\Y_w\\0\\1\end{bmatrix}=\begin{bmatrix}r_1&r_2&t\end{bmatrix}\begin{bmatrix}X_w\\Y_w\\1\end{bmatrix}$$

其中，$R$是$3×3$的正交单位矩阵（即旋转矩阵），$t$为平移向量，$R$、$t$与摄像机无关，所以称这两个参数为摄像机的外参数(extrinsic parameter)，可以理解为两个坐标原点之间的距离，因其受$x$,$y$,$z$三个方向上的分量共同控制，所以其具有三个自由度。

我们假定在世界坐标系中物点所在平面过世界坐标系原点且与$Z_w$轴垂（也即棋盘平面与$X_w$-$Y_w$平面重合，目的在于方便后续计算），则$Z_w=0$。

1.3 摄像机坐标系到图像坐标系

首先，让我们来看一下透视投影是如何将摄像机坐标系与图像坐标系联系起来的吧。这里，先对透视投影做一个介绍：

透视投影(perspective projection)：用中心投影法将形体投射到投影面上，从而获得的一种较为接近视觉效果的单面投影图。有一点像皮影戏。它符合人们心理习惯，即离视点近的物体大，离视点远的物体小，不平行于成像平面的平行线会相交于消隐点(vanish point)

这里我们还是拿针孔成像来说明（除了成像亮度低外，成像效果和透视投影是一样的，但是光路更简单）

下图是针kong-摄像机的基本模型。平面$π$称为摄像机的像平面，点$O_c$称为摄像机中心（或光心），$f$成为摄像机的焦距，$O_c$为端点且垂直于像平面的射线成为光轴或主轴，主轴与像平面的交点$p$是摄像机的主点。

如图所示，图像坐标系为$o$-$xy$，摄像机坐标系为$O_c$-$x_cy_cz_c$。记空间点$X_c$摄像机坐标系中的齐次坐标为: $$X_c=\begin{bmatrix}x_c&y_c&z_c&1\end{bmatrix}^T$$

它的像点$m$在图像坐标系中的齐次坐标记为：

$$m=\begin{bmatrix}x&y&1\end{bmatrix}^T$$

根据三角形相似原理，可得：

$$x=\frac{fx_c}{z_c}$$

$$y=\frac{fy_c}{z_c}$$

我们使用矩阵表示为： $$z_c\begin{bmatrix}x\\y\\1\end{bmatrix}=\begin{bmatrix}f&0&0&0\\0&f&0&0\\0&0&1&0\end{bmatrix}\begin{bmatrix}x_c\\y_c\\z_c\\1\end{bmatrix}=\begin{bmatrix}f&0&0\\0&f&0\\0&0&1\end{bmatrix}\begin{bmatrix}1&0&0&0\\0&1&0&0\\0&0&1&0\end{bmatrix}\begin{bmatrix}x_c\\y_c\\z_c\\1\end{bmatrix}$$

注意由于齐次坐标的伸缩不变性，$z_c\begin{bmatrix}x&y&1\end{bmatrix}^T$和$\begin{bmatrix}x&y&1\end{bmatrix}^T$表示的是同一点。

1.4 总结

我们已经介绍了各个坐标系之间的转换过程，但是我们想知道的是如何从世界坐标系转换到像素坐标系，因此我们需要把上面介绍到的联系起来：

将三者相乘，可以把这三个过程和在一起，写成一个矩阵：

$$z_c\begin{bmatrix}u\\v\\1\end{bmatrix}=z_c\begin{bmatrix}\frac{1}{d_x}&0& u_0\\0&\frac{1}{d_y}&v_0\\0&0&\end{bmatrix}\begin{bmatrix}x\\y\\1\end{bmatrix}=\begin{bmatrix}\frac{1}{d_x}&0&u_0\\0&\frac{1}{d_y}&v_0\\0&0&1\end{bmatrix}\begin{bmatrix}f&0&0&0\\0&f&0&0\\0&0&1&0\end{bmatrix}\begin{bmatrix}x_c\\y_c\\z_c\\1\end{bmatrix}$$

$$=\begin{bmatrix}\frac{1}{d_x}&0& u_0\\0&\frac{1}{d_y}&v_0\\0&0&1\end{bmatrix}\begin{bmatrix}f&0&0&0\\0&f&0&0\\0&0&1&0\end{bmatrix}\begin{bmatrix}r_{00}&r_{01}&r_{02}&T_x\\r_{10}&r_{11}&r_{12}&T_y\\r_{20}&r_{21}&r_{22}&T_z\\0&0&0&1\end{bmatrix}\begin{bmatrix}x_w\\y_w\\z_w\\1\end{bmatrix}$$

我们取世界坐标到图像坐标变换矩阵P如下：

$P=\begin{bmatrix}\frac{1}{d_x}&0& u_0\\0&\frac{1}{d_y}&v_0\\0&0&1\end{bmatrix}\begin{bmatrix}f&0&0&0\\0&f&0&0\\0&0&1&0\end{bmatrix}\begin{bmatrix}r_{00}&r_{01}&r_{02}&T_x\\r_{10}&r_{11}&r_{12}&T_y\\r_{20}&r_{21}&r_{22}&T_z\\0&0&0&1\end{bmatrix}$

P就表示了一个投影相机，有下面公式：

其中：

$P=\begin{bmatrix}P_{00}&P_{01}&P_{02}&P_{03}\\P_{10}&P_{11}&P_{12}&P_{13}\\P_{20}&P_{21}&P_{22}&P_{23}\end{bmatrix}$

我们设：

$k_u=\frac{1}{d_x}$$k_v=\frac{1}{d_y}+v_0$

最后用一幅图来总结从世界坐标系到像素坐标系（不考虑畸变）的转换关系：

二、图片矫正

我们在摄像机坐标系到图像坐标系变换时谈到透视投影。摄像机拍照时通过透镜把实物投影到像平面上，但是透镜由于制造精度以及组装工艺的偏差会引入畸变，导致原始图像的失真。因此我们需要考虑成像畸变的问题。

透镜的畸变主要分为径向畸变和切向畸变，还有薄透镜畸变等等，但都没有径向和切向畸变影响显著，所以我们在这里只考虑径向和切向畸变。

2.1 径向畸变

顾名思义，径向畸变就是沿着透镜半径方向分布的畸变，产生原因是光线在原理透镜中心的地方比靠近中心的地方更加弯曲，这种畸变在普通廉价的镜头中表现更加明显，径向畸变主要包括桶形畸变和枕形畸变两种。以下分别是枕形和桶形畸变示意图：

它们在真实照片中是这样的：

像平面中心的畸变为0，沿着镜头半径方向向边缘移动，畸变越来越严重。畸变的数学模型可以用主点（principle point）周围的泰勒级数展开式的前几项进行描述，通常使用前两项，即$k_1$和$k_2$，对于畸变很大的镜头，如鱼眼镜头，可以增加使用第三项$k_3$来进行描述，成像仪上某点根据其在径向方向上的分布位置，调节公式为：

$$x_0=x(1+k_1r^2+k_2r^4+k_3r^6)$$

$$y_0=y(1+k_1r^2+k_2r^4+k_3r^6)$$

式里$(x_0,y_0)$是畸变点在像平面的原始位置，$(x,y)$是畸变较正后新的位置，下图是距离光心不同距离上的点经过透镜径向畸变后点位的偏移示意图，可以看到，距离光心越远，径向位移越大，表示畸变也越大，在光心附近，几乎没有偏移。

2.2 切向畸变

切向畸变是由于透镜本身与相机传感器平面（像平面）或图像平面不平行而产生的，这种情况多是由于透镜被粘贴到镜头模组上的安装偏差导致。畸变模型可以用两个额外的参数$p_1$和$p_2$来描述：

$$x_0=2p_1xy+p_2(r^2+2x^2)+1$$

$$y_0=p_2(r^2+2y^2)+2p_2xy+1$$

下图显示某个透镜的切向畸变示意图，大体上畸变位移相对于左下——右上角的连线是对称的，说明该镜头在垂直于该方向上有一个旋转角度。

径向畸变和切向畸变模型中一共有5个畸变参数，在Opencv中他们被排列成一个$5×1$的矩阵，依次包含$k_1$、$k_2$、$p_1$、$p_2$、$k_3$，经常被定义为Mat矩阵的形式，如Mat distCoeffs=Mat（1,5，CV_32FC1，Scalar::all（0））；这5个参数就是相机标定中需要确定的相机的5个畸变系数。求得这5个参数后，就可以校正由于镜头畸变引起的图像的变形失真，下图显示根据镜头畸变系数校正后的效果：

三、张氏标定法

相机标定的目的就是建立摄像机图像像素位置与物体空间位置之间的关系，即世界坐标系与图像坐标系之间的关系。方法就是根据摄像机模型，由已知特征点的坐标求解摄像机的模型参数，从而可以从图像出发恢复出空间点三维坐标，即三维重建。所以要求解的参数包括4个内参数和5个畸变参数，还有外部参数旋转矩阵和平移矩阵。

“张氏标定”是指张正友教授于1998年提出的单平面棋盘格的摄像机标定方法。张氏标定法已经作为工具箱或封装好的函数被广泛应用。张氏标定的原文为“A Flexible New Technique forCamera Calibration”。此文中所提到的方法，为相机标定提供了很大便利，并且具有很高的精度。从此标定可以不需要特殊的标定物，只需要一张打印出来的棋盘格。

上文中我们已经得到了像素坐标系和世界坐标系下的坐标映射关系，我们假设标定棋盘位于世界坐标中zw=0平面，则化简前文中的公式：

$$z_c\begin{bmatrix}u\\v\\1\end{bmatrix}=\begin{bmatrix}f_x&\gamma&u_0\\0&f_y&v_0\\0&0&1\end{bmatrix}\begin{bmatrix}r_{00}&r_{01}&r_{02}&T_x\\r_{10}&r_{11}&r_{12}&T_y\\r_{20}&r_{21}&r_{22}&T_z\\0&0&0&1\end{bmatrix} \begin{bmatrix}x_w\\y_w\\0\\1\end{bmatrix}=\begin{bmatrix}f_x&\gamma&u_0\\0&f_y&v_0\\0&0&1\end{bmatrix}\begin{bmatrix}r_{00}&r_{01}&T_x\\r_{10}&r_{11}&T_y\\r_{20}&r_{21}&T_z\end{bmatrix} \begin{bmatrix}x_w\\y_w\\1\end{bmatrix} $$

$$=\begin{bmatrix}f_x&\gamma&u_0\\0&f_y&v_0\\0&0&1\end{bmatrix} \begin{bmatrix}r_1&r_2&t\end{bmatrix} \begin{bmatrix}x_w\\y_w\\1\end{bmatrix}$$

其中，$u$,$v$表示像素坐标系中的坐标，$f_x=\frac{f}{dx}$,$f_y=\frac{f}{dy}$,$u_0$,$x_0$,γ(由于制造误差产生的两个坐标轴偏斜参数，通常很小，如果按上文中矩阵运算得到的值即为0）表示5个相机内参,$R$,$t$示相机外参,$x_w$,$y_w$,$z_w$ 表示世界坐标系中的坐标。

$f_x$,$f_y$和物理焦距f之间的关系为：$f_x=fs_x$和$f_y=fs_y$。其中$s_x=\frac{1}{dx}$表示$x$方向上的1毫米长度所代表像素值，即像素/单位毫米，$fx$,$fy$是在相机标定中整体计算的，而不是通过该公式计算的。

单应性(在计算机视觉中被定义为一个平面到另一个平面的投影映射)矩阵定义为：

$$H=\begin{bmatrix}f_x&\gamma&u_0\\0&f_y&v_0\\0&0&1\end{bmatrix} \begin{bmatrix}r_1&r_2&t\end{bmatrix}$$

那么现在就有：

$$z_c\begin{bmatrix}u\\v\\1\end{bmatrix}=H\begin{bmatrix}x_w\\y_w\\1\end{bmatrix}$$

我们如果求取H的值？

大家可以分析一下，H是一个三$3×3$的矩阵，并且有一个元素是作为齐次坐标。因此，H有8个未知量待解。

$(x_w,y_w)$作为标定物的空间坐标，可以由设计者人为控制，是已知量。$(u,v)$是像素坐标，我们可以直接通过摄像机获得。对于一组对应$(x_w,y_w)$-$(u,v)$我们可以获得两组方程。

现在有8个未知量需要求解，所以我们至少需要八个方程。所以需要四个对应点。四点即可算出，图像平面到世界平面的单应性矩阵$H$。

这也是张氏标定采用四个角点的棋盘格作为标定物的一个原因。张氏标定就是利用一张打印的棋盘格，然后对每个角点进行标记其在像素坐标系的像素点坐标，以及在世界坐标系的坐标，张氏标定证明通过4组以上的点就可以求解出H矩阵的值，但是为了减少误差，具有更强的鲁棒性，我们一般会拍摄许多张照片，选取大量的角点进行标定。具体过程如下：

打印一张棋盘格标定图纸，将其贴在平面物体的表面. 拍摄一组不同方向棋盘格的图片，可以通过移动相机来实现，也可以移动标定图片来实现。对于每张拍摄的棋盘图片，检测图片中所有棋盘格的特征点（角点，也就是下图中黑白棋盘交叉点，中间品红色的圆圈内就是一个角点）。我们定义打印的棋盘图纸位于世界坐标系zw=0的平面上，世界坐标系的原点位于棋盘图纸的固定一角（比如下图中黄色点）。像素坐标系原点位于图片左上角。

因为棋盘标定图纸中所有角点的空间坐标是已知的，这些角点对应在拍摄的标定图片中的角点的像素坐标也是已知的，如果我们得到这样的$N>=4$个匹配点对（越多计算结果越鲁棒），就可以根据LM等优化方法得到单应性矩阵H。

张正友教授从数学推导上证明了张氏标定算法的可行性。但在实际标定过程中，一般使用最大似然估计进行优化。假设我们拍摄了$n$张标定图片，每张图片里有$m$个棋盘格角点。三维空间点$X_j(x_w,y_w,z_w)$经过相机内参$M$，外参$R$，$t$变换后得到的二维像素为$x’(u,v)$，假设噪声是独立同分布的，我们通过最小化$x_{ij}$(实际值：棋盘格角点在像素坐标系下的实际值), $x’$(估计值)的位置来求解上述最大似然估计问题：

$$\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{m}||x_{ij}-x'(M,R_i,t_i,X_j)||^2$$

现在我们来考虑透镜畸变的影响，由于径向畸变的影响相对较明显，所以主要考虑径向畸变参数，根据经验，通常只考虑径向畸变的前两个参数$k_1$,$k_2$就可以（增加更多的参数会使得模型变的复杂且不稳定）。实际求解中，通常把$k_1$,$k_2$也作为参数加入上述函数一起进行优化，待优化函数如下所示：

$$\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{m}||x_{ij}-x'(M,k_1,k_2,R_i,t_i,X_j)||^2$$

极大似然估计是一种估计总体未知参数的方法。它主要用于点估计问题。所谓点估计是指用一个估计量的观测值来估计未知参数的真值。说穿了就一句话：就是在参数空间中选取使得样本取得观测值的概率最大的参数。

这里我没有过多的介绍张氏标定法的数学推导过程，感兴趣的童鞋可以看一下博客最后给出来的链接。

假设我们已经通过LM求得了相机的内参$M$和外参$R$,$t$。那如果获取到图像中二维坐标，如何获取到现实中三维坐标呢？当然单目摄像机无法获取三维坐标，但能反映一定关系。综上来讲，矩阵变换公式为：

根据坐标系之间转化和相机模型，研究了极几何及基本矩阵的知识，证明了基本矩阵是求得摄像机投影矩阵的关键，根据基础矩阵F和摄像机标定阶段获取的内参数矩阵$M$，计算得到本征矩阵$E$，通过对$E$进行奇异值分解求得外参数矩阵$R$，$t$，接着求出投影矩阵$P_1$和$P_2$、重投影矩阵$Q$。OpenCV提供了两个相关的函数stereoCalibrate()和stereoRectify()。

四、使用opencv实现单目标定相机标定的目的：获取摄像机的内参和外参矩阵（同时也会得到每一幅标定图像的选择和平移矩阵），内参和外参系数可以对之后相机拍摄的图像就进行矫正，得到畸变相对很小的图像。相机标定的输入：标定图像上所有内角点的图像坐标，标定板图像上所有内角点的空间三维坐标（一般情况下假定图像位于$Z=0$平面上）。相机标定的输出：摄像机的内参、外参系数。

这三个基础的问题就决定了使用Opencv实现张正友法标定相机的标定流程、标定结果评价以及使用标定结果矫正原始图像的完整流程：

1. 准备标定图片 2. 对每一张标定图片，提取角点信息 3.对每一张标定图片，进一步提取亚像素角点信息 4. 在棋盘标定图上绘制找到的内角点（非必须，仅为了显示） 5. 相机标定 6. 对标定结果进行评价 7. 查看标定效果——利用标定结果对棋盘图进行矫正

准备标定图片

标定图片需要使用标定板在不同位置、不同角度、不同姿态下拍摄，最少需要3张，以10~20张为宜。标定板需要是黑白相间的矩形构成的棋盘图，制作精度要求较高。

这里我们使用OpenCV提供的sample程序中的标定图片，图片位于opencv(C++版本)的安装路径：opencv\sources\samples\data下：

我们先创建一个C++控制台项目，并把标定图片按如下格式存放：

sample文件夹下有两个文件夹left和right，分别对应左摄像头和右摄像头拍摄到的标定板图片：

filename.txt存放标定图片的路径，内容如下：

关于OpenCV提供的用于相机标定的API函数可以查看博客双目视觉标定程序讲解，单目标定的代码如下：

/************************************************************************************* * * Description：相机标定，张氏标定法单目标定 * Author ：JNU * Data ：2018.7.22 * ************************************************************************************/ #include #include #include #include #include #include #include using namespace cv; using namespace std; void main(char *args) { //保存文件名称 std::vector filenames; //需要更改的参数 //左相机标定，指定左相机图片路径，以及标定结果保存文件 string infilename = "sample/left/filename.txt"; //如果是右相机把left改为right string outfilename = "sample/left/caliberation_result.txt"; //标定所用图片文件的路径,每一行保存一个标定图片的路径 ifstream 是从硬盘读到内存 ifstream fin(infilename); //保存标定的结果 ofstream 是从内存写到硬盘 ofstream fout(outfilename); /* 1.读取毎一幅图像，从中提取出角点，然后对角点进行亚像素精确化、获取每个角点在像素坐标系中的坐标像素坐标系的原点位于图像的左上角 */ std::cout 为了重映射，将结果以映射的形式表达。无畸变的图像看起来和原始的图像一样，就像这个图像是用内参为newCameraMatrix的且无畸变的相机采集得到的。该函数实际上为反向映射算法构建映射，供反向映射使用。也就是，对于已经修正畸变的图像中的每个像素$(u,v)$，该函数计算原来图像（从相机中获得的原始图像）中对应的坐标系。

参数说明：

cameraMatrix：输入相机内参矩阵$$M=\begin{bmatrix}f_x&0&u_0\\0&f_y&v_0\\0&0&1\end{bmatrix}$$

distCoeffs：输入参数，相机的畸变系数$$(k_1,k_2,p_1,p_2[,k_3[,k_4,k_5,k_6[,s_1,s_2,s_3,s_4[,τ_x,τ_y]]]])$$

有4，5,8,12或14个元素。如果这个向量是空的，就认为是零畸变系数。

$R$：可选的立体修正变换矩阵，是个$3×3$的矩阵。

在单目相机例子中，$R$就设置为单位矩阵cv::Mat R = cv::Mat::eye(3, 3, CV_32F)，表示不进行立体校正。

在双目相机例子中，newCameraMatrix一般是用cv::stereoRectify()计算而来的，设置为$R_1$或$R_2$(左右相机平面行对准的校正旋转矩阵)。此外，根据$R$，新的相机在坐标空间中的取向是不同的。例如，它帮助配准双目相机的两个相机方向，从而使得两个图像的极线是水平的，且$y$坐标相同（在双目相机的两个相机谁水平放置的情况下）。

newCameraMatrix：新的相机内参矩阵

$$M=\begin{bmatrix}f_x'&0&u_0'\\0&f_y'&v_0'\\0&0&1\end{bmatrix}$$

在单目相机例子中，newCameraMatrix一般和cameraMatrix相等，或者可以用cv::getOptimalNewCameraMatrix()来计算，获得一个更好的有尺度的控制结果。

在双目相机例子中，newCameraMatrix一般是用cv::stereoRectify()计算而来的，设置为$P_1$或$P_2$(左右相机把空间3D点的坐标转换到图像的2D点的坐标的投影矩阵)。

size：未畸变的图像尺寸。 m1type：第一个输出的映射的类型，可以为 CV_32FC1, CV_32FC2或CV_16SC2，参见cv::convertMaps。 map1：第一个输出映射。 map2：第二个输出映射。 void remap(InputArray src, OutputArray dst, InputArray map1, InputArray 　　　　　　map2, int interpolation,int borderMode=BORDER_CONSTANT, const Scalar& 　　　　　　borderValue=Scalar())

函数功能：重映射：就是把一幅图像中某位置的像素放置到另一个图片指定位置的过程。

参数说明：

src：输入图像，即原图像，需要单通道8位或者浮点类型的图像 dst：输出图像，即目标图像，需和原图形一样的尺寸和类型 map1：它有两种可能表示的对象：（1）表示点（x,y）的第一个映射；（2）表示CV_16SC2，CV_32FC1等 map2：它有两种可能表示的对象：（1）若map1表示点（x,y）时，这个参数不代表任何值；（2）表示CV_16UC1，CV_32FC1类型的Y值 interpolation：插值方式，有四中插值方式：

（1）INTER_NEAREST——最近邻插值

（2）INTER_LINEAR——双线性插值（默认）

（3）INTER_CUBIC——双三样条插值（默认）

（4）INTER_LANCZOS4——lanczos插值（默认）

borderMode：边界模式，默认BORDER_CONSTANT borderValue：边界颜色，默认Scalar()黑色

程序运行后，把相机内部参数和外部参数保存在caliberation_result.txt文件中，内容如下：

每幅图像的标定误差: 第1幅图像的平均误差：0.0644823像素第2幅图像的平均误差：0.0769712像素第3幅图像的平均误差：0.057877像素第4幅图像的平均误差：0.0596713像素第5幅图像的平均误差：0.0625956像素第6幅图像的平均误差：0.0658863像素第7幅图像的平均误差：0.0568134像素第8幅图像的平均误差：0.0643699像素第9幅图像的平均误差：0.058048像素第10幅图像的平均误差：0.0565483像素第11幅图像的平均误差：0.0590138像素第12幅图像的平均误差：0.0569968像素第13幅图像的平均误差：0.0698826像素总体平均误差:0.0622428像素相机内参数矩阵: [530.5277314196954, 0, 338.8371277433631; 0, 530.5883296858968, 231.5390118666163; 0, 0, 1] 畸变系数: [-0.2581406917163123, -0.11124480187392, 0.0004630258905514519, -0.0009475605555950018, 0.413646790569884] 第1幅图像的旋转向量: [-75.22204622827574; -109.7328226714255; 412.7511174854986] 第1幅图像的旋转矩阵: [0.9927105083879407, -0.1161407096490343, -0.03220531164846807; 0.1168004495051158, 0.9929655913965856, 0.01941621224214358; 0.02972375365863362, -0.02303627280285992, 0.999292664139887] 第1幅图像的平移向量: [-1.985720132175791; -2.010141521348128; 0.1175016759367312] 第2幅图像的旋转向量: [-57.88571684656549; 88.73102475029921; 365.4767680110305] 第2幅图像的旋转矩阵: [-0.880518198944593, 0.2965025784551226, -0.36982958548071; -0.4330747951156081, -0.8203927789645991, 0.3733656519530371; -0.192701642865192, 0.4889191233652108, 0.8507785655767596] 第2幅图像的平移向量: [-2.431974050326802; -0.2015324617416875; 0.2103186188188722] 第3幅图像的旋转向量: [-38.96229403649615; -101.619482335263; 328.7991741655258] 第3幅图像的旋转矩阵: [0.7229826652152683, -0.6501194230369263, -0.2337537199455046; 0.6686409526220074, 0.7435854196067706, -1.49985835111166e-05; 0.1738256088007802, -0.1562864662674188, 0.9722958388199968] 第3幅图像的平移向量: [1.726707502757928; 2.49410066154742; -0.5169212442744683] 第4幅图像的旋转向量: [-99.94408740929534; -67.11904896100746; 341.7035262057663] 第4幅图像的旋转矩阵: [-0.4166240767662854, 0.8762113538151707, -0.2422355095852507; -0.7194830230098562, -0.4806860756468779, -0.5012834290895748; -0.5556694685325433, -0.03456240912595265, 0.8306845861192869] 第4幅图像的平移向量: [-2.144507828065959; -2.137658756455213; 0.3861555312888436] 第5幅图像的旋转向量: [63.1817601794685; -117.2855578733511; 327.5340459209377] 第5幅图像的旋转矩阵: [-0.1237680939389874, -0.9830519969136794, -0.1352413778646805; 0.8454470843144938, -0.03311262698003439, -0.5330316890754268; 0.5195196690663707, -0.1803117447603135, 0.8352167312468426] 第5幅图像的平移向量: [-0.3394208745634724; -2.941274925899604; 0.7239987875443074] 第6幅图像的旋转向量: [176.6380486063267; -65.02048705679623; 345.2669628180993] 第6幅图像的旋转矩阵: [-0.4823787195065527, 0.3144101256594393, 0.8175922234525194; -0.5902636261183672, -0.8063068742380883, -0.03818476447485269; 0.6472245534965549, -0.5010144682933011, 0.5745301383843724] 第6幅图像的平移向量: [0.144403698794371; -2.686413562533621; -0.08279238304814077] 第7幅图像的旋转向量: [23.37912628758978; -71.28708027930361; 401.7783087659996] 第7幅图像的旋转矩阵: [0.950756682549477, -0.3056521783663705, -0.05136610212392408; 0.3046663933949521, 0.9520979509442887, -0.02622747687825021; 0.05692204602107398, 0.009286423831555549, 0.9983354361181394] 第7幅图像的平移向量: [0.4433620069430767; -2.778035766165631; 0.1565310822654871] 第8幅图像的旋转向量: [84.53413910746443; -88.75268154189268; 326.4489757550855] 第8幅图像的旋转矩阵: [-0.882333219506006, -0.1387045774185431, 0.4497211691251699; -0.1080922696912742, -0.870309912144045, -0.4804963247068739; 0.4580438308602738, -0.4725692510383723, 0.7529104541603049] 第8幅图像的平移向量: [0.3026042878663719; -2.832559861959414; 0.5197600078874884] 第9幅图像的旋转向量: [-66.87955552666558; -81.79728232518671; 287.3798612501427] 第9幅图像的旋转矩阵: [-0.06408698919457989, 0.997286705569611, 0.03622270986668297; -0.8668814706204128, -0.03765202403427882, -0.4970903750638435; -0.4943777641752957, -0.06325782149453277, 0.8669423708118097] 第9幅图像的平移向量: [1.918018245182696; 2.198445482038513; 0.6398190872020209] 第10幅图像的旋转向量: [51.38889872566385; -112.4792732922813; 348.8614284720838] 第10幅图像的旋转矩阵: [0.8410751829508221, 0.5075468667660225, 0.1870527055678015; -0.521221221444936, 0.852916565973049, 0.0293559159998552; -0.1446408481020841, -0.1221863720908967, 0.9819111546039054] 第10幅图像的平移向量: [0.2388869800501047; 2.534868757127185; 0.05816455567725017] 第11幅图像的旋转向量: [55.25157597573984; -103.974863603741; 332.3331998859927] 第11幅图像的旋转矩阵: [0.7603104175748064, -0.6302201082550355, -0.1573235013538499; 0.6075084686586226, 0.7756458925501082, -0.1711926104661106; 0.2299163531271294, 0.0345841657577196, 0.9725957053388442] 第11幅图像的平移向量: [-0.02801590475009446; -3.011578659457537; 0.5796308944847007] 第12幅图像的旋转向量: [37.20265745451167; -92.46700742075161; 299.3885458741333] 第12幅图像的旋转矩阵: [0.1968247409885918, -0.9604756585987335, -0.1968413843024444; 0.9041946443200382, 0.2554459280495449, -0.3423148010616344; 0.3790673640894628, -0.1106069034112951, 0.9187350251296783] 第12幅图像的平移向量: [-0.4442257873668548; -2.891665626351126; -0.7306268697464358] 第13幅图像的旋转向量: [49.15686896201693; -109.7597615043953; 322.2472823512488] 第13幅图像的旋转矩阵: [-0.02527960043733595, 0.888126856668879, 0.4589026348422781; -0.9835935284565535, 0.05992383782219021, -0.170155530145356; -0.1786189031992861, -0.4556751256368033, 0.8720409779911538] 第13幅图像的平移向量: [0.2685697410235677; 2.70549028727733; 0.2575020268614151]

下面在附上一份来自于其他博客的源码：

/************************************************************************************* * * Description：相机标定，张氏标定法单目标定，一次只能标定一个相机 OPENCV3.0 单目摄像头标定(使用官方自带的标定图片) https://blog.csdn.net/zc850463390zc/article/details/48946855 * Author ：JNU * Data ：2018.7.22 * ************************************************************************************/ #include #include #include "cv.h" #include #include using namespace std; using namespace cv; //程序运行之前需要更改的参数 //使用官方标定图片集？ //#define SAMPLE #define MY_DATA #ifdef SAMPLE /* 官方数据集 */ const int imageWidth = 640; //摄像头的分辨率 const int imageHeight = 480; const int boardWidth = 9; //横向的角点数目 const int boardHeight = 6; //纵向的角点数据 const int boardCorner = boardWidth * boardHeight; //总的角点数据 const int frameNumber = 13; //相机标定时需要采用的图像帧数 const int squareSize = 20; //标定板黑白格子的大小单位mm const Size boardSize = Size(boardWidth, boardHeight); const char imageFilePathFormat[] = "sample/right%02d.jpg"; //用于标定的图片路径，格式化字符串sample/left%02d.bmp表明图片路径为 sample/left01.bmp - sample/leftxx.bmp #elif defined MY_DATA //自己的数据 const int imageWidth = 1600; //摄像头的分辨率 const int imageHeight = 1200; const int boardWidth = 9; //横向的角点数目 const int boardHeight = 6; //纵向的角点数据 const int boardCorner = boardWidth * boardHeight; //总的角点数据 const int frameNumber = 10; //相机标定时需要采用的图像帧数 const int squareSize = 30; //标定板黑白格子的大小单位mm const Size boardSize = Size(boardWidth, boardHeight); Size imageSize = Size(imageWidth, imageHeight); const char imageFilePathFormat[] = "image/right/%d.bmp"; #endif // SAMPLE Mat intrinsic; //相机内参数 Mat distortion_coeff; //相机畸变参数 vector rvecs; //旋转向量 vector tvecs; //平移向量 vector corners; //各个图像找到的角点的集合和objRealPoint 一一对应 vector objRealPoint; //各副图像的角点的实际物理坐标集合 vector corner; //某一副图像找到的角点 Mat rgbImage, grayImage; /*计算标定板上模块的实际物理坐标*/ void calRealPoint(vector& obj, int boardwidth, int boardheight, int imgNumber, int squaresize) { // Mat imgpoint(boardheight, boardwidth, CV_32FC3,Scalar(0,0,0)); vector imgpoint; for (int rowIndex = 0; rowIndex < boardheight; rowIndex++) { for (int colIndex = 0; colIndex < boardwidth; colIndex++) { // imgpoint.at(rowIndex, colIndex) = Vec3f(rowIndex * squaresize, colIndex*squaresize, 0); imgpoint.push_back(Point3f(rowIndex * squaresize, colIndex * squaresize, 0)); } } for (int imgIndex = 0; imgIndex < imgNumber; imgIndex++) { obj.push_back(imgpoint); } } /*设置相机的初始参数也可以不估计*/ void guessCameraParam(void) { /*分配内存*/ intrinsic.create(3, 3, CV_64FC1); distortion_coeff.create(5, 1, CV_64FC1); /* fx 0 cx 0 fy cy 0 0 1 */ intrinsic.at(0, 0) = 256.8093262; //fx intrinsic.at(0, 2) = 160.2826538; //cx intrinsic.at(1, 1) = 254.7511139; //fy intrinsic.at(1, 2) = 127.6264572; //cy intrinsic.at(0, 1) = 0; intrinsic.at(1, 0) = 0; intrinsic.at(2, 0) = 0; intrinsic.at(2, 1) = 0; intrinsic.at(2, 2) = 1; /* k1 k2 p1 p2 p3 */ distortion_coeff.at(0, 0) = -0.193740; //k1 distortion_coeff.at(1, 0) = -0.378588; //k2 distortion_coeff.at(2, 0) = 0.028980; //p1 distortion_coeff.at(3, 0) = 0.008136; //p2 distortion_coeff.at(4, 0) = 0; //p3 } void outputCameraParam(void) { /*保存数据*/ //cvSave("cameraMatrix.xml", &intrinsic); //cvSave("cameraDistoration.xml", &distortion_coeff); //cvSave("rotatoVector.xml", &rvecs); //cvSave("translationVector.xml", &tvecs); /*保存数据*/ /*输出数据*/ FileStorage fs("intrinsics.yml", FileStorage::WRITE); if (fs.isOpened()) { fs

【本文地址】

公司简介

联系我们