什么是卷积神经网络（CNN）？

2024-05-07 18:34| 来源: 网络整理| 查看: 265

卷积神经网络从其他神经网络中脱颖而出的地方在于：卷积神经网络在图像、语音或音频信号输入方面表现出超级的性能。卷积神经网络具有三个主要类型的层，分别是：

卷积层池化层全连接 (FC) 层

卷积层是卷积网络的第一层。虽然卷积层可以后跟另外的卷积层或池化层，但全连接层肯定是最后一层。随着层级的递进，卷积神经网络的复杂性也逐步增加，能够识别图像的更多部分。靠前的层关注于简单的特征，比如颜色和边缘。随着图像数据沿着卷积神经网络的层级逐渐推进，它开始识别对象中更大的元素或形状，直到最终识别出预期的对象。

卷积层

卷积层是卷积神经网络的核心构建块，负责执行大部分计算。它需要几个组件，包括输入数据、过滤器和特征图。假设输入是彩色图像，由三维的像素矩阵组成。这意味着，输入具有三个维度：高度、宽度和深度，对应于图像中的 RGB。我们还有一个特征检测器，也称为内核或过滤器，它在图像的各个感受野中移动，检查是否存在特征。这个过程称为卷积。

特征检测器是个二维权重数组，表示部分图像。虽然它们的大小可能各不相同，但过滤器大小通常为 3×3 的矩阵；这也决定了感受野的大小。然后，过滤器应用于图像的某个区域，并计算输入像素和过滤器的点积。此点积会进而提供给输出数组。接下来，过滤器移动一个步幅，重复这个过程，直到内核扫描了整个图像。来自输入和过滤器的一系列点积的最终输出称为特征图、激活图或卷积特征。

在每次卷积运算之后，卷积神经网络对特征图应用修正线性单元 (ReLU) 转换，为模型引入非线性特性。

如前所述，初始卷积层可以后跟另一个卷积层。如果是这种情况，卷积神经网络的结构就变成一个分层结构，因为后面层可以看到前面层的感受野中的像素。例如，假设我们尝试确定图像中是否包含自行车。可将自行车视为各种零件的总和，它由车架、车把、车轮、踏板等组成。自行车的每个零件构成神经网络中一个较低层次的模式，而零件的组合则表示一个较高层次的模式，从而在卷积神经网络中形成特征层次结构。

池化层

池化层也称为下采样层，它执行降维操作，旨在减少输入中参数的数量。与卷积层类似，池化运算让过滤器扫描整个输入，但区别在于，这个过滤器没有权重。内核对感受野中的值应用聚集函数，填充输出数组。有两种主要的池化类型：

最大池化：当过滤器在输入中移动时，它选择具有最大值的像素，将其发送给输出数组。顺便说一句，与平均池化相比，这种方法往往更为常用。平均池化：当过滤器在输入中移动时，它计算感受野中的平均值，将其发送给输出数组。

虽然池化层中会丢失大量信息，但它还是给卷积神经网络带来的许多好处。该层有助于降低复杂性、提高效率，并限制过度拟合的风险。

全连接层

全连接层的名称恰如其分地描述了它的含义。如前所述，输入图像的像素值并不直接连接到部分连接层的输出层。而在完全连接层中，输出层中的每个节点都直接连接到上一层中的一个节点。

该层根据通过先前层及其不同的过滤器提取的特征，执行分类任务。虽然卷积层和池化层一般使用 ReLu 函数，但完全连接层通常利用 softmax 激活函数对输入进行适当分类，从而产生 0 到 1 之间的概率。

【本文地址】

公司简介

联系我们