小花仙子风格化三维静帧全流程案例不是你一个人在学

2022-12-14 11:58 作者:bili_1469121520 0人读过 | 我要投稿

具体内容放在我的首页动态介绍了

在上一讲中，我们对卷积神经网络中的卷积操作进行了详细的解读，但仅仅是对二维图像，即通道数为 1 的图像（灰度图）进行了卷积，对于三维或者更高维的图像卷积显然并没有这么简单。

如果图像大小为 6*6*3，那么这里的 3 指的是三个颜色通道，你可以将其理解为 3 个 6*6 的图像的堆叠，如果要对此图像进行卷积的话，我们的滤波器也需要变成三维的，假设采用一个 3*3*3 的滤波器对其进行卷积（这里需要注意的是，滤波器的通道数一定要等于输入图像的通道数），根据 ((n+2p-f)/s)+1 的计算公式我们可以知道输出图像的大小为 4*4*1，由一个滤波器进行卷积之后输出图像的通道不是 3 而是 1 了。

我们用第一个滤波器进行卷积得到一个 4*4 的输出，然后用第二个滤波器进行卷积又得到一个 4*4 的输出，将这个输出放到第一个输出后面，形成了一个 4*4*2 的输出，这里的 2 的就是滤波器的个数。

关于多通道卷积的另一种理解类似于 DNN 中的标准神经网络中的 Z=Wx+b 的线性计算，其中 x 为输入的原始图像，W 为滤波器，b 偏差项，卷积过程就类似与标准神经网络的线性计算，完了之后利用激活函数进行激活。还有一个关键问题就是卷积层有多少参数，卷积层的参数通常在于滤波器 W，根据滤波器的大小，我们可以计算一个滤波器的参数数量为 f*f*nc，其中 nc 为通道熟量，那 k 个滤波器所含的参数数量则为 f*f*nc*k。

卷积过程到此就差不多解释完了。我们再看 CNN 的另一个重要操作——池化（pooling）。简单来说，池化层是用来缩减模型大小，提高模型计算速度以及提高所提取特征的鲁棒性。池化操作通常有两种，一种是常用的最大池化（max pooling），另一种是不常用的平均池化（average pooling）。池化操作过程也非常简单，假设池化层的输入为一个 4*4 的图像，我们用最大池化对其进行池化，执行最大池化的树池是一个 2*2 的矩阵，执行过程就是将输入矩阵拆分为不同区域，对于 2*2 的输出而言，输出的每个元素都是其对应区域的最大元素值

标签：

小花仙子风格化三维静帧全流程案例不是你一个人在学

小花仙子风格化三维静帧全流程案例不是你一个人在学的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

小花仙子风格化三维静帧全流程案例不是你一个人在学

本文作者的其他文章

小花仙子风格化三维静帧全流程案例不是你一个人在学的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

小花仙子风格化三维静帧全流程案例不是你一个人在学的评论 (共条)