03-03-mp4-nn网络层-卷积层.mp4

卷积conv
卷积过程,类似于用一个模板,去图像上寻找与它相似的区域,与卷积核模式越相似,激活值越高,也就是特征图对应的位置参数越高,从而实现相同特征的提取
卷积运算,对应位置先相乘,而后把相乘的数再进行相加求和

一个卷积核在一个信号上是几维卷积,就是几维卷积
通常会涉及多个信号和多个卷积核的操作,比如在RGB三通道上,三个卷积核进行的是2D的二维卷积操作,而不是看有几个卷积核就是几维卷积!

nn.Conv2d 对多个信号进行二维卷积

RF1默认为1
根据公式,L2层的感受野=1+(3-1)=3
L3层的感受野=3+(3-1)=5
output_channels:输出通道数,也就是输出特征图的输出数量,等价于kernel的个数
dilation: 空洞卷积大小,默认为1。一般用于图像分割任务,从而增大感受野,增大感受野有利于图像分割,输出图像的一个像素能看到输入图像更大的区域
感受域:(感受野)
不管结点多深,感受域的大小始终是指输入原图的区域大小,而不是上一层的区域大小

RF1默认为1
根据公式,L2层的感受野=1+(3-1)=3
L3层的感受野=3+(3-1)=5
输出尺寸计算

dilation=1,padding=0时

三维张量实现二维卷积
输入是RGB三个通道的二维图像,其tensor是三维,然后创建三个二维的卷积核,三个卷积核分别对应三个通道channels进行卷积操作,最后三个通道的卷积结果相加,再加上偏置项bias,才得到特征图的一个像素点的值!
在这里,一个卷积核在两个维度上进行滑动,所以是二维的卷积操作!

转置卷积:用于对图像上采样UpSample


