VGG
假设input 是224*224*3 ,kernel = 3*3 ,stride = 1 ,所以covn卷积操作不会改变图像尺寸的大小
pool池化层 kernel_size = 2*2 ,stride = 2 ,所以每经过一个池化层,图像尺寸就会减少一半,经过5个池化操作,图像缩小2的5次方倍(32倍),2*2*2*2*2=32
224/32 = 7 最后到达全连接层的尺寸为 7*7*512
VGG的网络结构

全连接层的参数占了网络参数的大半部分

Q1:为什么使用3*3的卷积核
Q2:1*1卷积核的作用是什么


各向同性缩放( 也叫:等比缩放),长宽缩放比例相同,好处是不破坏原图的比例
各向异性缩放(也叫:直接变化),直接调整图像尺寸,二不考虑图像物体发生形变

transform变换增加数据量,提高网络准确度和泛化能力

多尺度训练,只原图最小边在一个范围内变化【256--512】
然后从中随机截取224*224的图像块进行训练

VGG超参数的设置

VGG的特点

fc = 权重的转置*输入的特征+偏置b

