【计算机视觉图像处理】这也太全了!图像处理、特征提取、目标检测、人脸识别、图像分

二、图像预处理
RGB加法混色(叠加白)
CMYK减法混色(叠加黑)
HSV色调饱和度
CIE-XYZ
图像预处理实际就是图像增强

图像预处理方法

点运算就是对直方图进行运算

分段(解决亮暗问题)

CLAHE 自适应直方图均衡



空间域卷积就是频域上×

卷积填充

最好的是补零的方式,尽量避免用大的卷积核去卷积,可以把大的卷积核变成若干个小的卷积核


高斯核越大图像越模糊,越小关注区域越集中
用在高斯金字塔

计算量减小,变成两个一维的



拉普拉斯滤波器整个元素相加为0
凸显细节(锐化)




三 图像特征提取
基于关键点
一阶导数取到极值是图像的边缘





四 神经网络

BP神经网络



只能变权重

期望的输出和实际的输出越接近越好
目标函数降到最小

局部最小值





前面传过来的残差是一个加权和





目标函数:交叉熵
先特征选择,再特征提取(先要有,再选能用的)
隐藏层的作用就是特征提取
前向传播是为了计算损失,反向传播为了更新权重。
五 深度学习基础

1.选择合适的目标函数

第一个y是实际的,第二个是计算机跑出来的
2.softmax层(全连接层)

3.梯度消失

若干层叠加没梯度了
4.激活函数


不会使梯度越来越小
5.学习步长的设置(优化器)

通过轮次来调整学习步长,越来越小

解决办法:(优化器)
① 设置动量

②改进(现在常用的)

避免被当前梯度带偏
③Adagrad

小了可以变大,但是变大了就不能变小了
④RMSprop

整个趋势学习步长一点点减小
⑤Adam(效果最好)

总结:上面几种优化器的比较


自适应方式
SGD随机梯度下降
算法选择:



6.如何避免过适应

权重变小!!
①早期停止训练

②权重衰减

让无用的权重尽可能为0
③Droput

大的网络中随机构造小的网络,测试时都起作用

六 CNN

1.卷积层

权重的参数是机器自己学习得到的
通道数取决与卷积核的数量


卷积核的通道要与前面图片的通道数相同
卷积核的数量与卷积后的通道数相同


明显的改善梯度消失

②池化层

通道数不变,尺度大小变小
最大池化的效果高于平均池化
③全连接层(softmax)

关于残差网络回顾

误差反向传播








图片分类





两个并行的通路
最大池化的位置要注意
卷积的表达形式

VGG层数变深了



