Chainer笔记 -- SRCNN

2020-03-25 16:55 作者:nyasyamorina 0人读过 | 我要投稿

首先来说一说为什么会来写chainer, 尽管最近已经不打算再继续用chainer了, 但是对于刚接触深度学习的人来说, 极简单的安装和极简单的gpu加速使得chainer仍是一个简单快速上手的深度学习库

什么是SRCNN 论文地址: https://ieeexplore.ieee.org/document/7115171

SRCNN全称为Super Resolution Convolutional Network, 这是第一个使用深度学习的超分辨率算法 (超分辨率算法: 从低分辨率图像得到高分辨率图像的算法). SRCNN具有极其简单的结构, 甚至比许多分类器简单很多, 十分适合用来做演示.

SRCNN是在YUV通道的V上进行图像复原 (YUV图像: 使用V(亮度), 和UV(CbCr色度)) , 这比起使用RGB的CNN可以减少很多权重以加快计算速度并且不会损失细节

SRCNN一共有3层, 分别为: 提取图像特征, 非线性映射, 重构图像

ps: 卷积核尺寸为9,1,5的SRCNN也称SRCNN(9-1-5), 更改卷积核尺寸可以得到SRCNN(9-3-5), SRCNN(9-5-5), 尽管卷积核尺寸越大会提升得到图像的真实性, 但是这也会大大减慢计算速度, 所以这里使用915作栗子

如何训练SRCNN

SRCNN里的结构:

提取图像特征: 卷积核尺寸9, 输入通道1, 输出通道64, 步长1, padding -, 有bias [ReLU]

非线性映射: 卷积核尺寸1, 输入通道64, 输出通道32, 步长1, padding 0, 有bias [ReLU]

重构图像: 卷积核尺寸5, 输入通道32, 输出通道1, 步长1, padding -, 有bias

训练 train: 以下称提取图像特征为conv1, 非线性映射为conv2, 重构图像为conv3

为了加快计算速度, 我们输入使用33x33处理过的小图片块, 并且让conv1和conv3的padding为0, 那么输出图像为21x21, 对应的label为图像块中央区域, 并且loss使用均方误差函数

图像处理: 裁出需要的大小为33x33的图像A, 经过双三次插值缩小后放大得到33x33的图像B, 图像B为训练输入, 而A的从坐标(6,6)到(26,26)则为label

实际使用 test:

为了保证输出输入大小一致, 我们需要把conv1和conv3的padding设置为4和2

以下为我使用了450张不知道从哪里扒来的p站图片作为训练集, 训练了150epoches的结果, 一般来说应该训练几千甚至几万epoches的, 但是我真的没这个算力

左下是原图, 左上是缩小再放大的结果, 右下是左上经过SRNN的结果, 右上是歌词

以下是Chainer时间

如何使用Chainer

Chainer内置了大量深度学习使用的函数和连接层, 而且也拥有和其他深度学习库一样的傻瓜式一键反向传播和一键更新权重官方手册: https://docs.chainer.org/en/stable/reference/index.html

chainer的特点是可以设置连接层的输入为None, 它会在第一次调用连接层时根据输入调整内部结构, 并且chainer使用的基本数据类Variable的运算是建立在传入的数据类上的(使用Variable.data可以重新访问传入的数据), 这意味着可以完全使用cupy代替numpy达到GPU加速的效果 AMD No!

Chainer的安装: 无脑pip, 请 **ps: chainer安装时会顺便带上cuda, cupy和内置的caffe, 但是在安装时会阻止这些库的错误, 这使得chainer是唯一一个可以在termux(安卓版linux命令行模拟器)安装成功的深度学习库, 手机端开发ok

基本使用: