《PyTorch深度学习实践》完结合集

2023-03-23 17:12 作者:学虚幻引擎的小王 0人读过 | 我要投稿

理解随机分布

什么是智能？
推理
信息 = 推理 = 》决策
预测
图像和抽象对象联系起来
监督学习

基于统计

机器学习
表示学习

怎么设计学习系统？

基于规则的系统
求原函数：知识库、规则、搜索树
缺点：复杂系统，难设计维护
经典ML
手动特征提取（数据变向量）、找映射（mapping）
表示学习
Features
SVM family
DL
变换、层、学习器
无监督：Feature的训练
End to End 过程

为甚进行特征提取
维度诅咒
大数定律
特征压缩
保持高维空间的信息
表示学习（Manifold 流形）
用来降维

模型选择（经典ML）

SVM 缺点
无结构难

数学工程学

寒武纪眼睛光线
运动

视觉是分层结构

仿生学算法

反向传播 计算图是为了求链式法则的导数

【重点】学习构造模型的方法，学会基本块，可以针对任务组装自己的模型

学术 PyTorch

工业 TF

安装过程

按照官网下载

英伟达安装 CUDA，自定义
PyTorch

线性模型

过程：

DataSet
Model (选择/设计)
Training （确定权重）
inferring

> 人工 training

上图表示 ML 的过程

训练数据可以表示真实分布（整体）吗？

核心问题：

过拟合 =》泛化能力
训练集开发集
比赛时候看不到测试集

什么是模型？

思路：先用线性模型

预测结果加帽子 y_hat

怎么计算？

随即猜测
评估偏差
评估模型 =》损失

> 有点像实验设计

Error

MSE = Mean Square Error

这里用穷举

# 重要算法实现线性回归

这个和 DL 关系

用训练轮数（Epoc）绘图

观察这个，用来判断超参数

打印日志、或绘图

Visdom：时间长，断点重开

模型持久化、存盘

3D 图的绘制

》》》》》》》》》》》》》》》》》》

03 梯度下降

真实情况
目标函数多维维度灾难
措施
分治
问题：局部最优
优化问题

梯度下降算法

梯度定义：

算法 = 贪心

可以得到局部最优

DL 局部最优少

存在鞍点 g = 0【没法继续迭代】

把公式变成函数（python 类）

目的：函数图收敛

怎么看可以停？

指数平滑可以更方便看趋势

线发散的可能？

学习率太大

随机梯度下降

引入随机跨过鞍点

权衡

Batch 折中

批量的随机梯度下降 SDD

Mini-Batch ，现在用Batch 代名

04 反向传播

简单模型解析式

复杂模型
w 权重很多
计算图

绿色计算模块

矩阵乘法 matrix -cook -book

简单合并会化简模型

为增加模型复杂性，做以下变换

增加 非线性变换函数 σ

求导

链式求导

第一：制作计算图

第二：

完整的计算图

蓝色训练对象

残差项

损失

两个练习

。。。
。。。

Pytorch

构建模型主要是构建 计算图

数据集
权重

代码是构建计算图

l.backward 计算grad

w.data 不计算张量

w.grad.data.zero_() 清零

本质：

loss
backward
梯度下降更新

小问题：

绘制计算图

》》》》》》》》》》》》》》》

05 线性回归

PyTorch 的工具完成线性模型

有弹性、可拓展

步骤：

数据集
设计模型
构造 loss 和 optimizer （封装的功能）
训练周期（前馈、反馈、更新）

第一步

使用mini-batch

向量矩阵广播

mini-batch 数据需要是矩阵

第二步

PyTorch 重点构造计算图

这里是线性单元

loss 标量

nn.Module 模板

继承

函数名固定

自动 backward

Functions 类

构建自己的求导块

使用 Linear 类定义 Linear Unit

两种公式，目的拼出乘法的维度

检查：训练集、开发集都收敛

尝试不同优化器

观察损失降低的

》》》》》》》》》》》》》》》》》

06 Logistic Regression 做分类

MNIST Dataset 做分类

分类问题：

对象属于类别的概率

数据集
MNIST
CIFAR10 类别彩图

类别的概率

x 映射到【0-1】

需要用 luojisite 函数

饱和函数

因为正态分布产生的函数

x 放 y_hat 求概率

导函数 > 0
不断增加
饱和函数

所以增加了 σ() 计算模块

距离最小化

分布（这个在统计上有什么意义？

分布差异

cross-entropy 交叉熵

加- 因为最小

functional 包有函数

BCE 二分类交叉熵

框架结构

这些模块如果复杂，就单独写库/文件

得到的模型进行可视化

07 多维特征的输入

输入的X 有多个特征

增加维度增加了向量

Mini-Batch

向量函数应用到每个元素上的函数

方程组合成矩阵运算
为了并行计算

模型变换：维度修改

多层网络

空间转换的函数矩阵

线性非线性
多个线性层模拟非线性
Linear 降维
σ（）非线性【激活函数】

超参数搜索
学习能力要有泛化能力

构造多层

医疗、保险需要用

读取函数

游戏显卡 32位浮点数

2 模型

序列式模型 forward 使用x ，为了避免错误

3 构造损失和优化器

4 训练

ReLU 也常用不连续

可以探索不同激活函数

就该模型构建

ln 0 的问题这里前向改 sigmoid

0-1 光滑

》》》》》》》》》》》》》》》》》》

08 构造数据集 Dataset and DataLoader

概念：

Epoch
循环写嵌套循环
外层周期
内层 batch
Batch-Size
Iterations

打乱

加载

操作：索引、len

代码

Dataset 抽象类，只能被子类继承

DataLoader 可以实例化，用来加载数据

数据小，读到内存

数据大，不读

pytorch 0.4 报错多进程的问题

loader 里数据取出

这里改动是

数据导入 Dataset and Dataloader
循环处使用Mini-Batch 需要的嵌套循环

数据集

练习

Titanic 数据集

构造分类器，使用 DataLoader

》》》》》》》》》》》》》》》》》》

09 多分类问题

需要使用 softmax 分类器

想法1：每个作为二分类

想法2：相互抑制

每个计算相同并行计算

分布 distribution
使用概率分布
所以增加 Softmax Layer

目的：

>= 0
加和 = 1

等于1 的运算

下一个问题：损失函数

交叉熵损失

读文档，比较NLL CrossEL

代码

数据

图片处理 PIL pillow

pytorch 需要把 C 放前面方便计算

Totensor

Normalize 标准化（经验值）切换到 0，1 分布

图像数据在使用时调用

全连接网络一阶

-1？自动计算 N 的数值

x.view(-1,784)

损失

带冲量

训练

》把训练定义成函数

测试函数

问题：为啥有

total +=labels.size(0)

correct += (predicted == labels).sum().item()

可以每10轮测试一次

简洁

图像：

人工特征提取
CNN 自动特征提取

练习

》》》》》》》》》》》》》》》》》》》》

10 卷积神经网络

二维卷积

步骤

卷积
下采样
卷积
下采样（降维
展开
全连接

特征提取器前部卷积
分类器

栅格 ccd

光敏电阻：一个光敏电阻处理一个光锥

获得一个像素

电阻R 映射光强G

有些相片是插值像素

Patch 图像块做卷积

卷积包含图像块的所有信息

运算过程

数乘 = 元素相乘

多通道就得到每个通道的卷积结果

卷积运算

卷积绘图

N个通道

如果要M 个输出？
M个卷积核
Cat 拼接

发现：

卷积核通道数量 = 输入通道
卷积核总数 = 输出通道

共享权重

4个维度的卷积核

代码实现

重要的是 Conv2d 设置： 4个参数

其他重要参数

padding 图像外填充让 i/o 大小不变

填充0

卷积 = 线性计算

stride 步长降低卷积结果的w/h

Max Pooling Layer 下采样

通道数量不变，找区域内最大

重点维度相关：在输出是否和全连接层维度对应

手算
pytorch 输出看看维度【常用】

view 改变网络为全连接网络

为什么最后一层不用激活？

怎么用 GPU

cuda ： num （表示显卡索引）

to(device) 就可以把模型、数据给显卡

错误率降低了30%

练习

》》》》》》》》》》》》》》》》

11 CNN（高级版）

2种复杂 CNN

LeNet 5

GoogLeNet

》常作为基础框架

减少代码冗余：函数/类

块封装成类

Inception 盗梦空间

有多种构造方式

提供几种候选的卷积核

Concatenate 张量拼接，多种路径下的张量的拼接

Average Pooling 平均池化

1X1 Conv 作用
每个通道
可以跨越不同通道相同位置的信息
信息融合

信息融合算法，加权求和

为什么有 192个通道？

增加 1X1 的卷积，节省计算量

造卷积

放数组，用 cat ，维度为1

？ Net里是什么？

【位置让pytorch 来求，减少错误

重点使用了2 个 Inception 模块

根据test 来决定网络是否训练好

每个新高点存盘

梯度消失

Residual net 可以解决梯度消失问题

梯度趋近于 0 难更新 =》离输入近的难更新

古早：锁层

Residual net

加 x ，导数 + 1 ，梯度不为 0

Plain net

Residual net，有池化层

代码实现

把计算图翻译为代码

网络复杂用一些类来封装

分布式渐增网络【增量式开发】

练习

很多 Residual net 的设计

可以用 minist 做测试

Densely Net

后面的路

理论《深度学习》花书
工程、理论
阅读 PyTorch 文档（通读一遍）
复现经典工作（代码下载 -> 跑【会配置环境】应该
读代码 开源代码（系统架构、训练架构、测试架构、数据读取架构、损失函数构建）
写代码
扩充视野
知识盲点（写代码的）
。。
需要长时间积累

标签：

《PyTorch深度学习实践》完结合集

《PyTorch深度学习实践》完结合集的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

《PyTorch深度学习实践》完结合集

本文作者的其他文章

《PyTorch深度学习实践》完结合集的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

《PyTorch深度学习实践》完结合集的评论 (共条)