61 编码器-解码器架构【动手学深度学习v2】

2022-10-30 11:15 作者:如果我是泡橘子 0人读过 | 我要投稿

编码器-解码器

回顾CNN

在 CNN 中，输入一张图片，经过多层的卷积层，最后到输出层判别图片中的物体的类别

回顾RNN

对于 RNN 来讲，输入一个句子，然后对其进行向量输出

编码器-解码器架构

机器翻译是序列转换模型的一个核心问题，它的输入和输出都是长度可变的序列

一个模型被分为两块：

编码器（encoder）处理输入：接受一个长度可变的序列作为输入，并将其转换为具有固定形状的编码状态。编码器在拿到输入之后，将其表示成为中间状态或者中间表示（如隐藏状态、特征图）
解码器（decoder）生成输出：解码器将固定形状的编码状态映射到长度可变的序列。最简单的解码器能够直接将中间状态或者中间表示翻译成输出；解码器也能够结合一些额外的输入得到输出

总结

----end----

其他参考：

1、《动手学深度学习》，PPT，https://courses.d2l.ai/zh-v2/assets/pdfs/part-3_8.pdf

2、《动手学深度学习》，教程，https://zh-v2.d2l.ai/chapter_recurrent-modern/encoder-decoder.html

标签：

61 编码器-解码器架构【动手学深度学习v2】的评论 (共条)