58 深层循环神经网络【动手学深度学习v2】

2022-08-30 09:33 作者:如果我是泡橘子 0人读过 | 我要投稿

深层循环神经网络

回顾：循环神经网络

如何将循环神经网络变深，以获得更多的非线性性？

类似于多层感知机，隐藏层数目和隐藏单元数目都是超参数（它们是可以进行调整的）
使用门控循环单元或长短期记忆网络的隐状态替代上图中深度循环神经网络中的隐状态计算，就能够很容易地得到深度门控循环神经网络或长短期记忆神经网络

总结

1、深度循环神经网络使用多个隐藏层来获得更多的非线性性

2、在深度循环神经网络中，隐状态的信息被传递到当前层的下一时间步和下一层的当前时间步

3、存在许多不同风格的深度循环神经网络，如长短期记忆网络、门控循环单元或经典循环神经网络

4、深度循环神经网络需要大量的调参（如学习率和修剪）来确保合适的收敛，模型的初始化也需要谨慎

Q&A

1、单层的输出是 [y1,y2,...] 和 ht ，那多层的就是把 [y1,y2,...] 作为输入吗，那每层不就都有一个 ht 输出吗，直接就不用了吗？
QA P3 - 00:00

6、老师，nn.LSTM GRU RNN 这些，图里面的o好像是有的。您说的那个不带 classifier 的意思是不是在这个 o 的基础上，根据一对一、多对一等，再加一个 MLP 映射 o 到 y ？
QA P3 - 06:19

----end----

其他参考：

1、《动手学深度学习》，PPT，https://courses.d2l.ai/zh-v2/assets/pdfs/part-3_6.pdf

2、《动手学深度学习》，教材，https://zh-v2.d2l.ai/chapter_recurrent-modern/deep-rnn.html

标签：

58 深层循环神经网络【动手学深度学习v2】的评论 (共条)