PyTorch教程之时间反向传播-电子发烧友网

如果您完成了第 9.5 节中的练习，您会发现梯度裁剪对于防止偶尔出现的大量梯度破坏训练稳定性至关重要。我们暗示爆炸梯度源于长序列的反向传播。在介绍大量现代 RNN 架构之前，让我们仔细看看反向传播在数学细节中是如何在序列模型中工作的。希望这个讨论能使梯度消失和爆炸的概念更加精确。如果你还记得我们在 5.3 节介绍 MLP 时通过计算图进行前向和反向传播的讨论，那么 RNN 中的前向传播应该相对简单。在 RNN 中应用反向传播称为 时间反向传播 ( Werbos, 1990 ). 此过程要求我们一次扩展（或展开）RNN 的计算图。展开的 RNN 本质上是一个前馈神经网络，具有相同的参数在整个展开的网络中重复出现的特殊属性，出现在每个时间步长。然后，就像在任何前馈神经网络中一样，我们可以应用链式法则，通过展开的网络反向传播梯度。每个参数的梯度必须在参数出现在展开网络中的所有位置上求和。从我们关于卷积神经网络的章节中应该熟悉处理这种权重绑定。

出现并发症是因为序列可能相当长。处理由超过一千个标记组成的文本序列并不罕见。请注意，从计算（太多内存）和优化（数值不稳定）的角度来看，这都会带来问题。第一步的输入在到达输出之前要经过 1000 多个矩阵乘积，还需要另外 1000 个矩阵乘积来计算梯度。我们现在分析可能出现的问题以及如何在实践中解决它。

9.7.1. RNN 中的梯度分析

我们从 RNN 工作原理的简化模型开始。该模型忽略了有关隐藏状态细节及其更新方式的细节。这里的数学符号没有明确区分标量、向量和矩阵。我们只是想培养一些直觉。在这个简化模型中，我们表示ht作为隐藏状态， xt作为输入，和ot作为时间步的输出t. 回忆一下我们在第 9.4.2 节中的讨论，输入和隐藏状态可以在乘以隐藏层中的一个权重变量之前连接起来。因此，我们使用 wh和wo分别表示隐藏层和输出层的权重。因此，每个时间步的隐藏状态和输出是

(9.7.1)ht=f(xt,ht−1,wh),ot=g(ht,wo),

在哪里f和g分别是隐藏层和输出层的变换。因此，我们有一个价值链 {…,(xt−1,ht−1,ot−1),(xt,ht,ot),…} 通过循环计算相互依赖。前向传播相当简单。我们所需要的只是遍历(xt,ht,ot)一次三倍一个时间步长。输出之间的差异ot和想要的目标 yt然后通过所有的目标函数进行评估 T时间步长为

(9.7.2)L(x1,…,xT,y1,…,yT,wh,wo)=1T∑t=1Tl(yt,ot).

对于反向传播，事情有点棘手，尤其是当我们计算关于参数的梯度时wh目标函数的L. 具体来说，根据链式法则，

PyTorch教程之时间反向传播

9.7.1. RNN 中的梯度分析

PyTorch教程5.3之前向传播、反向传播和计算图

PyTorch教程之15.2近似训练

PyTorch教程之从零开始的递归神经网络实现

PyTorch教程之循环神经网络

PyTorch教程之长短期记忆(LSTM)

PyTorch教程之数据预处理

PyTorch Recipes.zip

Pytorch实现MNIST手写数字识别

LabViEW编程之VI服务器综述

BP(BackPropagation)反向传播神经网络介绍及公式推导

适用于突发事件人群聚集场所的谣言传播模型

自然语言处理在社会传播的应用综述

可提高重叠社区检测性能的影响传播模型

社交网络的SHIR谣言传播模型

基于特征传播和时域分割网络的视频行为识别

基于共识率和加权样本的标记传播算法CRLP

一种支持用户隐私保护的信息传播方法

快恢复二极管反向恢复时间及参数资料下载

基于个体警觉状态的双层网络流行病传播模型

一种基于邻居结构额影响传播模型NS-IC

Arduino的实验例程之红外遥控实验

github上的pytorch学习资料详细说明

人工智能（AI）学习：(第6篇)讲解BP（反向传播）流程

人工智能（AI）学习：如何讲解BP（反向传播）流程

模拟电路教程之时序逻辑电路的课件资料免费下载

Protel DXP使用教程之层次电路原理图设计教程免费下载

STM32Cube学习教程之时钟树配置的详细资料概述

python教程之如何使用XlsxWriter模块创建aexcel表格

数字电路教程之时序逻辑电路课件的详细资料免费下载

卷积神经网络的权值反向传播机制和MATLAB的实现方法

什么是BP神经网络的反向传播算法

二极管的反向恢复时间

【每天学点AI】前向传播、损失函数、反向传播

PyTorch如何实现多层全连接神经网络

bp神经网络和反向传播神经网络区别在哪

神经网络反向传播算法的优缺点有哪些

神经网络反向传播算法的作用是什么

神经网络反向传播算法的原理、数学推导及实现步骤

神经网络反向传播算法的推导过程

神经网络前向传播和反向传播在神经网络训练过程中的作用

反向传播神经网络建模基本原理

反向传播神经网络概念是什么

反向传播神经网络优点和缺点有哪些

反向传播神经网络分为多少层

反向传播神经网络和bp神经网络的区别

神经网络前向传播和反向传播区别

神经网络反向传播算法原理是什么

反向传播神经网络模型的特点

反向传播神经网络建模的基本原理

PyTorch教程-9.7. 时间反向传播

PyTorch教程-5.3. 前向传播、反向传播和计算图

详解神经网络中反向传播和梯度下降

二极管的反向恢复时间和正向恢复时间的区别

浅析深度神经网络（DNN）反向传播算法(BP)

基于PyTorch的深度学习入门教程之PyTorch的自动梯度计算

基于PyTorch的深度学习入门教程之PyTorch简单知识

基于PyTorch的深度学习入门教程之PyTorch的安装和配置

基于PyTorch的深度学习入门教程之PyTorch重点综合实践

基于PyTorch的深度学习入门教程之DataParallel使用多GPU

基于PyTorch的深度学习入门教程之使用PyTorch构建一个神经网络

下载排行榜

飞利浦D8714收录机说明书

RK3506B原理图参考设计

⼯业电源&模块电源产品⼿册

人工智能+消费：技术赋能与芯片驱动未来

PC3103 低功耗电流模式PWM控制器技术手册

索尼icf-sw10收音机维修手册