PyTorch教程之从零开始的递归神经网络实现-电子发烧友网

我们现在准备好从头开始实施 RNN。特别是，我们将训练此 RNN 作为字符级语言模型（参见第 9.4 节），并按照第 9.2 节中概述的数据处理步骤，在由 HG Wells 的《时间机器》的整个文本组成的语料库上对其进行训练. 我们首先加载数据集。

						%matplotlib inline
import math
import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

						 

						%matplotlib inline
import math
from mxnet import autograd, gluon, np, npx
from d2l import mxnet as d2l

npx.set_np()

						 

						%matplotlib inline
import math
import jax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l

						 

						%matplotlib inline
import math
import tensorflow as tf
from d2l import tensorflow as d2l

						 

9.5.1. 循环神经网络模型

我们首先定义一个类来实现 RNN 模型（第 9.4.2 节）。请注意，隐藏单元的数量num_hiddens是一个可调的超参数。

							class RNNScratch(d2l.Module): #@save
  """The RNN model implemented from scratch."""
  def __init__(self, num_inputs, num_hiddens, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W_xh = nn.Parameter(
      torch.randn(num_inputs, num_hiddens) * sigma)
    self.W_hh = nn.Parameter(
      torch.randn(num_hiddens, num_hiddens) * sigma)
    self.b_h = nn.Parameter(torch.zeros(num_hiddens))

							 

							class RNNScratch(d2l.Module): #@save
  """The RNN model implemented from scratch."""
  def __init__(self, num_inputs, num_hiddens, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W_xh = np.random.randn(num_inputs, num_hiddens) * sigma
    self.W_hh = np.random.randn(
      num_hiddens, num_hiddens) * sigma
    self.b_h = np.zeros(num_hiddens)

							 

							class RNNScratch(nn.Module): #@save
  """The RNN model implemented from scratch."""
  num_inputs: int
  num_hiddens: int
  sigma: float = 0.01

  def setup(self):
    self.W_xh = self.param('W_xh', nn.initializers.normal(self.sigma),
                (self.num_inputs, self.num_hiddens))
    self.W_hh = self.param('W_hh', nn.initializers.normal(self.sigma),
                (self.num_hiddens, self.num_hiddens))
    self.b_h = self.param('b_h', nn.initializers.zeros, (self.num_hiddens))

							 

							class RNNScratch(d2l.Module): #@save
  """The RNN model implemented from scratch."""
  def __init__(self, num_inputs, num_hiddens, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W_xh = tf.Variable(tf.random.normal(
      (num_inputs, num_hiddens)) * sigma)
    self.W_hh = tf.Variable(tf.random.normal(
      (num_hiddens, num_hiddens)) * sigma)
    self.b_h = tf.Variable(tf.zeros(num_hiddens))

							 

下面的方法forward定义了如何计算任何时间步的输出和隐藏状态，给定当前输入和模型在前一个时间步的状态。请注意，RNN 模型循环遍历的最外层维度inputs，一次更新隐藏状态。这里的模型使用了tanh激活函数（第 5.1.2.3 节）。

							@d2l.add_to_class(RNNScratch) #@save
def forward(self, inputs, state=None):
  if state is None:
    # Initial state with shape: (batch_size, num_hiddens)
    state = torch.zeros((inputs.shape[1], self.num_hiddens),
             device=inputs.device)
  else:
    state, = state
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = torch.tanh(torch.matmul(X, self.W_xh) +
             torch.matmul(state, self.W_hh) + self.b_h)
    outputs.append(state)
  return outputs, state

							 

							@d2l.add_to_class(RNNScratch) #@save
def forward(self, inputs, state=None):
  if state is None:
    # Initial state with shape: (batch_size, num_hiddens)
    state = np.zeros((inputs.shape[1], self.num_hiddens),
             ctx=inputs.ctx)
  else:
    state, = state
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = np.tanh(np.dot(X, self.W_xh) +
             np.dot(state, self.W_hh) + self.b_h)
    outputs.append(state)
  return outputs, state

							 

							@d2l.add_to_class(RNNScratch) #@save
def __call__(self, inputs, state=None):
  if state is not None:
    state, = state
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = jnp.tanh(jnp.matmul(X, self.W_xh) + (
      jnp.matmul(state, self.W_hh) if state is not None else 0)
             + self.b_h)
    outputs.append(state)
  return outputs, state

							 

							@d2l.add_to_class(RNNScratch) #@save
def forward(self, inputs, state=None):
  if state is None:
    # Initial state with shape: (batch_size, num_hiddens)
    state = tf.zeros((inputs.shape[1], self.num_hiddens))
  else:
    state, = state
    state = tf.reshape(state, (-1, self.num_hiddens))
  outputs = []
  for X in inputs: # Shape of inputs: (num_steps, batch_size, num_inputs)
    state = tf.tanh(tf.matmul(X, self.W_xh) +
             tf.matmul(state, self.W_hh) + self.b_h)
    outputs.append(state)
  return outputs, state

							 

我们可以将一小批输入序列输入 RNN 模型，如下所示。

							batch_size, num_inputs, num_hiddens, num_steps = 2, 16, 32, 100
rnn = RNNScratch(num_inputs, num_hiddens)
X = torch.ones((num_steps, batch_size, num_inputs))
outputs, state = rnn(X)

							 

							batch_size, num_inputs, num_hiddens, num_steps = 2, 16, 32, 100
rnn = RNNScratch(num_inputs, num_hiddens)
X = np.ones((num_steps, batch_size, num_inputs))
outputs, state = rnn(X)

							 

							batch_size, num_inputs, num_hiddens, num_steps = 2, 16, 32, 100
rnn = RNNScratch(num_inputs, num_hiddens)
X = jnp.ones((num_steps, batch_size, num_inputs))
(output
						

PyTorch教程之从零开始的递归神经网络实现

9.5.1. 循环神经网络模型

PyTorch教程10.4之双向递归神经网络

PyTorch教程10.3之深度递归神经网络

PyTorch教程16.3之情感分析:使用卷积神经网络

PyTorch教程16.2之情感分析:使用递归神经网络

PyTorch教程8.1之深度卷积神经网络(AlexNet)

PyTorch教程9.6之递归神经网络的简洁实现

PyTorch教程之循环神经网络

人工神经网络的原理及仿真实例

神经网络基础问题的整理

基于FPGA的神经网络硬件实现方法

基于进化计算的神经网络设计与实现

基于神经网络的优化计算实验

神经网络的基本原理

人工神经网络控制

人工智能-BP神经网络算法的简单实现

基于脉冲神经网络的迁移学习算法

基于剪枝与量化的卷积神经网络压缩算法

基于不同神经网络的文本分类方法研究对比

基于FPGA的RBF神经网络硬件实现

MATLAB实现卷积神经网络CNN的源代码

3小时学习神经网络与深度学习课件下载

神经网络图像压缩算法的FPGA实现技术研究论文免费下载

综述深度神经网络的解释方法及发展趋势

神经网络的最新发展如何

神经网络的方法学习课件免费下载

基于深度神经网络的文本分类分析

模糊控制与神经网络的资料总结

如何使用FPGA实现BP神经网络的仿真线设计

如何使用FPGA实现神经网络硬件的设计方法

神经网络与神经网络控制的学习课件免费下载

PyTorch如何实现多层全连接神经网络

pytorch中有神经网络模型吗

递归神经网络和循环神经网络的模型结构

递归神经网络的实现方法

PyTorch神经网络模型构建过程

rnn是递归神经网络还是循环神经网络

递归神经网络结构形式主要分为

简述递归神经网络的计算过程

递归神经网络与循环神经网络一样吗

递归神经网络主要应用于哪种类型数据

递归神经网络是循环神经网络吗

递归神经网络的结构、特点、优缺点及适用场景

循环神经网络和递归神经网络的区别

使用PyTorch构建神经网络

卷积神经网络和深度神经网络的优缺点 卷积神经网络和深度神经网络的区别

PyTorch教程-9.6. 递归神经网络的简洁实现

PyTorch教程-9.5. 从零开始的递归神经网络实现

浅析三种主流深度神经网络

三个最流行神经网络

用Python从头实现一个神经网络来理解神经网络的原理2

什么是神经网络？什么是卷积神经网络？

使用PyTorch深度解析卷积神经网络

基于PyTorch的深度学习入门教程之PyTorch的自动梯度计算

基于PyTorch的深度学习入门教程之PyTorch的安装和配置

基于PyTorch的深度学习入门教程之训练一个神经网络分类器

基于PyTorch的深度学习入门教程之使用PyTorch构建一个神经网络

如何使用numpy库从零开始创建循环神经网络模型

从零开始建立一个神经网络

fireflyNCC S1--PLAI神经网络量化工具介绍

教你用PyTorch快速准确地建立神经网络

下载排行榜

爱华AIWA HS-J202维修手册

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

⼯业电源&模块电源产品⼿册

UWB653Pro USB口测距通信定位模块规格书

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别