PyTorch教程5.2之多层感知器的实现-电子发烧友网

多层感知器 (MLP) 的实现并不比简单的线性模型复杂多少。关键的概念差异是我们现在连接多个层。

						import torch
from torch import nn
from d2l import torch as d2l

						 

						from mxnet import np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

						import jax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l

						 

						No GPU/TPU found, falling back to CPU. (Set TF_CPP_MIN_LOG_LEVEL=0 and rerun for more info.)

					

						import tensorflow as tf
from d2l import tensorflow as d2l

5.2.1. 从零开始实施

让我们从头开始实现这样一个网络。

5.2.1.1. 初始化模型参数

回想一下，Fashion-MNIST 包含 10 个类，并且每个图像由一个28×28=784灰度像素值网格。和以前一样，我们暂时忽略像素之间的空间结构，因此我们可以将其视为具有 784 个输入特征和 10 个类别的分类数据集。首先，我们将实现一个具有一个隐藏层和 256 个隐藏单元的 MLP。层数和宽度都是可调的（它们被认为是超参数）。通常，我们选择层宽度可以被 2 的较大次幂整除。由于内存在硬件中分配和寻址的方式，这在计算上是高效的。

同样，我们将用几个张量表示我们的参数。请注意， 对于每一层，我们必须跟踪一个权重矩阵和一个偏置向量。与往常一样，我们为这些参数的损失梯度分配内存。

在下面的代码中，我们使用 `nn.Parameter< https://pytorch.org/docs/stable/generated/torch.nn.parameter.Parameter.html >`__ 自动将类属性注册为要跟踪的参数autograd（第 2.5 节） .

								class MLPScratch(d2l.Classifier):
  def __init__(self, num_inputs, num_outputs, num_hiddens, lr, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W1 = nn.Parameter(torch.randn(num_inputs, num_hiddens) * sigma)
    self.b1 = nn.Parameter(torch.zeros(num_hiddens))
    self.W2 = nn.Parameter(torch.randn(num_hiddens, num_outputs) * sigma)
    self.b2 = nn.Parameter(torch.zeros(num_outputs))

								 

In the code below, we first define and initialize the parameters and then enable gradient tracking.

								class MLPScratch(d2l.Classifier):
  def __init__(self, num_inputs, num_outputs, num_hiddens, lr, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W1 = np.random.randn(num_inputs, num_hiddens) * sigma
    self.b1 = np.zeros(num_hiddens)
    self.W2 = np.random.randn(num_hiddens, num_outputs) * sigma
    self.b2 = np.zeros(num_outputs)
    for param in self.get_scratch_params():
      param.attach_grad()

								 

In the code below we use `flax.linen.Module.param <https://flax.readthedocs.io/en/latest/api_reference/flax.linen.html#flax.linen.Module.param>`__ to define the model parameter.

								class MLPScratch(d2l.Classifier):
  num_inputs: int
  num_outputs: int
  num_hiddens: int
  lr: float
  sigma: float = 0.01

  def setup(self):
    self.W1 = self.param('W1', nn.initializers.normal(self.sigma),
               (self.num_inputs, self.num_hiddens))
    self.b1 = self.param('b1', nn.initializers.zeros, self.num_hiddens)
    self.W2 = self.param('W2', nn.initializers.normal(self.sigma),
               (self.num_hiddens, self.num_outputs))
    self.b2 = self.param('b2', nn.initializers.zeros, self.num_outputs)

								 

In the code below we use `tf.Variable <https://www.tensorflow.org/api_docs/python/tf/Variable>`__ to define the model parameter.

								class MLPScratch(d2l.Classifier):
  def __init__(self, num_inputs, num_outputs, num_hiddens, lr, sigma=0.01):
    super().__init__()
    self.save_hyperparameters()
    self.W1 = tf.Variable(
      tf.random.normal((num_inputs, num_hiddens)) * sigma)
    self.b1 = tf.Variable(tf.zeros(num_hiddens))
    self.W2 = tf.Variable(
      tf.random.normal((num_hiddens, num_outputs)) * sigma)
    self.b2 = tf.Variable(tf.zeros(num_outputs))

								 

5.2.1.2. 模型

为了确保我们知道一切是如何工作的，我们将自己实现 ReLU 激活，而不是直接调用内置relu函数。

								def relu(X):
  a = torch.zeros_like(X)
  return torch.max(X, a)

								 

								def relu(X):
  return np.maximum(X, 0)

								def relu(X):
  return jnp.maximum(X, 0)

								def relu(X):
  return tf.math.maximum(X, 0)

由于我们忽略了空间结构，我们将reshape每个二维图像转换为长度为的平面向量num_inputs。最后，我们只用几行代码就实现了我们的模型。由于我们使用框架内置的 autograd，这就是它所需要的全部。

								@d2l.add_to_class(MLPScratch)
def forward(self, X):
  X = X.reshape((-1, self.num_inputs))
  H = relu(torch.matmul(X, self.W1) + self.b1)
  return torch.matmul(H, self.W2) + self.b2

								 

								@d2l.add_to_class(MLPScratch)
def forward(self, X):
  X = X.reshape((-1, self.num_inputs))
  H = relu(np.dot(X, self.W1) + self.b1)
  return np.dot(H, self.W2) + self.b2

								 

								@d2l.add_to_class(MLPScratch)
def forward(self, X):
  X = X.reshape((-1, self.num_inputs))
  H = relu(jnp.matmul(X, self.W1) + self.b1)
  return jnp.matmul(H, self.W2) + self.b2

								 

								@d2l.add_to_class(MLPScratch)
def forward(self, X):
  X = tf.reshape(X, (-1, self.num_inputs))
  H = relu(tf.matmul(X, self.W1) + self.b1)
  return tf.matmul(H, self.W2) + self.b2

								 

5.2.1.3. 训练

幸运的是，MLP 的训练循环与 softmax 回归完全相同。我们定义模型、数据、训练器，最后fit在模型和数据上调用方法。

PyTorch教程5.2之多层感知器的实现

5.2.1. 从零开始实施

5.2.1.1. 初始化模型参数

5.2.1.2. 模型

5.2.1.3. 训练

PyTorch教程21.7之序列感知推荐系统

PyTorch教程22.4之多元微积分

PyTorch教程10.6之编码器-解码器架构

PyTorch教程3.2之面向对象的设计实现

PyTorch教程4.4之从头开始实现Softmax回归

PyTorch教程11.5之多头注意力

PyTorch教程13.7之参数服务器

PyTorch教程13.6之多个GPU的简洁实现

PyTorch教程3.5之线性回归的简洁实现

PyTorch教程19.4之多保真超参数优化

PyTorch教程7.4之多个输入和多个输出通道

PyTorch教程8.4之多分支网络(GoogLeNet)

PyTorch教程9.6之递归神经网络的简洁实现

PyTorch教程之从零开始的递归神经网络实现

PyTorch Recipes.zip

Pytorch实现MNIST手写数字识别

5.2W单声道音频功率放大器CS8571E

基于多层感知机模型的自适应简化率预测

基于结构感知的双编码器解码器模型

一个结合监督学习的多层感知机模型

多层网络社区发现相关研究及对比

神经网络的分类器学习课件总结

模糊控制与神经网络的资料总结

github上的pytorch学习资料详细说明

如何使用压缩感知实现移动群智感知任务分发机制

深度学习的学习率调节实践的PDF文件讲解

AI概论：教师手冊(第3篇)人工神经网络

深度神经网络的快速学习算法NBP的详细资料说明

如何使用压缩感知实现移动群智感知任务分发机制的资料说明

使用MATLAB编写单层感知器的函数免费下载

【技术贴】镜腿里的 “隐形感知器”：艾为触控让智能眼镜 “会戴、懂滑”

利用Arm Kleidi技术实现PyTorch优化

多层感知器的基本原理

多层感知机是什么？它有哪些作用？

多层感知机模型结构

多层感知器、全连接网络和深度神经网络介绍

多层感知机与神经网络的区别

PyTorch如何实现多层全连接神经网络

如何在PyTorch中实现LeNet-5网络

深度学习框架pytorch入门与实践

使用多层感知器进行机器学习

PyTorch教程-5.2. 多层感知器的实现

深度学习基础知识(1)

多层感知机(MLP)的设计与实现

PyTorch的简单实现

pytorch实现断电继续训练时需要注意的要点

Verilog/FPGA开源项目卷积神经网络

基于PyTorch的深度学习入门教程之PyTorch简单知识

无线水压感知器(传感器)SG9A01的参数是怎样的

关于无线水压传感器(感知器)SG9A01的属性介绍

关于机器人的五大感知器官

关于门磁感知器SG6AD，它的特点有哪些

无线水压感知器的采样间隔时间是多少每次

上海逻迅无线液压感知器-水压油压气压产品型号SG9A

上海逻迅|无线压力感知器|水压油压气压 产品功能及产品放大图详情

上海逻迅官网资讯：门磁感知器SG6AD系统架构方案有哪些？

人工智能门磁感知器，助力疫情防控

门磁感知器SG6AD的产品规格及参数详情

门磁感知器SG6AD的作用是什么？

利用人工神经网络感知器实现双足行走机器人的稳定性控制

下载排行榜

爱华AIWA HS-J202维修手册

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

UWB653Pro USB口测距通信定位模块规格书

技嘉H110主板IT8628E_BX IO电路图资料

上海逻迅|无线压力感知器|水压油压气压产品功能及产品放大图详情