PyTorch教程10.6之编码器-解码器架构-电子发烧友网

在一般的 seq2seq 问题中，如机器翻译（第 10.5 节），输入和输出的长度不同且未对齐。处理这类数据的标准方法是设计一个编码器-解码器架构（图 10.6.1），它由两个主要组件组成：一个 编码器，它以可变长度序列作为输入，以及一个 解码器，作为一个条件语言模型，接收编码输入和目标序列的向左上下文，并预测目标序列中的后续标记。

图 10.6.1编码器-解码器架构。

让我们以从英语到法语的机器翻译为例。给定一个英文输入序列：“They”、“are”、“watching”、“.”，这种编码器-解码器架构首先将可变长度输入编码为一个状态，然后对该状态进行解码以生成翻译后的序列，token通过标记，作为输出：“Ils”、“regardent”、“.”。由于编码器-解码器架构构成了后续章节中不同 seq2seq 模型的基础，因此本节将此架构转换为稍后将实现的接口。

						from torch import nn
from d2l import torch as d2l

						from mxnet.gluon import nn
from d2l import mxnet as d2l

						from flax import linen as nn
from d2l import jax as d2l

						No GPU/TPU found, falling back to CPU. (Set TF_CPP_MIN_LOG_LEVEL=0 and rerun for more info.)

					

						import tensorflow as tf
from d2l import tensorflow as d2l

10.6.1。编码器

在编码器接口中，我们只是指定编码器将可变长度序列作为输入X。实现将由继承此基类的任何模型提供Encoder。

							class Encoder(nn.Module): #@save
  """The base encoder interface for the encoder-decoder architecture."""
  def __init__(self):
    super().__init__()

  # Later there can be additional arguments (e.g., length excluding padding)
  def forward(self, X, *args):
    raise NotImplementedError

							 

							class Encoder(nn.Block): #@save
  """The base encoder interface for the encoder-decoder architecture."""
  def __init__(self):
    super().__init__()

  # Later there can be additional arguments (e.g., length excluding padding)
  def forward(self, X, *args):
    raise NotImplementedError

							 

							class Encoder(nn.Module): #@save
  """The base encoder interface for the encoder-decoder architecture."""
  def setup(self):
    raise NotImplementedError

  # Later there can be additional arguments (e.g., length excluding padding)
  def __call__(self, X, *args):
    raise NotImplementedError

							 

							class Encoder(tf.keras.layers.Layer): #@save
  """The base encoder interface for the encoder-decoder architecture."""
  def __init__(self):
    super().__init__()

  # Later there can be additional arguments (e.g., length excluding padding)
  def call(self, X, *args):
    raise NotImplementedError

							 

10.6.2。解码器

在下面的解码器接口中，我们添加了一个额外的init_state 方法来将编码器输出 ( enc_all_outputs) 转换为编码状态。请注意，此步骤可能需要额外的输入，例如输入的有效长度，这在第 10.5 节中有解释。为了逐个令牌生成可变长度序列令牌，每次解码器都可以将输入（例如，在先前时间步生成的令牌）和编码状态映射到当前时间步的输出令牌。

							class Decoder(nn.Module): #@save
  """The base decoder interface for the encoder-decoder architecture."""
  def __init__(self):
    super().__init__()

  # Later there can be additional arguments (e.g., length excluding padding)
  def init_state(self, enc_all_outputs, *args):
    raise NotImplementedError

  def forward(self, X, state):
    raise NotImplementedError

							 

							class Decoder(nn.Block): #@save
  """The base decoder interface for the encoder-decoder architecture."""
  def __init__(self):
    super().__init__()

  # Later there can be additional arguments (e.g., length excluding padding)
  def init_state(self, enc_all_outputs, *args):
    raise NotImplementedError

  def forward(self, X, state):
    raise NotImplementedError

							 

							class Decoder(nn.Module): #@save
  """The base decoder interface for the encoder-decoder architecture."""
  def setup(self):
    raise NotImplementedError

  # Later there can be additional arguments (e.g., length excluding padding)
  def init_state(self, enc_all_outputs, *args):
    raise NotImplementedError

  def __call__(self, X, state):
    raise NotImplementedError

							 

							class Decoder(tf.keras.layers.Layer): #@save
  """The base decoder interface for the encoder-decoder architecture."""
  def __init__(self):
    super().__init__()

  # Later there can be additional arguments (e.g., length excluding padding)
  def init_state(self, enc_all_outputs, *args):
    raise NotImplementedError

  def call(self, X, state):
    raise NotImplementedError

							 

10.6.3。将编码器和解码器放在一起

在前向传播中，编码器的输出用于产生编码状态，解码器将进一步使用该状态作为其输入之一。

							class EncoderDecoder(d2l.Classifier): #@save
  """The base class for the encoder-decoder architecture."""
  def __init__(self, encoder, decoder):
    super().__init__()
    self.encoder = encoder
    self.decoder = decoder

  def forward(self, enc_X, dec_X, *args):
    enc_all_outputs = self.encoder(enc_X, *args)
    dec_state = self.decoder.init_state(enc_all_outputs, *args)
    # Return decoder output only
    return self.decoder(dec_X, dec_state)[0]

							 

							class EncoderDecoder(d2l.Classifier): #@save
  """The base class for the encoder-decoder architecture."""
  def __init__(self, encoder, decoder):
    super().__init__()
    self.encoder = encoder
    self.decoder = decoder

  def forward(self, enc_X, dec_X, *args):
    enc_all_outputs = self.encoder(enc_X, *args)
    dec_state = self.decoder.init_state(enc_all_outputs, *args)
    # Return decoder output only
    return self.decoder(dec_X, dec_state)[0]

							 

							class EncoderDecoder(d2l.Classifier): #@save
  """The base class for the encoder-decoder architecture."""
  encoder: nn.Module
  decoder: nn.Module
  training: bool

  def __call__(self, enc_X, dec_X, *args):
    enc_all_outputs = self.encoder(enc_X, *args, training=self.training)
    dec_state = self.decoder.init_state(enc_all_outputs, *args)
    # Return decoder output only
    return self.decoder(dec_X, dec_state, training=self.training)[0]

							 

							class EncoderDecoder(d2l.Classifier): #@save
  """The base class for the encoder-decoder architecture."""
  def __init__(self, encoder, decoder):
    super().__init__()
    self.encoder = encoder
    self.decoder = decoder

  def call(self, enc_X, dec_X, *args):
    enc_all_outputs = self.encoder(enc_X, *args, training=True)
    dec_state = self.decoder.init_state(enc_all_outputs, *args)
    # Return decoder output only
    return self.decoder(dec_X, dec_state, training=True)[0]

							 

在下一节中，我们将看到如何应用 RNN 来设计基于这种编码器-解码器架构的 seq2seq 模型。

10.6.4。概括

编码器-解码器架构可以处理由可变长度序列组成的输入和输出，因此适用于机器翻译等 seq2seq 问题。编码器将可变长度序列作为输入，并将其转换为具有固定形状的状态。解码器将固定形状的编码状态映射到可变长度序列。

10.6.5。练习

假设我们使用神经网络来实现编码器-解码器架构。编码器和解码器必须是同一类型的神经网络吗？
除了机器翻译，你能想到另一个可以应用编码器-解码器架构的应用程序吗？

PyTorch教程10.6之编码器-解码器架构

10.6.1。编码器

10.6.2。解码器

10.6.3。将编码器和解码器放在一起

10.6.4。概括

10.6.5。练习

视频编码器与解码器的应用方案

TIR1000,TIR1000I编码器和解码器数据表

编码器差分信号转脉冲信号隔离变送器(脉冲信号转换器)

LDPC编码器解码器产品简介（v2.0）

PyTorch教程10.7之用于机器翻译的编码器-解码器Seq2Seq

PyTorch教程8.8之设计卷积网络架构

探索编码器之电机步进跟踪器

1路编码器脉冲计数器或2路DI高速计数器，Modbus RTU模块 YL150

1路编码器脉冲计数器或2路DI高速计数器，Modbus RTU模块 YL150

信路达 解码器/编码器 XD74LS47数据手册

信路达 解码器/编码器 XD74LS48数据手册

交流异步电机编码器介绍

STM32的正交编码器模式读取编码器的角度数据和速度

FENAC编码器资料-2022

STM32——编码器测速原理及STM32编码器模式

H264编码器与AdobeFlashMedia组合使用

基于结构感知的双编码器解码器模型

解码器认证

MCU工具之LED编码器

AD938A：双HDMI接收机，多格式HDTV视频解码器和RGB图形编码器

线路解码器/解复用器转换AiP74HC/HCT138

一种混合自动编码器高斯混合模型MAGMM

基于双编码器网络结构的CGAtten-GRU模型

适用于PIC和AVR器件的JSON解码器

深度学习的学习教程电子书免费下载

如何使用深度神经网络技术实现机器学习的全噪声自动编码器

VS1053B音频解码器的数据手册免费下载

VS1053B音频编解码器芯片的数据手册免费下载

Xilinx Logicore IP极轴编码器解码器产品指南资料免费下载

8线3线优先编码器的设计使用资料说明

Transformer架构中解码器的工作流程

编码器的作用与信号转换原理 编码器与解码器的关系和作用

光栅解码器四根信号线怎么接

自编码器的原理和类型

编码器好坏怎么判断,编码器原理

视频编码器与解码器的应用方案

伺服电机编码器分类

YXC丨视频编码器与解码器的应用方案

编码器技术应用

视频编码器与解码器的应用方案

详解编码器和解码器电路

伺服电机编码器

神经编码器-解码器模型的历史

基于 Transformers 的编码器-解码器模型

基于 RNN 的解码器架构如何建模

基于transformer的编码器-解码器模型的工作原理

PyTorch教程-10.7. 用于机器翻译的编码器-解码器 Seq2Seq

PyTorch教程-10.6. 编码器-解码器架构

视频编码包括什么？视频编解码器是如何工作的？

详解编码器和解码器电路：定义/工作原理/应用/真值表

Allegro DVT发布了其D3x0和E2x0解码器和编码器IP的新版本

如何通过视频解码器RTMP Server服务来实现信号传输

二进制解码器到底是什么

探讨2对4二进制解码器及4到16二进制解码器配置

基于可编程逻辑器件实现MPEG-4简易编码器和解码器核的设计

NDI|HX2视频源通过视频解码器解码输出步骤的介绍

为什么编解码器需要解码器模型

伺服电机编码器原理_伺服电机编码器种类

视频编解码器是什么，编解码器技术原理作用

二进制解码器案例说明

下载排行榜

爱华AIWA HS-J202维修手册

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

⼯业电源&模块电源产品⼿册

UWB653Pro USB口测距通信定位模块规格书

信路达解码器/编码器 XD74LS47数据手册

信路达解码器/编码器 XD74LS48数据手册

编码器的作用与信号转换原理编码器与解码器的关系和作用