PyTorch教程7.2之图像卷积-电子发烧友网

现在我们了解了卷积层在理论上是如何工作的，我们准备看看它们在实践中是如何工作的。基于我们将卷积神经网络作为探索图像数据结构的有效架构的动机，我们坚持使用图像作为我们的运行示例。

						import torch
from torch import nn
from d2l import torch as d2l

						 

						from mxnet import autograd, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

						import jax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l

						 

						No GPU/TPU found, falling back to CPU. (Set TF_CPP_MIN_LOG_LEVEL=0 and rerun for more info.)

					

						import tensorflow as tf
from d2l import tensorflow as d2l

7.2.1. 互相关运算

回想一下，严格来说，卷积层是用词不当，因为它们表达的操作更准确地描述为互相关。根据我们在 7.1 节中对卷积层的描述，在这样的层中，输入张量和核张量通过互相关运算组合以产生输出张量。

让我们暂时忽略通道，看看它如何处理二维数据和隐藏表示。在图 7.2.1中，输入是一个二维张量，高为 3，宽为 3。我们将张量的形状标记为 3×3或者（3,3). kernel的高和宽都是2，kernel window（或者卷积窗口）的形状由kernel的高和宽给定（这里是 2×2).

https://file.elecfans.com/web2/M00/A9/C7/poYBAGR9NSyAWvu_AAC_WoWZ9vo337.svg

图 7.2.1二维互相关运算。阴影部分是第一个输出元素以及用于输出计算的输入和内核张量元素： 0×0+1×1+3×2+4×3=19.

在二维互相关操作中，我们从位于输入张量左上角的卷积窗口开始，将其从左到右和从上到下滑动到输入张量上。当卷积窗口滑动到某个位置时，包含在该窗口中的输入子张量和核张量逐元素相乘，所得张量相加产生单个标量值。这个结果给出了相应位置的输出张量的值。这里，输出张量的高度为 2，宽度为 2，四个元素由二维互相关运算得出：

(7.2.1)0×0+1×1+3×2+4×3=19,1×0+2×1+4×2+5×3=25,3×0+4×1+6×2+7×3=37,4×0+5×1+7×2+8×3=43.

请注意，沿每个轴，输出大小略小于输入大小。因为内核的宽度和高度大于一，我们只能正确计算内核完全适合图像的位置的互相关，输出大小由输入大小给出nh×nw减去卷积核的大小kh×kw通过

(7.2.2)(nh−kh+1)×(nw−kw+1).

之所以如此，是因为我们需要足够的空间来“移动”图像上的卷积核。稍后我们将看到如何通过在图像边界周围填充零来保持大小不变，以便有足够的空间来移动内核。接下来，我们在函数中实现这个过程corr2d，它接受一个输入张量X 和一个内核张量K并返回一个输出张量Y。

							def corr2d(X, K): #@save
  """Compute 2D cross-correlation."""
  h, w = K.shape
  Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
  for i in range(Y.shape[0]):
    for j in range(Y.shape[1]):
      Y[i, j] = (X[i:i + h, j:j + w] * K).sum()
  return Y

							 

							def corr2d(X, K): #@save
  """Compute 2D cross-correlation."""
  h, w = K.shape
  Y = np.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
  for i in range(Y.shape[0]):
    for j in range(Y.shape[1]):
      Y[i, j] = (X[i:i + h, j:j + w] * K).sum()
  return Y

							 

							def corr2d(X, K): #@save
  """Compute 2D cross-correlation."""
  h, w = K.shape
  Y = jnp.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
  for i in range(Y.shape[0]):
    for j in range(Y.shape[1]):
      Y = Y.at[i, j].set((X[i:i + h, j:j + w] * K).sum())
  return Y

							 

							def corr2d(X, K): #@save
  """Compute 2D cross-correlation."""
  h, w = K.shape
  Y = tf.Variable(tf.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1)))
  for i in range(Y.shape[0]):
    for j in range(Y.shape[1]):
      Y[i, j].assign(tf.reduce_sum(
        X[i: i + h, j: j + w] * K))
  return Y

							 

我们可以从图 7.2.1构造输入张量X和核张量来验证上述二维互相关运算的实现的输出。

PyTorch教程7.2之图像卷积

7.2.1. 互相关运算

PyTorch教程4.2之图像分类数据集

PyTorch教程14.1之图像增强

PyTorch教程7.1之从全连接层到卷积

PyTorch教程14.11之全卷积网络

PyTorch教程14.10之转置卷积

PyTorch教程16.3之情感分析:使用卷积神经网络

PyTorch教程20.2之深度卷积生成对抗网络

PyTorch教程8.1之深度卷积神经网络(AlexNet)

PyTorch教程8.8之设计卷积网络架构

多尺度膨胀卷积神经网络在图像分类中的应用

基于改进CNN的医学图像分割方法

基于全卷积神经网络的肝脏CT图像扫描

基于深度卷积生成对抗网络的花朵图像识别分类

基于膨胀卷积和稠密连接的烟雾图像识别

基于密集卷积生成对抗网络的图像修复方法

基于稀疏表示的分组训练卷积字典的图像去噪算法

基于可变形卷积网络的鱼眼图像目标检测方法

基于U-Net的多尺度循环卷积神经网络

一种基于多通道极深CNN的图像超分辨算法

基于特征交换的卷积神经网络图像分类算法

基于二维图像与迁移卷积神经网络的分类方法

改进多尺度三维残差卷积神经网络的高光谱图像方法

改进多尺度三维残差卷积神经网络的高光谱图像方法

基于多孔卷积神经网络的图像深度估计模型

使用多孔卷积神经网络解决机器学习的图像深度不准确的方法说明

如何使用卷积神经网络进行人脸图像质量评价的资料说明

如何使用复杂网络描述进行图像深度卷积的分类方法介绍

如何使用多中心卷积特征加权进行图像检索方法

基于隐马尔科夫模型和卷积神经网络的图像标注方法

基于卷积神经网络的图像标注模型

PyTorch中激活函数的全面概览

使用Python卷积神经网络(CNN)进行图像识别的基本步骤

使用PyTorch加速图像分割

图像识别卷积神经网络模型

卷积神经网络基本结构 卷积神经网络主要包括什么

卷积神经网络算法三大类

卷积神经网络算法是机器算法吗

卷积神经网络的介绍 什么是卷积神经网络算法

卷积神经网络层级结构 卷积神经网络的卷积层讲解

卷积神经网络的基本原理 卷积神经网络发展 卷积神经网络三大特点

卷积神经网络三大特点

卷积神经网络应用领域

卷积神经网络如何识别图像

卷积神经网络概述 卷积神经网络的特点 cnn卷积神经网络的优点

卷积神经网络详解 卷积神经网络包括哪几层及各层功能

卷积神经网络结构

PyTorch教程-20.2. 深度卷积生成对抗网络

PyTorch教程-14.11. 全卷积网络

使用PyTorch深度解析卷积神经网络

什么是卷积神经网络？完整的卷积神经网络（CNNS）解析

OpenCV种支持标准卷积边缘填充做法

一文吃透：图像卷积、边缘提取和滤波去噪

使用PyTorch提取CNNs图像特征

图像卷积操作的两点注意事项

卷积神经网络四种卷积类型

全卷积网络FCN进行图像分割

图像处理中滤波与卷积有什么区别？

一种用于图像分类的卷积神经网络

什么是卷积_卷积的意义

卷积神经网络中图像池化操作全解析

下载排行榜

储能电源市场分析

储能电源市场分析报告

2023年光伏行业发展回顾报告

汽车类高电流无刷直流 (BLDC) 电机驱动器原理图介绍

IPC-J-STD-001J_EN 2024焊接电气和电子组件的TOC要求

山特TG400UPS工作原理与维修

卷积神经网络基本结构卷积神经网络主要包括什么

卷积神经网络的介绍什么是卷积神经网络算法

卷积神经网络层级结构卷积神经网络的卷积层讲解

卷积神经网络的基本原理卷积神经网络发展卷积神经网络三大特点

卷积神经网络概述卷积神经网络的特点 cnn卷积神经网络的优点

卷积神经网络详解卷积神经网络包括哪几层及各层功能