×

PyTorch教程7.4之多个输入和多个输出通道

消耗积分:0 | 格式:pdf | 大小:0.21 MB | 2023-06-05

张玲

分享资料个

虽然我们在第 7.1.4 节中描述了构成每个图像的多个通道(例如,彩色图像具有标准的 RGB 通道来指示红色、绿色和蓝色的数量)和多个通道的卷积层,但到目前为止,我们简化了 所有我们的数值示例仅使用单个输入和单个输出通道。这使我们能够将输入、卷积核和输出视为二维张量。

当我们将通道添加到混合中时,我们的输入和隐藏表示都变成了三维张量。例如,每个 RGB 输入图像都有形状3×h×w. 我们将这个尺寸为 3 的轴称为通道维度。通道的概念与 CNN 本身一样古老。例如 LeNet5 ( LeCun et al. , 1995 )使用它们。在本节中,我们将更深入地了解具有多个输入和多个输出通道的卷积核。

import torch
from d2l import torch as d2l
from mxnet import np, npx
from d2l import mxnet as d2l

npx.set_np()
import jax
from jax import numpy as jnp
from d2l import jax as d2l
No GPU/TPU found, falling back to CPU. (Set TF_CPP_MIN_LOG_LEVEL=0 and rerun for more info.)
import tensorflow as tf
from d2l import tensorflow as d2l

7.4.1. 多个输入通道

当输入数据包含多个通道时,我们需要构造一个与输入数据具有相同输入通道数的卷积核,以便与输入数据进行互相关。假设输入数据的通道数为ci, 卷积核的输入通道数也需要为 ci. 如果我们的卷积核的窗口形状是 kh×kw, 那么当ci=1,我们可以将卷积核视为形状的二维张量 kh×kw.

然而,当ci>1,我们需要一个包含形状张量的内核kh×kw对于每个输入通道。连接这些ci张量一起产生形状的卷积核 ci×kh×kw. 由于输入和卷积核各有ci通道,我们可以对每个通道的输入的二维张量和卷积核的二维张量进行互相关运算,加上ci结果一起(对通道求和)以产生二维张量。这是多通道输入和多输入通道卷积核之间的二维互相关的结果。

图 7.4.1提供了具有两个输入通道的二维互相关的示例。阴影部分是第一个输出元素以及用于输出计算的输入和内核张量元素: (1×1+2×2+4×3+5×4)+(0×0+1×1+3×2+4×3)=56.

https://file.elecfans.com/web2/M00/AA/41/pYYBAGR9NVaAIsPvAAHtOvp5Bfs298.svg

图 7.4.1 2 个输入通道的互相关计算。

为了确保我们真正理解这里发生了什么,我们可以自己实现多个输入通道的互相关操作。请注意,我们所做的只是对每个通道执行互相关运算,然后将结果相加。

def corr2d_multi_in(X, K):
  # Iterate through the 0th dimension (channel) of K first, then add them up
  return sum(d2l.corr2d(x, k) for x, k in zip(X, K))
def corr2d_multi_in(X, K):
  # Iterate through the 0th dimension (channel) of K first, then add them up
  return sum(d2l.corr2d(x, k) for x, k in zip(X, K))
def corr2d_multi_in(X, K):
  # Iterate through the 0th dimension (channel) of K first, then add them up
  return sum(d2l.corr2d(x, k) for x, k in zip(X, K))
def corr2d_multi_in(X, K):
  # Iterate through the 0th dimension (channel) of K first, then add them up
  return tf.reduce_sum([d2l.corr2d(x, k) for x, k in zip(X, K)], axis=0)

我们可以构造对应于图 7.4.1中的值的输入张量X和核张量来验证互相关运算的输出。K

X = torch.tensor([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]],
        [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = torch.tensor([[[0.0, 1.0], [2.0, 3.0]], [[1.0, 2.0], [3.0, 4.0]]])

corr2d_multi_in(X, K)
tensor([[ 56., 72.],
    [104., 120.]])
X = np.array([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]],
        [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = np.array([[[0.0, 1.0], [2.0, 3.0]], [[1.0, 2.0], [3.0, 4.0]]])

corr2d_multi_in(X, K)
array([[ 56., 72.],
    [104., 120.]])
X = jnp.array([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]],
        [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = jnp.array([[[0.0, 1.0], [2.0, 3.0]], [[1.0, 2.0], [3.0, 4.0]]])

corr2d_multi_in(X, K)
Array([[ 56., 72.],
    [104., 120.

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !