PyTorch教程8.6之残差网络(ResNet)和ResNeXt-电子发烧友网

随着我们设计越来越深的网络，了解添加层如何增加网络的复杂性和表现力变得势在必行。更重要的是设计网络的能力，其中添加层使网络严格更具表现力而不仅仅是不同。为了取得一些进展，我们需要一点数学知识。

						import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

						 

						from mxnet import init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

						import jax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l

						 

						import tensorflow as tf
from d2l import tensorflow as d2l

8.6.1. 函数类

考虑F，特定网络架构（连同学习率和其他超参数设置）可以达到的功能类别。也就是说，对于所有 f∈F存在一些参数集（例如，权重和偏差），可以通过在合适的数据集上进行训练来获得。让我们假设f∗是我们真正想要找到的“真实”功能。如果它在F，我们的状态很好，但通常我们不会那么幸运。相反，我们将尝试找到一些fF∗这是我们最好的选择 F. 例如，给定一个具有特征的数据集 X和标签y，我们可以尝试通过解决以下优化问题来找到它：

(8.6.1)fF∗=defargminf⁡L(X,y,f) subject to f∈F.

我们知道正则化（Morozov，1984 年，Tikhonov 和 Arsenin，1977 年）可以控制复杂度F并实现一致性，因此更大的训练数据通常会带来更好的效果fF∗. 唯一合理的假设是，如果我们设计一个不同的、更强大的架构F′我们应该取得更好的结果。换句话说，我们期望fF′∗ 比“更好”fF∗. 然而，如果 F⊈F′甚至不能保证这会发生。实际上，fF′∗可能会更糟。如图 8.6.1所示，对于非嵌套函数类，较大的函数类并不总是向“真实”函数靠拢f∗. 例如，在图 8.6.1的左侧，虽然F3更接近f∗比F1,F6 远离并且不能保证进一步增加复杂性可以减少距离f∗. 对于嵌套函数类，其中 F1⊆…⊆F6在图 8.6.1右侧，我们可以从非嵌套函数类中避免上述问题。

https://file.elecfans.com/web2/M00/A9/C7/poYBAGR9NdSABwXfAAGkEZU56U8741.svg

图 8.6.1对于非嵌套函数类，更大（用面积表示）的函数类并不能保证更接近“真实”函数（f∗). 这不会发生在嵌套函数类中。

因此，只有当较大的函数类包含较小的函数类时，我们才能保证增加它们会严格增加网络的表达能力。对于深度神经网络，如果我们可以将新添加的层训练成恒等函数 f(x)=x，新模型将与原始模型一样有效。由于新模型可能会得到更好的解决方案来拟合训练数据集，因此添加的层可能更容易减少训练错误。

这是He等人提出的问题。( 2016 )在处理非常深的计算机视觉模型时考虑。他们提出的残差网络( ResNet )的核心思想是，每个附加层都应该更容易地包含身份函数作为其元素之一。这些考虑相当深刻，但它们导致了一个非常简单的解决方案，即残差块。凭借它，ResNet 在 2015 年赢得了 ImageNet 大规模视觉识别挑战赛。该设计对如何构建深度神经网络产生了深远的影响。例如，残差块已添加到循环网络中（Kim等人，2017 年，普拉卡什等。, 2016 年）。同样，Transformers （

PyTorch教程8.6之残差网络(ResNet)和ResNeXt

8.6.1. 函数类

PyTorch教程10.4之双向递归神经网络

PyTorch教程10.3之深度递归神经网络

PyTorch教程12.2之凸度

PyTorch教程13.4之硬件

PyTorch教程6.7之显卡

PyTorch教程14.11之全卷积网络

PyTorch教程20.2之深度卷积生成对抗网络

PyTorch教程8.2之使用块的网络(VGG)

PyTorch教程8.1之深度卷积神经网络(AlexNet)

PyTorch教程8.8之设计卷积网络架构

PyTorch教程8.7之密集连接网络(DenseNet)

PyTorch教程9.6之递归神经网络的简洁实现

基于非对称注意力机制残差网络的图像检测

基于残差神经网络的微型电机转子焊点图像检测

基于多尺度残差通道注意机制的人脸超分辨率网络

基于改进残差网络的水下图像重建修复

基于多尺度残差网络的边缘检测技术

基于深度残差神经网络的远程监督关系抽取模型

基于残差连接的改进端到端文本识别网络结构

基于多尺度残差通道注意力机制的人脸超分辨率网络

基于残差字典及写作表达的单图像SR算法

基于双分支残差网络的行人再识别方法

基于双残差超密集网络的多模态医学图像融合方法

基于双重残差卷积网络的跌倒识别方法

一种改进的残差网络结构以减少卷积层参数

基于改进U-Net网络建立HU-ResNet模型

改进多尺度三维残差卷积神经网络的高光谱图像方法

改进多尺度三维残差卷积神经网络的高光谱图像方法

一种采用深度残差网络的头部姿态估计方法

由多残差模块组成的多窗口残差网络优化模型

瑞芯微(EASY EAI)RV1126B resnet50训练部署教程

基于瑞芯微RK3576的resnet50训练部署教程

基于改进ResNet50网络的自动驾驶场景天气识别算法

pytorch怎么在pycharm中运行

残差网络是深度神经网络吗

PyTorch如何实现多层全连接神经网络

如何在PyTorch中实现LeNet-5网络

pytorch中有神经网络模型吗

PyTorch神经网络模型构建过程

PyTorch的介绍与使用案例

如何使用PyTorch建立网络模型

使用PyTorch构建神经网络

pytorch用来干嘛的

PyTorch教程-8.6. 残差网络 (ResNet) 和 ResNeXt

MATLAB残差神经网络设计

计算机视觉系统多种外部缺陷的算法

轻松学Pytorch之Deeplabv3推理

无残差连接或归一化层，也能成功训练深度Transformer

无残差连接或归一化层，也能成功训练深度transformer

深度学习与图神经网络学习分享：CNN经典网络之-ResNet

深度学习方法和传统的CV算法如何选择

《图学学报》—深度残差网络的无人机多目标识别

《图学学报》—深度残差网络的无人机多目标识别

深度解读对残差网络动机的理解

基于PyTorch的深度学习入门教程之PyTorch的自动梯度计算

基于PyTorch的深度学习入门教程之PyTorch简单知识

基于PyTorch的深度学习入门教程之PyTorch重点综合实践

基于PyTorch的深度学习入门教程之训练一个神经网络分类器

基于PyTorch的深度学习入门教程之使用PyTorch构建一个神经网络

9个用Pytorch训练快速神经网络的技巧

下载排行榜

人形机器人执行、感知系统技术及市场解析

瑞芯微RK3588系列开发板-产品资料更新-2026.06

OK3506-S12 Mini开发板产品资料-2025.10

ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册

FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V

LZC9300A 高性能恒压恒流碳化硅驱动控制芯片