PyTorch教程8.6之残差网络(ResNet)和ResNeXt-电子发烧友网

随着我们设计越来越深的网络，了解添加层如何增加网络的复杂性和表现力变得势在必行。更重要的是设计网络的能力，其中添加层使网络严格更具表现力而不仅仅是不同。为了取得一些进展，我们需要一点数学知识。

						import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

						 

						from mxnet import init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

						import jax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l

						 

						import tensorflow as tf
from d2l import tensorflow as d2l

8.6.1. 函数类

考虑F，特定网络架构（连同学习率和其他超参数设置）可以达到的功能类别。也就是说，对于所有 f∈F存在一些参数集（例如，权重和偏差），可以通过在合适的数据集上进行训练来获得。让我们假设f∗是我们真正想要找到的“真实”功能。如果它在F，我们的状态很好，但通常我们不会那么幸运。相反，我们将尝试找到一些fF∗这是我们最好的选择 F. 例如，给定一个具有特征的数据集 X和标签y，我们可以尝试通过解决以下优化问题来找到它：

(8.6.1)fF∗=defargminf⁡L(X,y,f) subject to f∈F.

我们知道正则化（Morozov，1984 年，Tikhonov 和 Arsenin，1977 年）可以控制复杂度F并实现一致性，因此更大的训练数据通常会带来更好的效果fF∗. 唯一合理的假设是，如果我们设计一个不同的、更强大的架构F′我们应该取得更好的结果。换句话说，我们期望fF′∗ 比“更好”fF∗. 然而，如果 F⊈F′甚至不能保证这会发生。实际上，fF′∗可能会更糟。如图 8.6.1所示，对于非嵌套函数类，较大的函数类并不总是向“真实”函数靠拢f∗. 例如，在图 8.6.1的左侧，虽然F3更接近f∗比F1,F6 远离并且不能保证进一步增加复杂性可以减少距离f∗. 对于嵌套函数类，其中 F1⊆…⊆F6在图 8.6.1右侧，我们可以从非嵌套函数类中避免上述问题。

https://file.elecfans.com/web2/M00/A9/C7/poYBAGR9NdSABwXfAAGkEZU56U8741.svg

图 8.6.1对于非嵌套函数类，更大（用面积表示）的函数类并不能保证更接近“真实”函数（f∗). 这不会发生在嵌套函数类中。

因此，只有当较大的函数类包含较小的函数类时，我们才能保证增加它们会严格增加网络的表达能力。对于深度神经网络，如果我们可以将新添加的层训练成恒等函数 f(x)=x，新模型将与原始模型一样有效。由于新模型可能会得到更好的解决方案来拟合训练数据集，因此添加的层可能更容易减少训练错误。

这是He等人提出的问题。( 2016 )在处理非常深的计算机视觉模型时考虑。他们提出的残差网络( ResNet )的核心思想是，每个附加层都应该更容易地包含身份函数作为其元素之一。这些考虑相当深刻，但它们导致了一个非常简单的解决方案，即残差块。凭借它，ResNet 在 2015 年赢得了 ImageNet 大规模视觉识别挑战赛。该设计对如何构建深度神经网络产生了深远的影响。例如，残差块已添加到循环网络中（Kim等人，2017 年，普拉卡什等。, 2016 年）。同样，Transformers （

PyTorch教程8.6之残差网络(ResNet)和ResNeXt

8.6.1. 函数类

pytorch如何构建网络模型

基于ResNet的手势识别边缘计算项目

PyTorch教程10.4之双向递归神经网络

PyTorch教程10.3之深度递归神经网络

PyTorch教程14.11之全卷积网络

PyTorch教程16.3之情感分析:使用卷积神经网络

PyTorch教程16.2之情感分析:使用递归神经网络

PyTorch教程20.2之深度卷积生成对抗网络

PyTorch教程8.2之使用块的网络(VGG)

PyTorch教程8.1之深度卷积神经网络(AlexNet)

PyTorch教程8.4之多分支网络(GoogLeNet)

PyTorch教程8.8之设计卷积网络架构

PyTorch教程8.7之密集连接网络(DenseNet)

PyTorch教程9.6之递归神经网络的简洁实现

PyTorch教程之从零开始的递归神经网络实现

PyTorch教程之循环神经网络

PyTorch Recipes.zip

Pytorch实现MNIST手写数字识别

Effective PyTorch之 PyTorch基础知识（译）

【周易AIPU 仿真】R329部署onnx版本的resnet模型

超声波测距仿真相关文件资源下载

基于可变形卷积网络的鱼眼图像目标检测方法

基于神经网络的、改进的YOLOv3目标检测算法

基于改进U-Net网络建立HU-ResNet模型

基于深度神经网络的结构化剪枝算法

github上的pytorch学习资料详细说明

Protues8.6应用程序软件免费下载

Proteus 8.6 SP2 Pro应用程序免费下载

卷积神经网络的特点,优缺点,数据处理等详细资料免费下载

proteus8.6应用程序安装包免费下载

TorchFix:基于PyTorch的代码静态分析

基于PyTorch AMD的解决方案

使用PyTorch加速图像分割

pytorch用来干嘛的

深度学习框架pytorch介绍

深度学习框架pytorch入门与实践

PyTorch教程-8.7. 密集连接网络 (DenseNet)

PyTorch教程-8.6. 残差网络 (ResNet) 和 ResNeXt

那些年在pytorch上踩过的坑

轻松学Pytorch之Deeplabv3推理

深度学习与图神经网络学习分享：CNN经典网络之-ResNet

PyTorch 的 Autograd 机制和使用

为什么8.6代线TFT工厂如此受欢迎

清华「计图」现在支持国产芯片了！

基于PyTorch的深度学习入门教程之PyTorch的自动梯度计算

基于PyTorch的深度学习入门教程之PyTorch简单知识

基于PyTorch的深度学习入门教程之PyTorch的安装和配置

基于PyTorch的深度学习入门教程之PyTorch重点综合实践

基于PyTorch的深度学习入门教程之DataParallel使用多GPU

基于PyTorch的深度学习入门教程之训练一个神经网络分类器

基于PyTorch的深度学习入门教程之使用PyTorch构建一个神经网络

一篇非常新的介绍PyTorch内部机制的文章

9个用Pytorch训练快速神经网络的技巧

在GPU上利用TensorFlow Serving 部署ResNet

一文解构PyTorch：深入了解PyTorch内部机制

教你用PyTorch快速准确地建立神经网络

什么是张量，如何在PyTorch中操作张量?

一个神经元的ResNet就是一个通用的函数逼近器

Facebook致力AI 开源PyTorch1.0 AI框架

Pytorch入门教程与范例

下载排行榜

储能电源市场分析

传感芯片选型指南

储能电源市场分析报告

ATmega8芯片中文手册

2023年光伏行业发展回顾报告

2A多电池高效开关充电器AN_SY6912A中文资料规格书