PyTorch教程4.6之分类中的泛化-电子发烧友网

到目前为止，我们一直专注于如何通过训练具有多个输出和 softmax 函数的（线性）神经网络来解决多类分类问题。将我们模型的输出解释为概率预测，我们激发并推导了交叉熵损失函数，它计算我们的模型（对于一组固定参数）分配给实际标签的负对数似然。最后，我们通过将我们的模型拟合到训练集来将这些工具付诸实践。然而，一如既往，我们的目标是学习一般模式，根据以前看不见的数据（测试集）进行经验评估。训练集上的高精度毫无意义。每当我们的每个输入都是唯一的（对于大多数高维数据集而言确实如此）时，我们可以通过仅记住第一个训练时期的数据集并随后在我们看到标签时查找标签来获得训练集的完美准确性一个新形象。然而，记住与确切训练示例相关联的确切标签并不能告诉我们如何对新示例进行分类。如果没有进一步的指导，每当我们遇到新的例子时，我们可能不得不求助于随机猜测。

许多紧迫的问题需要立即引起注意：

我们需要多少测试示例才能精确估计我们的分类器对基础人群的准确性？
如果我们在同一个测试中反复评估模型会发生什么？
为什么我们应该期望将我们的线性模型拟合到训练集应该比我们的朴素记忆方案更好？

虽然第 3.6 节介绍了线性回归背景下过度拟合和泛化的基础知识，但本章将更深入一些，介绍统计学习理论的一些基本思想。事实证明，我们通常可以先验地保证泛化：对于许多模型，以及泛化差距的任何期望上限ϵ，我们通常可以确定一些所需的样本数量n这样如果我们的训练集至少包含n样本，那么我们的经验误差将位于ϵ的真实错误，对于任何数据生成分布。不幸的是，事实证明，虽然这些类型的保证提供了一套深刻的知识构建块，但它们对深度学习从业者的实用性有限。简而言之，这些保证表明，确保先验深度神经网络的泛化需要数量荒谬的示例（可能数万亿或更多），即使我们发现，在我们关心的任务上，深度神经网络通常可以很好地泛化远更少的例子（千）。因此，深度学习从业者通常完全放弃先验保证，而是在过去对类似问题进行了很好泛化的基础上采用方法，并证明泛化事后通过实证评估。当我们到达第 5 节时，我们将重新审视泛化，并简要介绍大量科学文献，这些文献如雨后春笋般涌现，试图解释为什么深度神经网络在实践中泛化。

4.6.1. 测试集

由于我们已经开始依赖测试集作为评估泛化误差的黄金标准方法，所以让我们从讨论此类误差估计的属性开始。让我们关注一个固定的分类器f，而不用担心它是如何获得的。此外，假设我们拥有一个新的示例数据集 D=(x(i),y(i))i=1n未用于训练分类器的f. 我们分类器的经验误差f在D只是预测所针对的实例的一部分f(x(i))不同意真正的标签y(i), 并由以下表达式给出：

(4.6.1)ϵD(f)=1n∑i=1n1(f(x(i))≠y(i)).

相比之下，总体误差是基础总体（某些分布P(X,Y) 以概率密度函数为特征p(x,y)）我们的分类器不同意真实标签：

(4.6.2)ϵ(f)=E(x,y)∼P1(f(x)≠y)=∫∫1(f(x)≠y)p(x,y)dxdy.

尽管ϵ(f)是我们真正关心的量，我们不能直接观察到它，就像我们不能不测量每个人就不能直接观察到大量人群的平均身高一样。我们只能根据样品估计这个数量。因为我们的测试集D是潜在人群的统计代表，我们可以查看ϵD(f)作为总体误差的统计估计ϵ(f). 此外，因为我们感兴趣的数量ϵ(f)是（随机变量的期望1(f(X)≠Y)) 和相应的估计量ϵD(f)是样本平均值，估计总体误差只是均值估计的经典问题，您可能还记得 2.6 节。

概率论的一个重要经典结果称为 中心极限定理，保证无论何时我们拥有n 随机样本a1,...,an从具有均值的任何分布中抽取μ和标准差σ, 作为样本数n接近无穷大，样本平均值

PyTorch教程4.6之分类中的泛化

4.6.1. 测试集

PyTorch教程21.9之分解机

PyTorch教程22.8之分布

PyTorch教程4.3之基本分类模型

PyTorch教程4.2之图像分类数据集

PyTorch Recipes.zip

Pytorch实现MNIST手写数字识别

Effective PyTorch之 PyTorch基础知识（译）

基于注意力机制的新闻文本分类模型

基于LSTM的表示学习-文本分类模型

LT1585-3.3演示电路-3.3V、4.6A稳压器(4.75-7V至3.3V@4.6A)

基于主题分布优化的模糊文本分类方法

4.6W双路音频功率放大器D6282说明

一种基于Q学习算法的增量分类模型

融合文本分类和摘要的多任务学习摘要模型

基于BERT+Bo-LSTM+Attention的病历短文分类模型

单片机为什么会有8位、16位、32位之分呢？资料下载

一种基于BERT模型的社交电商文本分类算法

最大化AUC关系的PU分类应用及相关算法

结合CSPPNet与集成学习的人类蛋白质图像分类

依据待分类实例显著局部特征的懒惰式分类模型

联发科手机基带电路图、分类和工作原理

一种拥有较好可解释性的启发式多分类集成算法

基于二维图像与迁移卷积神经网络的分类方法

先进的电气驱动之分析,建模与控制

结合BERT模型的中文文本分类算法

通过多模态特征融合来设计三维点云分类模型

基于深度神经网络的文本分类分析

github上的pytorch学习资料详细说明

C语言程序设计教程之分支结构程序设计的课件免费下载

BDM V4.6驱动程序使用说明和视频安装教程资料免费下载

PyTorch中激活函数的全面概览

TorchFix:基于PyTorch的代码静态分析

基于PyTorch AMD的解决方案

如何加速生成2 PyTorch扩散模型

使用PyTorch加速图像分割

pytorch用来干嘛的

英特尔加入PyTorch基金会，通过PyTorch*推动AI普及

深度学习框架pytorch介绍

深度学习框架pytorch入门与实践

机器学习之分类分析与聚类分析

PyTorch文本分类任务的基本流程

那些年在pytorch上踩过的坑

PyTorch构建自己一种易用的计算图结构

PyTorch的简单实现

PyTorch 的 Autograd 机制和使用

基于PyTorch的深度学习入门教程之PyTorch的自动梯度计算

基于PyTorch的深度学习入门教程之PyTorch简单知识

基于PyTorch的深度学习入门教程之PyTorch的安装和配置

基于PyTorch的深度学习入门教程之PyTorch重点综合实践

基于PyTorch的深度学习入门教程之DataParallel使用多GPU

基于PyTorch的深度学习入门教程之训练一个神经网络分类器

基于PyTorch的深度学习入门教程之使用PyTorch构建一个神经网络

textCNN论文与原理——短文本分类

一篇非常新的介绍PyTorch内部机制的文章

使用PyTorch提取CNNs图像特征

为什么学习深度学习需要使用PyTorch和TensorFlow框架

一文解构PyTorch：深入了解PyTorch内部机制

什么是张量，如何在PyTorch中操作张量?

贴片电感有正负极之分吗_贴片电感怎样测量

Pytorch入门教程与范例

下载排行榜

储能电源市场分析

传感芯片选型指南

ATmega8芯片中文手册

储能电源市场分析报告

2A多电池高效开关充电器AN_SY6912A中文资料规格书

2023年光伏行业发展回顾报告