PyTorch教程之15.2近似训练-电子发烧友网

回忆一下我们在15.1 节中的讨论。skip-gram模型的主要思想是使用softmax操作来计算生成上下文词的条件概率wo基于给定的中心词wc在(15.1.4)中，其对应的对数损失由 (15.1.7)的相反数给出。

由于 softmax 操作的性质，因为上下文词可能是字典中的任何人V， (15.1.7)的反面包含与词汇表的整个大小一样多的项目总和。因此，（15.1.8）中 skip-gram 模型的梯度计算和（15.1.15）中连续词袋模型的梯度计算都包含求和。不幸的是，这种在大型词典（通常有数十万或数百万个单词）上求和的梯度的计算成本是巨大的！

为了降低上述计算复杂度，本节将介绍两种近似训练方法：负采样和分层softmax。由于skip-gram模型与连续词袋模型的相似性，我们将仅以skip-gram模型为例来描述这两种近似训练方法。

15.2.1。负采样

负采样修改了原来的目标函数。给定中心词的上下文窗口wc，任何（上下文）词的事实wo来自这个上下文窗口被认为是一个事件，其概率建模为

(15.2.1)P(D=1∣wc,wo)=σ(uo⊤vc),

在哪里σ使用 sigmoid 激活函数的定义：

(15.2.2)σ(x)=11+exp⁡(−x).

让我们首先最大化文本序列中所有此类事件的联合概率来训练词嵌入。具体来说，给定长度的文本序列T, 表示为w(t)时间步长的单词t并让上下文窗口大小为m, 考虑最大化联合概率

(15.2.3)∏t=1T∏−m≤j≤m, j≠0P(D=1∣w(t),w(t+j)).

然而，(15.2.3)只考虑那些涉及正例的事件。因此，只有当所有词向量都等于无穷大时，(15.2.3)中的联合概率才最大化为 1。当然，这样的结果是没有意义的。为了使目标函数更有意义，负采样添加了从预定义分布中采样的负样本。

表示为S上下文词的事件wo来自中心词的上下文窗口wc. 对于此次涉及的事件wo，来自预定义的分布P(w) 样本K 不是来自这个上下文窗口的噪声词。表示为Nk干扰词的事件wk (k=1,…,K) 不是来自上下文窗口 wc. 假设这些事件同时涉及正例和反例S,N1,…,NK是相互独立的。负采样将（15.2.3）中的联合概率（仅涉及正例）重写为

(15.2.4)∏t=1T∏−m≤j≤m, j≠0P(w(t+j)∣w(t)),

其中条件概率是通过事件来近似的 S,N1,…,NK:

(15.2.5)

PyTorch教程之15.2近似训练

15.2.1。负采样

PyTorch教程11.9之使用Transformer进行大规模预训练

PyTorch教程13.5之在多个GPU上进行训练

PyTorch教程15.9之预训练BERT的数据集

PyTorch教程15.4之预训练word2vec

PyTorch教程15.10之预训练BERT

PyTorch教程之从零开始的递归神经网络实现

PyTorch教程之循环神经网络

PyTorch教程之长短期记忆(LSTM)

PyTorch教程之时间反向传播

PyTorch教程之数据预处理

PyTorch Recipes.zip

Pytorch实现MNIST手写数字识别

Effective PyTorch之 PyTorch基础知识（译）

阿吉特 AI代码协作训练解决方案

LabViEW编程之VI服务器综述

虚实融合辅助的言语康复训练系统

基于近似模型和遗传算法的等离子喷焊工艺优化

基于预训练模型和长短期记忆网络的深度学习模型

12位加号近似ADC AD7324英文手册免费下载

一种侧重于学习情感特征的预训练方法

一种脱离预训练的多尺度目标检测网络模型

Arduino的实验例程之红外遥控实验

github上的pytorch学习资料详细说明

Protel DXP使用教程之层次电路原理图设计教程免费下载

python教程之如何使用XlsxWriter模块创建aexcel表格

机器学习教程之机器学习的十三个经典课件资料免费下载

Protues教程之我的Protues资料库免费下载

ThinkPHP开发视频教程之使用ThinkPHP5.0开发微信小程序商场开发教程

CEEMD与近似熵的脑电去噪方法

深度负反馈条件下的近似计算

如何让网络模型加速训练

基于PyTorch的模型并行分布式训练Megatron解析

pytorch用来干嘛的

深度学习框架pytorch介绍

Pytorch Hub两行代码搞定YOLOv5推理

如何将Pytorch自训练模型变成OpenVINO IR模型形式

PyTorch教程-15.9。预训练 BERT 的数据集

PyTorch教程-15.2. 近似训练

自训练Pytorch模型使用OpenVINO™优化并部署在AI爱克斯开发板

适配PyTorch FX让量化感知训练更简单

TensorFlow和PyTorch的实际应用比较

pytorch实现断电继续训练时需要注意的要点

利用Python和PyTorch处理面向对象的数据集（1）

基于PyTorch的深度学习入门教程之PyTorch的自动梯度计算

基于PyTorch的深度学习入门教程之PyTorch简单知识

基于PyTorch的深度学习入门教程之PyTorch的安装和配置

基于PyTorch的深度学习入门教程之PyTorch重点综合实践

基于PyTorch的深度学习入门教程之DataParallel使用多GPU

基于PyTorch的深度学习入门教程之训练一个神经网络分类器

基于PyTorch的深度学习入门教程之使用PyTorch构建一个神经网络

Pytorch量化感知训练的详解

如何让PyTorch模型训练变得飞快？

基于飞桨图学习框架PGL的图神经网络训练

PyTorch 1.6即将原生支持自动混合精度训练

9个用Pytorch训练快速神经网络的方法

9个用Pytorch训练快速神经网络的技巧

简化版的XLNet在PyTorch Wrapper实现

千呼万唤始出来，PyTorch1.0预览版终于问世！

PyTorch官方在GitHub发布0.4.0版本，最重要的改进是支持Windows系统

Pytorch入门教程与范例

下载排行榜

STM32国内外发展现状

传感芯片选型指南

储能电源市场分析

ATmega8芯片中文手册

TDK电容器产品指南

2A多电池高效开关充电器AN_SY6912A中文资料规格书