PyTorch教程22.9之朴素贝叶斯-电子发烧友网

在前面几节中，我们了解了概率论和随机变量。为了将这一理论付诸实践，让我们介绍一下朴素贝叶斯分类器。这只使用概率基础知识来让我们执行数字分类。

学习就是做假设。如果我们想要对以前从未见过的新数据示例进行分类，我们必须对哪些数据示例彼此相似做出一些假设。朴素贝叶斯分类器是一种流行且非常清晰的算法，它假设所有特征彼此独立以简化计算。在本节中，我们将应用此模型来识别图像中的字符。

						%matplotlib inline
import math
import torch
import torchvision
from d2l import torch as d2l

d2l.use_svg_display()

						 

						%matplotlib inline
import math
from mxnet import gluon, np, npx
from d2l import mxnet as d2l

npx.set_np()
d2l.use_svg_display()

						 

						%matplotlib inline
import math
import tensorflow as tf
from d2l import tensorflow as d2l

d2l.use_svg_display()

						 

22.9.1。光学字符识别

MNIST ( LeCun et al. , 1998 )是广泛使用的数据集之一。它包含 60,000 张用于训练的图像和 10,000 张用于验证的图像。每个图像包含一个从 0 到 9 的手写数字。任务是将每个图像分类为相应的数字。

GluonMNIST在模块中提供了一个类data.vision来自动从 Internet 检索数据集。随后，Gluon 将使用已经下载的本地副本。train我们通过将参数的值分别设置为True或来指定我们是请求训练集还是测试集False。每个图像都是一个灰度图像，宽度和高度都是28具有形状（28,28,1). 我们使用自定义转换来删除最后一个通道维度。此外，数据集用无符号表示每个像素8位整数。我们将它们量化为二进制特征以简化问题。

							data_transform = torchvision.transforms.Compose([
  torchvision.transforms.ToTensor(),
  lambda x: torch.floor(x * 255 / 128).squeeze(dim=0)
])

mnist_train = torchvision.datasets.MNIST(
  root='./temp', train=True, transform=data_transform, download=True)
mnist_test = torchvision.datasets.MNIST(
  root='./temp', train=False, transform=data_transform, download=True)

							 

							Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./temp/MNIST/raw/train-images-idx3-ubyte.gz

 0%|     | 0/9912422 [00:00

							Extracting ./temp/MNIST/raw/train-images-idx3-ubyte.gz to ./temp/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ./temp/MNIST/raw/train-labels-idx1-ubyte.gz

 0%|     | 0/28881 [00:00

							Extracting ./temp/MNIST/raw/train-labels-idx1-ubyte.gz to ./temp/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ./temp/MNIST/raw/t10k-images-idx3-ubyte.gz

 0%|     | 0/1648877 [00:00

							Extracting ./temp/MNIST/raw/t10k-images-idx3-ubyte.gz to ./temp/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ./temp/MNIST/raw/t10k-labels-idx1-ubyte.gz

 0%|     | 0/4542 [00:00

							Extracting ./temp/MNIST/raw/t10k-labels-idx1-ubyte.gz to ./temp/MNIST/raw

						

							def transform(data, label):
  return np.floor(data.astype('float32') / 128).squeeze(axis=-1), label

mnist_train = gluon.data.vision.MNIST(train=True, transform=transform)
mnist_test = gluon.data.vision.MNIST(train=False, transform=transform)

							((train_images, train_labels), (
  test_images, test_labels)) = tf.keras.datasets.mnist.load_data()

# Original pixel values of MNIST range from 0-255 (as the digits are stored as
# uint8). For this section, pixel values that are greater than 128 (in the
# original image) are converted to 1 and values that are less than 128 are
# converted to 0. See section 18.9.2 and 18.9.3 for why
train_images = tf.floor(tf.constant(train_images / 128, dtype = tf.float32))
test_images = tf.floor(tf.constant(test_images / 128, dtype = tf.float32))

train_labels = tf.constant(train_labels, dtype = tf.int32)
test_labels = tf.constant(test_labels, dtype = tf.int32)

							 

我们可以访问一个特定的示例，其中包含图像和相应的标签。

							image, label = mnist_train[2]
image.shape, label

							(torch.Size([28, 28]), 4)

						

							image, label = mnist_train[2]
image.shape, label

							((28, 28), array(4, dtype=int32))

						

							image, label = train_images[2], train_labels[2]
image.shape, label.numpy()

							(TensorShape([28, 28]), 4)

						

我们的示例存储在此处的变量中image，对应于高度和宽度为28像素。

							image.shape, image.dtype

							 

							(torch.Size([28, 28]), torch.float32)

						

							image.shape, image.dtype

							 

							((28, 28), dtype('float32'))

						

							image.shape, image.dtype

							 

							(TensorShape([28, 28]), tf.float32)

						

我们的代码将每个图像的标签存储为标量。它的类型是 32位整数。

label,

PyTorch教程22.9之朴素贝叶斯

22.9.1。光学字符识别

PyTorch教程23.8之API

PyTorch教程3.6之概括

PyTorch教程12.2之凸度

PyTorch教程13.4之硬件

PyTorch教程14.2之微调

PyTorch教程6.7之显卡

简述对贝叶斯公式的基本理解

Ad Hoc网络的贝叶斯博弈节点激励策略

基于贝叶斯网络和攻击图的评估算法

融合生成对抗网络等的皮肤病诊断技术

基于贝叶斯网络等的疼痛表情识别方法

一种特征假期朴素贝叶斯文本分类算法

基于贝叶斯网络和数据挖掘的航班延误预测方法

一种基于贝叶斯方法的网络安全态势感知混合模型

贝叶斯网络模型之一依赖估测器模型研究

一种改进互信息的加权朴素贝叶斯算法

如何使用贝叶斯推理实现PASG的计算模型

使用贝叶斯决策和Hough实现非结构化道路检测与障碍物识别算法

如何利用基于优化贝叶斯将室内WiFi与蓝牙融合实现的定位算法

一个简单的伪贝叶斯垃圾邮件过滤主程序资料免费下载

如何使用Spark计算框架进行分布式文本分类方法的研究

如何使用贝叶斯判别准则进行机械设备泄露区域的全自动检测

如何使用序贯线性贝叶斯的RFID标签数量估计算法提高效率

贝叶斯思维有什么?《贝叶斯思维：统计建模的Python学习法》电子教材免费下载

基于贝叶斯网络的故事线挖掘算法

朴素贝叶斯NB经典案例

一种改进的贝叶斯网络结构学习算法

贝叶斯IP网络拥塞链路推理

用于船舶引航风险预警的贝叶斯网络模型

基于贝叶斯网络的克隆有害性预测方法

贝叶斯滤波和卡尔曼滤波的区别

贝索斯再次问鼎全球首富

贝叶斯优化是干什么的(原理解读)

关于贝叶斯概念进行形式化的建模和推理

对朴素贝叶斯算法原理做展开介绍

使用朴素贝叶斯和GPU进行更快的文本分类

朴素贝叶斯分类 朴素贝叶斯算法的优点

贝索斯正式卸任亚马逊CEO

如何在Python中实现一个简单的贝叶斯模型？

一文秒懂贝叶斯优化/Bayesian Optimization

贝佐斯和马斯克谁能造出更好的火箭？

10大常用机器学习算法汇总

机器学习：简单的术语带你领略贝叶斯优化之美

贝叶斯智能打造智慧展厅，打开智能服务机器人新局面

详解贝叶斯超参优化方法

贝叶斯方法到贝叶斯网络

贝索斯的成功之路

深度学习,恰恰是人工“不”智能的体现

带你入门常见的机器学习分类算法——逻辑回归、朴素贝叶斯、KNN、SVM、决策树

数据挖掘常用算法

为什么AlphaGo调参用贝叶斯优化？手动调参需要8.3天

贝叶斯统计的一个实践案例让你更快的对贝叶斯算法有更多的了解

亚马逊老板贝索斯身价多少？杰夫贝索斯1405亿美元？1433亿才对

朴素贝叶斯算法详细总结

关于贝叶斯和MCMC一些数学原理的讲解和代码的实现

机器学习之朴素贝叶斯

基于概率的常见的分类方法--朴素贝叶斯

怎样通俗易懂地解释贝叶斯网络和它的应用？

贝叶斯分类算法及其实现

如何理解贝叶斯公式

下载排行榜

开关电源设计原理手册

FS5080E 5V升压充电两串锂电池充电管理IC中文手册

UC3842/3/4/5电源管理芯片中文手册

DMT0660数字万用表产品说明书

ST7789V2单芯片控制器/驱动器英文手册

TPS54202H降压转换器评估模块用户指南

朴素贝叶斯分类朴素贝叶斯算法的优点