用Python从头实现一个神经网络来理解神经网络的原理1

电子说

1.3w人已加入

描述

有个事情可能会让初学者惊讶:神经网络模型并不复杂!『神经网络』这个词让人觉得很高大上,但实际上神经网络算法要比人们想象的简单。

这篇文章完全是为新手准备的。我们会通过用Python从头实现一个神经网络来理解神经网络的原理。本文的脉络是:

  1. 介绍了神经网络的基本结构——神经元;
  2. 在神经元中使用S型激活函数;
  3. 神经网络就是连接在一起的神经元;
  4. 构建了一个数据集,输入(或特征)是体重和身高,输出(或标签)是性别;
  5. 学习了损失函数和均方差损失;
  6. 训练网络就是最小化其损失;
  7. 用反向传播方法计算偏导;
  8. 用随机梯度下降法训练网络。

***01 ***砖块:神经元

首先让我们看看神经网络的基本单位,神经元。神经元接受输入,对其做一些数据操作,然后产生输出。例如,这是一个2-输入神经元:

神经元

这里发生了三个事情。首先,每个输入都跟一个权重相乘(红色):

神经元

然后,加权后的输入求和,加上一个偏差b(绿色):

神经元

最后,这个结果传递给一个激活函数f:

神经元

激活函数的用途是将一个无边界的输入,转变成一个可预测的形式。常用的激活函数就就是S型函数:

神经元

S型函数的值域是(0, 1)。简单来说,就是把(−∞, +∞)压缩到(0, 1) ,很大的负数约等于0,很大的正数约等于1。

***02 ***一个简单的例子

假设我们有一个神经元,激活函数就是S型函数,其参数如下:

神经元

神经元就是以向量的形式表示神经元。现在,我们给这个神经元一个输入神经元。我们用点积来表示:

神经元

当输入是[2, 3]时,这个神经元的输出是0.999。给定输入,得到输出的过程被称为前馈(feedforward)。

***03 ***编码一个神经元

让我们来实现一个神经元!用Python的NumPy库来完成其中的数学计算:

import numpy as np
defsigmoid(x): # 我们的激活函数: f(x) = 1 / (1 + e^(-x)) return 1 / (1 + np.exp(-x))
classNeuron: def__init__(self, weights, bias): self.weights = weights self.bias = bias
deffeedforward(self, inputs): # 加权输入,加入偏置,然后使用激活函数 total = np.dot(self.weights, inputs) + self.bias return sigmoid(total)
weights = np.array([0, 1]) # w1 = 0, w2 = 1bias = 4 # b = 4n = Neuron(weights, bias)
x = np.array([2, 3]) # x1 = 2, x2 = 3print(n.feedforward(x)) # 0.9990889488055994
还记得这个数字吗?就是我们前面算出来的例子中的0.999。

***04 ***把神经元组装成网络

所谓的神经网络就是一堆神经元。这就是一个简单的神经网络:

神经元

这个网络有两个输入,一个有两个神经元(神经元神经元)的隐藏层,以及一个有一个神经元(神经元 )的输出层。要注意,神经元输入就是神经元神经元的输出,这样就组成了一个网络。

隐藏层就是输入层和输出层之间的层,隐藏层可以是多层的。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分