生物神经元和M-P神经元模型简介

可靠性杂坛 2024-01-23 1871

描述

近年来，作为人工智能领域最重要的进展--深度学习(Deep Learning)，在诸多领域都有很多惊人的表现。早在2013年，深度学习就被麻省理工学院的《MIT科技评论》(MIT Technology Review)评为世界10大突破性技术之一。

另一个更具有划时代意义的案例是，2016年3月，围棋世界顶级棋手李世石九段，以1∶4不敌谷歌公司研发的阿尔法围棋（AlphaGo，亦称阿尔法狗），这标志着人工智能在围棋领域已经开始“碾压”人类。在2016年年末至2017年年初，AlphaGo的升级版Master（大师）又在围棋快棋对决中，以60场连胜横扫中日韩顶尖职业高手，一时震惊四野。

深度学习不仅是一种算法的升级，还是一种全新的思维方式。我们完全可以利用深度学习，通过对海量数据的快速处理，消除信息的不确定性，从而帮助我们认知世界。它带来的颠覆性在于，将人类过去痴迷的算法问题，演变成数据和计算问题。在以前，“算法为核心竞争力”正在转变为“数据为核心竞争力”。

我们知道，深度学习的概念源于人工神经网络的研究，所以说到深度学习，就不能不提神经网络。自20世纪80年代起，人工神经网络(ArtificialNeural Network，ANN)开始兴起，而且在很长一段时间内都是人工智能领域的研究热点。

有关神经网络的定义有很多。这里我们给出芬兰计算机科学家托伊沃·科霍宁(Teuvo Kohonen)的定义（他以提出“自组织神经网络”而名扬人工智能领域）：“神经网络是一种由具有自适应性的简单单元构成的广泛并行互联的网络，它的组织结构能够模拟生物神经系统对真实世界所做出的交互反应。

人工神经网络是受到生物神经网络的启发而来，在生物神经网络中，人类大脑通过增强或者弱化突触进行学习的方式，最终会形成一个复杂的网络，形成一个分布式特征表示(Distributed Representation)。

1. 生物神经元简介

生物神经网络中的最基本元素就是神经元(Neuron)。神经元，一般包括神经细胞体(Soma)、树突(Dendrites)、轴突(Axon)和突触(Synapse)4部分.神经元是大脑的基本计算单元。人类的神经系统有大约86亿个神经元，由神经突触连接在一起。在生物神经网络中，每个神经元与其他神经元通过突触进行连接。神经元之间的信息传递，属于化学物质的传递。当它“兴奋”时，就会向与它相连的神经元发送化学物质（神经递质，Neurotransmitter），从而改变这些神经元的电位。如果某些神经元的电位超过了一个阈值，那么，它就会被“激活”，也就是“兴奋”起来，接着向其他神经元发送化学物质，犹如涟漪，就这样一层接着一层传播。

1）神经元的信息传递机理

在神经元中，突触承载神经冲动信息传导功能，树突和细胞体为输入接口，接受突触点的输入信号；细胞体类似于一个微处理器，对各树突和细胞体各部位获取的来自其他神经元的输入信息进行组合，并在一定条件下触发，形成神经冲动输出信号；输出信号沿轴突传至轴突末梢，轴突末梢作为输出端，通过突触将这一输出信号传向其他神经元的树突和细胞体。下面对神经元之间信息的产生、传递和整合进行阐述。研究表明，神经元之间信息的产生、传递和整合是一种电化学活动。由于细胞膜本身对不同离子具有不同的通透性，所以使膜内外细胞液中的离子存在浓度差。神经元在无神经信号输入时，其细胞膜内外由离子浓度差造成的电位差在-70mV（内负外正）左右，称为静息电位，此时，细胞膜的状态为极化状态(Polarization)，神经元的状态为静息状态。当神经元受到外界刺激时，如果膜电位从静息电位向正方向偏移，则称为去极化(Depolarization)，此时神经元的状态为兴奋状态；如果膜电位从静息电位向负方向偏移，则称为超极化(Hyperpolarization)，此时神经元的状态为抑制状态。神经元细胞膜的去极化和超极化程度反映了神经元的兴奋和抑制的强烈程度。在某一时刻，神经元总是处于静息、兴奋和抑制3种状态之一。神经元之间信息的产生与兴奋程度相关，在外界刺激下，当神经元的兴奋程度超过了某个限度，即细胞膜去极化程度超过了某个阈值电位时，神经元被激发而输出神经脉冲。每个神经脉冲产生的经过如下：当膜电位以静息电位为基准高出15mV，即超过阈值电位(-55mV)时，该神经细胞变成活性细胞，其膜电位自发地急速升高，在1ms内，相比于静息电位上升100mV左右，此后膜电位又急速下降，回到静止时的值。这一过程称为细胞的兴奋过程，兴奋的结果是产生一个宽度为1ms、振幅为100mV的电脉冲，又称神经冲动，如图所示。

图　膜电位变化

值得注意的是，当细胞体产生一个电脉冲后，即使受到很强的刺激，也不会立刻产生兴奋性电脉冲，这是因为神经元在发放电脉冲时，阈值电位急速升高，持续1ms后慢慢下降到-55mV这一正常状态，这段时间约为数毫秒，称为不应期。不应期结束后，若细胞受到很强的刺激，则会再次产生兴奋性电脉冲。由此可见，神经元产生的信息是具有电脉冲形式的神经冲动，各电脉冲的宽度和幅度相同，而其间隔是随机变化的。神经元的输入电脉冲密度越大，其兴奋程度越高，单位时间内产生的电脉冲串的平均频率也越高。

2）神经元之间信息的传递

神经冲动信号沿轴突传向其末端的各个分支，在轴突的末端触及突触前时，突触前的突触小泡能释放一种化学物质（神经递质）。在前一个神经元发放电脉冲并传到其轴突末梢后，这种神经递质从突触前膜释放出，经突触间隙的液体扩散，在突触后膜与特殊受体相结合。受体的性质决定了神经递质的作用是兴奋还是抑制，并据此改变突触后膜的离子通透性，从而使突触后膜电位发生变化。根据突触后膜电位的变化，可将突触分为两种：兴奋性突触和抑制性突触。兴奋性突触的后膜电位随神经递质与受体结合数量的增加而向正电位方向变化，抑制性突触的后膜电位随递质与受体结合数量的增加而向负电位方向变化。从化学角度看，当兴奋性神经递质传到突触后膜时，后膜对离子通透性的改变使流入细胞膜内的正离子增加，从而使突触后膜成分去极化，产生兴奋性突触后电位；当抑制性神经递质传送到突触后膜时，突触后膜对离子通透性的改变使流出细胞膜外的正离子增加，从而使突触后膜成分超极化，产生抑制性突触后电位。

当突触前膜释放的兴奋性神经递质使突触后膜的去极化电位超过了某个阈值电位时，后一个神经元就有神经冲动输出，从而把前一个神经元的信息传递给后一个神经元，如图所示。

图　突触信息传递过程

从电脉冲（神经冲动）信号到达突触前膜，到突触后膜电位发生变化，有0.2～1ms的时间延迟，称为突触延搁(SynapticDelay)。这段延迟是神经递质分泌、向突触间隙扩散、到达突触后膜并发生作用的时间总和。由此可见，突触对神经冲动的传递具有延时作用。在人脑中，神经元间的突触联系大部分是在出生后由于给予刺激而成长起来的。外界刺激的性质不同，能够改变神经元之间的突触联系，即突触后膜电位变化的方向与大小，从突触信息传递的角度看，表现为放大倍数和极性的变化。正是由于各神经元之间的突触连接强度和极性有所不同并可进行调整，人脑才具有学习和存储信息的功能。

3）神经元之间信息的整合

神经元对信息的接受和传递都是通过突触来进行的。单个神经元可以与多达上千个其他神经元的轴突末梢形成突触连接，接受从各个轴突传来的脉冲输入。这些输入可到达神经元的不同部位，输入部位不同，对神经元影响的权重也不同。在同一时刻产生的刺激引起的膜电位变化大致等于各单独刺激引起的膜电位变化的代数和，这种累加求和称为空间整合。另外，各输入脉冲抵达神经元的先后时间也不一样。由一个脉冲引起的突触后膜电位很低，但在其持续时间内有另一个脉冲相继到达时，总的突触后膜电位升高，这种现象称为时间整合。输入一个神经元的信息在时间和空间上常呈现一种复杂多变的形式，神经元需要对它们进行积累和整合加工，从而决定其输出的时机和强弱。正是由于神经元的这种时空整合作用，才使得神经元在神经系统中可以有条不紊、夜以继日地处理着各种复杂的信息，执行着生物中枢神经系统的各种信息处理功能。

2.M-P神经元模型

现在我们所讲的神经网络包括深度学习，追根溯源，它们在模拟大脑神经元的工作机理，模仿大脑神经元的最早示例，就是20世纪40年代提出但一直沿用至今的“M-P神经元模型”。

M-P神经元模型，最早源于发表于1943年的一篇开创性论文。论文的两位作者分别是神经生理学家沃伦·麦克洛克（WarrenMcCulloch）和数学家沃尔特·皮茨（Walter Pitts），论文首次实现了用一个简单电路（即感知机）来模拟大脑神经元的行为。

M-P神经元模型，如图所示，神经元接收来自n个其他神经元传递过来的输入信号。这些信号的表达，通常通过神经元之间连接的权重(Weight)大小来表示，神经元将接收到的输入值按照某种权重叠加起来，与当前神经元的阈值进行比较，然后通过激活函数(Activation Function)向外表达输出，在概念上这就叫感知机(Perceptron)。

这里的关键是，信息是通过一个激活函数来处理的。激活函数模拟大脑神经元，输入信号的强度的大小决定了它们被触发或者不被触发。然后处理结果被加权并分配到下一层神经元。从本质上来讲，神经元通过加权和相互激活。这保证了两个神经元之间连接强度的大小由处理信息的权重来确定。

人工神经元数学节点、单元或者神经元是人工神经网络的核心。它是基本的处理单位。输入层神经元接收通过数学函数处理的输入信息，然后把它们分发到隐藏层神经元。信息经隐藏层神经元处理后传送到输出层神经元。

图 M-P神经元模型

图 M-P神经元模型与生物神经元对比

审核编辑：汤梓红

打开APP阅读更多精彩内容