什么是深度学习，深度学习能解决什么问题

陈RQING 2020-11-05 5019

人工智能

636人已加入

描述

深度学习是机器学习与神经网络、人工智能、图形化建模、优化、模式识别和信号处理等技术融合后产生的一个领域。在严谨的学术期刊中，这个新兴学科的模型一直受严肃理智的学者所推崇：

“深度学习网络是神经网络革命性的发展，人们甚至认为可以用它来创建更强大的预测模型。”

1、成功的蓝图

简单来说，深度神经网络是一种用多层抽象来表示概念或特征的方式。其实，任何工程师或者建筑师都在用这种基本方法。想想大型办公楼的蓝图：在最底层，会标示出电路、水管和排水系统的详细情况;而在最高层，可能会有一个旋转观景台和旗杆，能看到整个30层楼的轮廓。

深度神经网络也遭循这个非常有用的方案。该方案几乎被用于生活的各个领域。医生有诊断书，教师有教学大纲，企业有盈利策划书，甚至学术界都有一个发表研究论文的规范。

实际上，在生活中很难找出不用多层抽象来表达观点的例子——军队指挥官用相同的原则部署作战，政治家以此赢得竞选。相同的原理同样适用于神经网络或者其他多层模型的分类和预测，这是室无道理的。

更快的计算机处理器，日益廉价的内存以及层出不穷的新数据格式，使得任意规模的企业都能用深度学习来做数据分析。

2、有监督学习和无监督学习

深度学习使用多层机器学习模型对数据进行有监督学或无监督学习。模型中的不同层由非线性数据变换的多个阶段组成，数据的特征在相继更高、更抽象的层表示。

数据科学领域有如下两种基本的学习类型。

有监督学习：训练的数据包含已知的结果。模型相对于这些结果进行训练。

无监督学习：训练数据不包含任何已知的结果。算法自行发现数据中的联系。

3、深度学习的流程

在学习深度学习的核心思想时，我们采取的通用方法一般如图2.1所示。无论开发什么类型的机器学习模型，最终都回归到这个基本模型。输入数据传递给模型，经过多个非线性层进行过滤，最后一层包含分类器——决定该对象所属的种类。

图2.1 通用深度学习框架

用数据进行学习的目标是预测响应变量或者用一组给定的属性对响应变量分类。这与线性回归有点类似，在线性回归中，用一组独立变量（也叫属性或特征）通过一个线性模型来预测因（响应）变量。不过，传统的线性回归模型并不被视为深度学习，因为它们没有对数据进行多层的非线性变换。

其他流行的数据学习技术有决策树（ decision tree ）、随机森林（ random forest ）和支持向量机（support vector machine ）。这些技术虽然强大，但是并不深入。决策树和随机森林工作在原始输入数据上，不进行变换，也不生成新特征;支持向量机层次较浅，因为它们仅由核函数和线性变换组成。类似地单隐藏层神经网络也不被视为深度神经网络，因为它们只包含一个隐藏层。

深度学习能解决什么问题

深度学习的威力来自于用适量的并行非线性步骤对非线性数据进行分类或预测的能力。从原始输入数据到数据的实际分类的过程中，深度学习模型学习输入数据的分层特征。每一层从前一层的输出中提取特征。

本书所指的深度学习模型是有多个隐藏层的神经网络。如图2.2所示，最简单的深度神经网络至少包含两层的隐藏神经元。其中每一层的输入来自上一层的输出。

图2.2 带两个隐蔽层的前馈神经网络

多层深度神经网络有多个非线性层级，可以紧凑地表示高度非线性的和/或高度变化的函数。它们擅长识别数据中的复杂模式，可以用来改进计算机视觉和自然语言处理等工作，并可以解决非结构化数据难题。

全球发行且读者众多的杂志《IEEE Spectrum》报道：”数据科学家供不应求。这些专业人士享有高薪和大型股票期权“据麦肯锡全球研究所称，仅美国就缺少14万~19万具备适当技能的数据科学家，哈佛商业评论声称数据科学是21世纪最吸引人的工作。
责任编辑人：CC

打开APP阅读更多精彩内容