形象的理解深度网络架构

消耗积分:1 | 格式:rar | 大小:0.1 MB | 2017-09-22

分享资料个

　　在过去几年里，许多计算机视觉相关的深度学习的发展，都可以归结于少数几个神经网络架构。抛开所有关于数学、代码和实现的细节，来探索一个简单的问题：这些模型如何工作以及为什么工作？

　　在撰写这篇文章时，Keras 库（http://suo.im/4aLGEd）中已经涵盖了6种预训练模型，分别是：

　　VGG16

　　VGG19

　　ResNet50

　　Inception v3

　　Xception

　　MobileNet

　　▍VGG

　　VGG网络和从2012年早期的 AlexNet 网络一样，遵循着现有卷积网络的典型布局：在最终的全连接分类层（fully-connected classification layers）之前，由一系列的卷积层（convolutional layers），最大池化层（max-pooling layers）和激活层（activation layers）构成。

　　MobileNet 本质上是 Xception 架构，针对移动应用而优化的线性版本。剩下的三种架构则真正重新定义了我们看待深度网络的方式。

　　这篇文章接下来的部分将侧重于ResNet，Inception和Xception三种架构的直观理解，以及为什么它们成为计算机视觉中许多后续工作的基石。

　　▍ResNet

　　为什么深度网络在不断增加层的时候，表现反而变的更差？

　　直观来想，更深层次的网络，应该不比较浅的网络表现的差，至少在训练的时候应该这样（这时没有过拟合over-fitting的风险）。

　　让我们作一个思维实验，假设我们已经建立了一个n层的网络，达到了一定的准确性。如果仅通过复制相同的前n个层并对最后一层执行单位映射，则n + 1层的网络至少应该能够获得完全相同的精度。

　　类似地，n + 2，n + 3和n + 4层的网络都可以继续执行单位映射并获得相同的准确性。然而，实际上，这些更深层的网络在性能上几乎都会有所下降。

　　ResNet的作者将这些问题归结为一个假设：直接映射难以学习。

　　他们提出了一个解决办法：用学习 x到 H（x）两者之间的差异，或者“残差”的方式，替代尝试学习从x到 H（x）的底层映射。这样，我们就可以可以通过输入残差来计算 H（x）。

　　假设我们用 F（x）=H（x）-x 来表示残差。 ResNet 网络现在不是试图直接学习 H（x），而是学习 F（x）+x。

　　这引出了你可能知道的著名的ResNet（或“残差网络”）模块：

　　形象的理解深度网络架构

　　ResNet中的每个“模块”都由一系列层和一个“捷径”连接，捷径连接将模块的输入值直接添加到其输出值。 “添加”操作以元素对应方式执行，如果输入和输出的大小不同，可以使用补零法（zero-padding）或投影（通过1x1卷积）匹配尺寸。

　　回到我们的思维实验，捷径连接大大简化了我们对单位层的构建。直观的看，学习将 F（x）推到0并将输出值保留为x比从头开始学习单位交换（identity transformation）要容易得多。一般情况下，ResNet为层提供了一个“参考”点—x—来开始学习。

　　这个想法在实践中效果惊人。在此之前，深度神经网络经常遇到梯度消失（vanishing gradients）的问题，来自误差函数的梯度信号随着它们向较早层反向传播而呈指数下降。

　　从本质上说，当误差信号一直传到到早期层时，它们已经小到网络无法进行学习了。然而，由于ResNet中的梯度信号可以通过捷径连接直接返回到早期层，突然间我们就可以建立 50层，101层，152层，甚至（想当然）1000+层的网络，而它们仍然表现良好。用22层的网络赢得了2014年ILSVRC挑战，这在当时是一个巨大的技术飞跃。

下载并关注上传者

开通VIP，低至0.08元下载/次

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

汽车类高电流无刷直流 (BLDC) 电机驱动器原理图介绍
2024-04-25 12次下载

下载
2023年光伏行业发展回顾报告
2024-04-30 10次下载

下载
山特TG400UPS工作原理与维修
2024-04-29 8次下载

下载
STM32F10xxx参考手册
2024-05-11 6次下载

下载
FS-MCore-F800E 系列(EZDTU)快速使用指南
2024-04-28 6次下载

下载
采用 CMOS传感器的监控摄像头参考设计
2024-05-17 6次下载

下载

形象的理解深度网络架构​

网络架构的时钟系统——设计与验证

深度对战自编码网络在船舶重量评估的应用

改进的多尺度深度网络手势识别模型

基于深度级联孪生网络的通信信号调制识别算法

基于深度迁移学习网络的肺结节辅助CT诊断

基于生成对抗网络的深度伪造视频综述

采用自监督CNN进行单图像深度估计的方法

深度：嵌入式系统的软件架构设计！资料下载

端到端的深度学习网络人体自动抠图算法

基于预训练模型和长短期记忆网络的深度学习模型

3小时学习神经网络与深度学习课件下载

基于复合的深度神经网络的图像超分辨率重建

结合注意力机制的改进深度学习光流网络

一种融合深度网络的改进快速生成超像素算法

基于编码-解码卷积架构的联合策略网络

基于深度神经网络的图像语义分割方法

基于深度信念网络的实体识别算法

基于深度学习的二维人体姿态估计方法

以进化算法为搜索策略实现神经架构搜索的方法

一种基于表结构和内容的问句理解方法

综述深度神经网络的解释方法及发展趋势

分析总结基于深度神经网络的图像语义分割方法

一种基于多视图架构的深度卷积神经网络模型

一种改进的深度神经网络结构搜索方法

一种多层级特征融合就的深度卷积网络

基于深度神经网络的文本分类分析

如何使用深度残差网络进行无人机航拍图像识别

实现强人工智能自然语言理解有哪些思路？

强人工智能自然语言理解方面的13个思路详细资料免费下载

deepid3：非常深的神经网络的人脸识别深度算法的网络架构

详解深度学习、神经网络与卷积神经网络的应用

如何理解示波器的采样率和存储深度？

卷积神经网络通俗理解

开源网络引导固件iPXE正式支持龙架构

深度ReLU网络的对应浅层网络

深度学习与图神经网络学习分享：CNN经典网络之-ResNet

深度神经网络的基本理论和架构

深度解读对残差网络动机的理解

如何理解泛化是深度学习领域尚未解决的基础问题

如何定义网络架构或结构加速视觉系统的优化

脊叶网络架构下的布线系统说明

深度理解Linux下网络包的接收过程

深度理解在Linux下网络包的接收过程

6G网络需具备的技术特征及网络架构

神经网络的DBN与GAN及RNN等形象的详细资料讲解

整个神经网络的架构，只要能理解这个

深度神经网络的实现机理与决策逻辑难以理解

CANOpen系列教程11_ 深度分析CanFestival_3架构

深度探析7大类深度CNN创新架构

深度理解高通骁龙710的五大特性

用于理解深度神经网络的CLass增强型注意响应（CLEAR）方法

如何理解深度学习？深度学习的理论探索分析

采用的网络架构，实现了基于图像强度的变分深度自编码器

一文详解深度学习的5 种架构

通过删除神经元理解深度学习

百度发布Visual DL 使得深度学习任务变得生动形象，实现可视分析

斯坦福探索深度神经网络可解释性 决策树是关键

详细剖析神经网络和深度神经网络的区别

理解神经网络中的Dropout

对图像处理和卷积神经网络架构的案例分析和概念理解

下载排行榜

汽车类高电流无刷直流 (BLDC) 电机驱动器原理图介绍

2023年光伏行业发展回顾报告

山特TG400UPS工作原理与维修

STM32F10xxx参考手册

FS-MCore-F800E 系列(EZDTU)快速使用指南

采用 CMOS传感器的监控摄像头参考设计

形象的理解深度网络架构

斯坦福探索深度神经网络可解释性决策树是关键