GPU引领的深度学习

消耗积分:2 | 格式:pdf | 大小:162.24KB | 2021-02-26

分享资料个

早期的机器学习以搜索为基础，主要依靠进行过一定优化的暴力方法。但是随着机器学习逐渐成熟，它开始专注于加速技术已经很成熟的统计方法和优化问题。同时深度学习的问世更是带来原本可能无法实现的优化方法。本文将介绍现代机器学习如何找到兼顾规模和速度的新方法。

AI领域的转变

在本系列的第1部分中，我们探讨了AI的一些历史，以及从Lisp到现代编程语言以及深度学习等新型计算智能范式的历程。我们还讨论了人工智能的早期应用，它们依赖于经过优化的搜索形式、在海量数据集上进行训练的现代神经网络架构，同时解决了十年前还被认为不可能的难题。然而目前仍有两大难题有待解决，即：如何进一步加速这些应用，以及将它们限制在智能手机这样的功耗优化环境中。

今天，深度学习成为了多数加速技术的重点研究对象。深度学习是一种神经网络架构，它依赖于多层神经网络，其中的每一层都可以支持不同的功能以进行特征检测。这些深层神经网络依赖于可方便运用并行计算的矢量运算，并为神经网络层分布式计算以及同层诸多神经元并行计算创造了条件。

通过GPU加速机器学习

图形处理单元（GPU）最初并不是用于加速深度学习应用。GPU是一种特殊的设备，用于加速输出到显示设备的帧缓冲区（内存）的构建。它将渲染后的图像存入帧缓冲区，而不是依靠处理器来完成。GPU由数以千计的独立内核组成，它们并行运行并执行矢量运算等特定类型的计算。尽管最初GPU专为视频应用而设计，但人们发现它们也可以加速矩阵乘法等科学计算。

开发人员既可以借助于GPU供应商提供的API将GPU处理功能集成到应用中，也可以采用适用于诸多不同环境的标准软件包方式。R编程语言和编程环境包含与GPU协同工作来加快处理速度的软件包，例如gputools、gmatrix和gpuR。GPU也可以通过numba软件包或Theano等各种库借助于Python进行编程。

通过这些软件包，任何有意将GPU加速应用于机器学习的人都可以达成愿望。但是工程师们还在研究更专门的方法。2019年，英特尔®以20亿美元的价格收购了Habana Labs，一家致力于为服务器中的机器学习加速器开发定制芯片的公司。此外，英特尔还于2017年以150亿美元收购了自动驾驶芯片技术企业Mobileye。

定制芯片和指令

除了服务器和台式机中的GPU加速之外，用于机器学习的加速器正在试图超越传统平台，进军功耗受限的嵌入式设备和智能手机。这些加速器形式多样，包括U盘、API、智能手机神经网络加速器以及用于深度学习加速的矢量指令等。

适用于智能手机的深度学习

深度学习工具包已经从PC端延伸到智能手机，可为存在更多限制的网络提供支持。TensorFlow Lite和Core ML等框架已经部署在用于机器学习应用的移动设备上。Apple®最近发布了A12 Bionic芯片，这款芯片包括一个8核神经网络引擎，用于开发更加节能的神经网络应用，从而扩展Apple智能手机上的深度学习应用。

Google发布了适用于Android® 8.1并具有机器学习功能的神经网络API (NNAPI)，目前已应用于Google Lens自然语言处理和图像识别背景下的Google Assistant。NNAPI与其他深度学习工具包相似，但它是针对Android智能手机环境及其资源限制而构建的。

深度学习USB

英特尔发布了其新版神经计算棒，以U盘的形式加速深度学习应用。TensorFlow、Caffe和PyTorch等众多机器学习框架都可以使用它。当没有GPU可用时，这将是一个不错的选择，同时还可以快速构建深度学习应用原型。

深度学习指令

最后，在机器学习计算从CPU转移到GPU的同时，英特尔使用新的指令优化了其Xeon指令集，来加速深度学习。这些被称为AVX-512扩展的新指令（所谓的矢量神经网络指令或VNNi）提高了卷积神经网络运算的处理量。

总结

GPU在机器学习中的应用实现了在众多应用中构建和部署大规模深度神经网络的能力。机器学习框架使构建深度学习应用变得简单。智能手机供应商也不甘人后，为受到诸多限制的应用集成了高能效的神经网络加速器（以及用于定制应用的API现在市面上还有其他可转移到USB硬件上的加速器，许多新的初创公司也在加大加速器领域的投入，为未来机器学习应用做准备。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

人形机器人执行、感知系统技术及市场解析
2026-05-20 104次下载

下载
瑞芯微RK3588系列开发板-产品资料更新-2026.06
2026-06-08 5次下载

下载
OK3506-S12 Mini开发板产品资料-2025.10
2026-06-08 3次下载

下载
ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册
2026-06-10 3次下载

下载
FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V
2026-05-22 2次下载

下载
LZC9300A 高性能恒压恒流碳化硅驱动控制芯片
2026-06-06 2次下载

下载

GPU引领的深度学习

适应边缘AI全新时代的GPU架构

MATLAB深度学习简介电子书

Ian-2017-《深度学习》英文电子版.pdf

基于深度学习的道路表面裂缝检测技术

基于深度学习的机器人示教系统设计与实现

基于评分矩阵与评论文本的深度学习模型

基于深度学习的光学成像算法综述

基于深度学习的行为识别算法及其应用

Python深度学习

基于深度迁移学习网络的肺结节辅助CT诊断

基于深度学习的二维人体姿态估计算法

基于深度学习的自然语言处理对抗样本模型

基于预训练模型和长短期记忆网络的深度学习模型

3小时学习神经网络与深度学习课件下载

基于深度学习的图像修复模型及实验对比

深度模型中的优化与学习课件下载

综述深度学习的卷积神经网络模型应用及发展

基于深度学习的显著性目标检测的数据集和评估准则

基于深度学习的三维点云语义分割研究分析

基于RNN和深度学习的Linux远控木马检测

基于深度学习的疲劳驾驶检测算法及模型

基于深度学习的视频质量评价方法及模型研究

基于深度学习的X射线胸部疾病诊断算法

使用TensorFlow建立深度学习和机器学习网络

基于深度学习的二维人体姿态估计方法

深度学习模型的对抗攻击及防御措施

新型基于深度学习的目标实时跟踪算法

深度学习入门：基于Python的理论与实现电子书

MXNet深度学习计算平台中文学习笔记免费下载

Python深度学习2018的源代码合集免费下载

深度学习工作负载中GPU与LPU的主要差异

GPU在深度学习中的应用 GPUs在图形设计中的作用

NPU在深度学习中的应用

pcie在深度学习中的应用

GPU深度学习应用案例

深度学习GPU加速效果如何

GPU在深度学习中的应用与优势

GPU的张量核心： 深度学习的秘密武器

深度学习框架和深度学习算法教程

深度学习框架是什么？深度学习框架有哪些？

什么是深度学习算法？深度学习算法的应用

深度学习算法简介 深度学习算法是什么 深度学习算法有哪些

深度学习如何挑选GPU？

GPU引领的深度学习

深度学习中的图像分割

如何使用FPGA加速深度学习计算？

GPU 引领的深度学习

FPGA中GPU深度学习面临的挑战

何时使用机器学习或深度学习

使用Apache Spark和NVIDIA GPU加速深度学习

什么是深度学习（Deep Learning）？深度学习的工作原理详解

NVIDIA GPU加快深度神经网络训练和推断

什么？不用GPU也能加速你的YOLOv3深度学习模型

深度学习的GPU共享工作

GPU成为辅助完成深度学习算法的主流计算工具

基于深度学习的ADAS系统，是GPU的主力市场

人工智能深度学习的成功

GPU和GPP相比谁才是深度学习的未来

GPU与CPU间的比较

深度学习的发展会带给硬件架构怎样的影响？

下载排行榜

人形机器人执行、感知系统技术及市场解析

瑞芯微RK3588系列开发板-产品资料更新-2026.06

OK3506-S12 Mini开发板产品资料-2025.10

ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册

FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V

LZC9300A 高性能恒压恒流碳化硅驱动控制芯片

GPU的张量核心：深度学习的秘密武器

深度学习算法简介深度学习算法是什么深度学习算法有哪些