GPU是什么 GPU常见计算精度

处理器/DSP

873人已加入

描述

GPU的历史

目前GPU 虚拟化市场有三个大玩家,分别是核弹厂、农企和牙膏厂(NVIDIA、AMD 和Intel)。 1981:  IBM PC Monochrome Display Adapter (2D) 1996:  3D graphics (e.g., 3dfx Voodoo) 1999:  register combiner (NVIDIA GeForce 256) 2001:  programmable shaders (NVIDIA GeForce 3) 2002:  floating-point (ATI Radeon 9700) 2005:  unified shaders (ATI R520 in Xbox 360) 2006:  compute (NVIDIA GeForce 8800) GPU最早是用来处理图像的,为什么要想到用GPU做计算呢?GPU比CPU使用更大比例的芯片占比用作计算。在峰值性能下,GPU每次操作消耗的能量比CPU少一个数量级。 GPU 最大的组成部分是着色器(Shader),负责所有的模型和3D 渲染工作。也就是说,着色器越多,GPU 能同时做的事越多,着色器越快,GPU 的运行速度也就越快。着色器不仅仅可以用在图形渲染上,也可以用作GPGPU(General Purpose GPU 通过GPU)。因为GPU 中有很多的着色器,着色器也就是浮点运算处理器,所以GPU 可以同时处理大量的计算工作。不管是物理GPU 还是虚拟GPU,不同的生产厂商在这方面的支持不一样。你可能听说过CUDA 或者OpenCL,这些就是可以API调用来实现利用着色器进行GPGPU 任务的库。 除了着色器外,GPU 中还包含视频解码器和编码器。通常来说,这些只占GPU 的很小一部分。  

GPU是什么

图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理,是显卡或GPU卡的“心脏”。

gpu

其中Control是控制器、ALU算术逻辑单元、Cache是cpu内部缓存、DRAM就是内存。可以看到GPU设计者将更多的晶体管用作执行单元,而不是像CPU那样用作复杂的控制单元和缓存。 从实际来看,CPU芯片空间的5%是ALU,而GPU空间的40%是ALU。这也是导致GPU计算能力超强的原因。

GPU主流厂商    

 英特尔:基本为集成显卡芯片,用于英特尔的主板和英特尔的CPU。    

 NVIDIA:NVIDIA是现在最大的独立显卡芯片生产销售商。    

 AMD(ATI):AMD是世界上第二大的独立显卡芯片生产销售商,他的前身就是ATI,2006年AMD以54亿美元收购ATI。

 GPU通信知识

GPU是协处理器,与CPU端存储是分离的,故GPU运算时必须先将CPU端的代码和数据传输到GPU,GPU才能执行kernel函数。涉及CPU 与GPU通信,其中通信接口PCI-E的版本和性能会直接影响通信带宽。

NvLink 技术:提供更高带宽与更多链路,并可提升多 GPU 和多 GPU/CPU 系统配置的可扩展性,因而可以解决这种互联问题。单个 NVIDIA Tesla V100 GPU 即可支持多达六条 NVLink 链路,总带宽为 300 GB/秒,这是 PCIe 3 带宽的 10 倍。NVLink提升GPU服务器单机的GPU通信性能

GPUDirect RDMA技术:则提升了不同服务器间GPU的通信性能,其实就是计算机A的GPU可以直接访问计算机B的GPU内存 ;深度学习模型越来越复杂,计算数据量暴增,对于大规模深度学习训练任务,单机已经无法满足计算需求,多机多卡的分布式训练成为了必要的需求,这个时候多机间的通信成为了分布式训练性能的重要指标。

gpu

 

gpu

GPU常见计算精度

浮点计数是利用浮动小数点的方式使用不同长度的二进制来表示一个数字,与之对应的是定点数。同样的长度下浮点数能表达的数字范围相比定点数更大,但浮点数并不能精确表达所有实数,而只能采用更加接近的不同精度来表达。

gpu

FP32 单精度计算

单精度的浮点数中采用4个字节也就是32位二进制来表达一个数字,1位符号,8位指数,23位小数,有效位数为7位。

gpu

FP64 双精度计算

双精度浮点数采用8个字节也就是64位二进制来表达一个数字,1位符号,11位指数,52位小数,有效位数为16位。

gpu

FP16 半精度计算

半精度浮点数采用2个字节也就是16位二进制来表达一个数字, 1位符号、5位指数、10位小数,有效位数为3位。

GPU散热方式

显卡的散热方式分为散热片和散热片配合风扇的形式,也叫作主动式散热和被动式散热方式。

一般一些工作频率较低的显卡采用的都是被动式散热,这种散热方式就是在显示芯片上安装一个散热片即可,并不需要散热风扇。

因为较低工作频率的显卡散热量并不是很大,没有必要使用散热风扇,这样在保障显卡稳定工作的同时,不仅可以降低成本,而且还能减少使用中的噪音。

gpu

NVIDIA Tesla Family被动散热

gpu

NVIDIA QUADRO Family主动散热

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分