GPGPU
好的,我们用中文来解释一下 GPGPU。
GPGPU 的全称是 General-Purpose computing on Graphics Processing Units,中文通常翻译为:
- 图形处理器通用计算
- GPU 通用计算
核心含义:
GPGPU 指的是 利用原本设计用于处理计算机图形(尤其是 3D 图形渲染)的 GPU(图形处理器)来执行原本由 CPU(中央处理器)负责的通用计算任务。
简单来说:
- GPU 本来是用来干嘛的? 快速渲染游戏和视频中的 3D 图像、处理像素和顶点。它们的特点是拥有成百上千个相对简单的处理核心,擅长并行处理大量相似的小任务(比如同时计算屏幕上几百万个像素的颜色)。
- CPU 本来是用来干嘛的? 执行操作系统、运行应用程序、处理各种复杂的逻辑和控制流任务。CPU 的核心数量较少(通常在几个到几十个之间),但每个核心都非常强大和灵活,擅长串行处理复杂且有依赖关系的任务。
GPGPU 的理念:
既然 GPU 拥有如此强大的并行处理能力,为什么不把它用在图形渲染之外的地方呢?比如:
- 科学计算:模拟天气、蛋白质折叠、流体动力学、量子物理等。
- 人工智能/机器学习:深度学习模型的训练和推理(这是目前 GPGPU 最火热的领域)。
- 数据分析与挖掘:处理海量数据集。
- 密码学:加密解密、挖矿(加密货币)。
- 图像/视频处理:非图形渲染的图像分析、视频转码、滤镜等。
- 金融建模:风险评估、高频交易计算。
GPGPU 的关键技术与框架:
为了让开发者能够方便地利用 GPU 进行通用计算,业界开发了专门的编程框架:
- CUDA:由 NVIDIA 公司开发并主导的 GPGPU 框架,是目前最流行、生态系统最成熟的 GPGPU 平台,只能在 NVIDIA 的 GPU 上运行。
- OpenCL:由 Khronos Group 维护的开放标准跨平台框架。理论上可以在支持 OpenCL 的任何 GPU(AMD, Intel, NVIDIA 等)、CPU 甚至其他加速器上运行,但实际性能和体验在不同厂商设备上有差异。
- HIP/ROCm:AMD 开发的平台,旨在提供类似 CUDA 的体验,主要在 AMD GPU 上运行。HIP 代码可以相对容易地移植到 CUDA。
- SYCL:一个基于现代 C++ 的开放标准,目标是在不同类型的处理器(CPU,GPU,FPGA 等)上实现单源异构编程。Intel 的 oneAPI 实现就基于 SYCL。
- DirectCompute:微软 DirectX API 的一部分,主要用于 Windows 平台上的 GPGPU 计算。
- Vulkan Compute:利用 Khronos Group 的 Vulkan 图形 API 的计算能力部分来进行通用计算。
GPGPU 的优势:
- 极高的并行计算吞吐量: 对于适合并行化的问题,速度可以比 CPU 快几十甚至上千倍。
- 高能效比: 在执行大规模并行计算任务时,通常比 CPU 集群更省电(单位功耗下的计算能力更高)。
- 高性价比: 相对于构建同等计算能力的 CPU 集群,成本可能更低。
GPGPU 的挑战:
- 编程复杂性: GPGPU 编程模型(如 CUDA, OpenCL)与传统 CPU 编程不同,需要理解并行架构、内存层次(显存 vs 内存)、数据传输开销等,学习曲线较陡。
- 数据传输瓶颈: 数据需要在 CPU 内存(主存)和 GPU 显存之间传输,这可能成为性能瓶颈。
- 适用性问题: 并非所有计算任务都适合 GPU。GPU 最适合那些可以被分解成大量独立或弱相关的小任务(高并行度)的问题。串行性强、分支复杂的任务在 GPU 上效率可能很低,甚至不如 CPU。
- 硬件依赖性: 特别是对于 CUDA,依赖于特定厂商(NVIDIA)的硬件。
总结:
GPGPU 是一项重要的技术,它解锁了 GPU 强大的并行处理能力,将其应用于图形渲染之外的广阔通用计算领域,尤其在人工智能、科学计算和大规模数据处理方面带来了革命性的性能提升。CUDA 和 OpenCL 等框架是实现 GPGPU 的关键工具。
国产GPGPU集体爆发!沐曦登陆科创板,龙芯也宣布了
电子发烧友网报道(文/莫婷婷)通用图形处理器(GPGPU)作为融合图形处理与通用并行计算能力的协处理器,已成为AI、大数据分析等高性能计算场景的核心基础设施。目前,全球 GPGPU 市场长期由英伟达
2025-12-17 07:19:00
国芯科技:已结束基于RISC-V架构GPGPU研发
的GPGPU内核研发工作,2024年7月公司已完成第一版RTL代码设计并对外公开发布。由于公司聚焦汽车电子芯片、服务器和云应用安全芯片、量子安全芯片以及AI MCU芯片的研发及设计,RISC-V GPGPU当前阶段的
2024-12-20 00:15:00
如何在FPGA上实现复数浮点的计算
高性能浮点处理一直与高性能 CPU 相关联。在过去几年中,GPU 也成为功能强大的浮点处理平台,超越了图形,称为 GPGPU(通用图形处理单元)。新创新是在苛刻的应用中实现基于 FPGA 的浮点处理
资料下载
名士流
2020-12-22 13:33:00
从图形到通用计算:GPGPU技术的进化之路
在当今的计算世界中,GPGPU(General-Purpose computing on Graphics Processing Units)已成为一种重要的技术概念。它与传统的图形处理单元(GPU
2023-12-01 12:55:22
CPU和GPGPU 未来的技术演变方向
GPGPU 未来的技术演变方向。随着 GPGPU 在大数据处理、人工智能、商业计算领 域的广泛应用,呈现了以下发展趋势。
2022-12-08 20:41:57
详解GPGPU与人工智能
cuBLAS,cuDNN, cuFFT, CUTLASS等运算库勉强算第四层,让用户可以通过调用NVIDIA针对自家GPGPU高度定制的算子库,不需要花费太多精力进行性能调优就可以发挥英伟达
2022-05-18 11:12:30
简述国产GPGPU的进阶之路
电子发烧友网报道(文/吴子鹏)2021年一月,上海天数智芯半导体有限公司(以下简称:天数智芯)宣布,公司旗舰7nm工艺GPGPU云端训练芯片BI成功点亮,这是国内第一款全自研、真正基于GPU架构下
2021-10-09 15:48:57
正视差距,国产GPGPU的进阶之路
2021年一月,上海天数智芯半导体有限公司(以下简称:天数智芯)宣布,公司旗舰7nm工艺GPGPU云端训练芯片BI成功点亮,这是国内第一款全自研、真正基于GPU架构下的7nm工艺GPGPU训练芯片
2021-09-28 09:03:38
国内GPGPU创业融资领域正呈现出前所未有的光景
以超算领域为例,2020年全球超算系统TOP500中,有七成采用GPGPU,在TOP25中,有20个采用GPGPU。而在数据中心领域,由于云服务器对AI的需求在应用过程中并非每时每刻,使用ASIC会造成空闲率较高,而
2021-04-01 11:12:50
国产芯突破,首款全自研7纳米GPGPU芯片成功“点亮”
近日,上海天数智芯半导体有限公司宣布,公司旗舰7纳米通用并行(GPGPU)云端计算芯片BI已于近日成功“点亮”。
2021-01-18 14:24:27
换一换
- 如何分清usb-c和type-c的区别
- 中国芯片现状怎样?芯片发展分析
- vga接口接线图及vga接口定义
- 芯片的工作原理是什么?
- 华为harmonyos是什么意思,看懂鸿蒙OS系统!
- 什么是蓝牙?它的主要作用是什么?
- ssd是什么意思
- 汽车电子包含哪些领域?
- TWS蓝牙耳机是什么意思?你真的了解吗
- 什么是单片机?有什么用?
- 升压电路图汇总解析
- plc的工作原理是什么?
- 再次免费公开一肖一吗
- 充电桩一般是如何收费的?有哪些收费标准?
- ADC是什么?高精度ADC是什么意思?
- dtmb信号覆盖城市查询
- EDA是什么?有什么作用?
- 苹果手机哪几个支持无线充电的?
- type-c四根线接法图解
- 华为芯片为什么受制于美国?
- 怎样挑选路由器?
- 元宇宙概念股龙头一览
- 锂电池和铅酸电池哪个好?
- 什么是场效应管?它的作用是什么?
- 如何进行编码器的正确接线?接线方法介绍
- 虚短与虚断的概念介绍及区别
- 晶振的作用是什么?
- 大疆无人机的价格贵吗?大约在什么价位?
- 苹果nfc功能怎么复制门禁卡
- amoled屏幕和oled区别
- 单片机和嵌入式的区别是什么
- 复位电路的原理及作用
- BLDC电机技术分析
- dsp是什么意思?有什么作用?
- 苹果无线充电器怎么使用?
- iphone13promax电池容量是多少毫安
- 芯片的组成材料有什么
- 特斯拉充电桩充电是如何收费的?收费标准是什么?
- 直流电机驱动电路及原理图
- 传感器常见类型有哪些?
- 自举电路图
- 通讯隔离作用
- 苹果笔记本macbookpro18款与19款区别
- 新斯的指纹芯片供哪些客户
- 伺服电机是如何进行工作的?它的原理是什么?
- 无人机价钱多少?为什么说无人机烧钱?
- 以太网VPN技术概述
- 手机nfc功能打开好还是关闭好
- 十大公认音质好的无线蓝牙耳机
- 元宇宙概念龙头股一览