越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么 RTX PRO 2000 是很好的选择。
今天我们带来全新 NVIDIA RTX PRO 2000 Blackwell 的测试,对比上一代产品 NVIDIA RTX 2000 Ada Generation 具体有哪些提升。
测试环境

软件测试列表

显卡规格

软件测试结果及分析
1. 计算性能:CUDA-Z
CUDA-Z 和 CPU-Z、GPU-Z 相类似,能直观地展现 GPU 显卡的一些性能信息。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
2025 丽台(上海)信息科技有限公司
本文所有测试结果均由丽台科技实测得出,如果您有任何疑问或需要使用此测试结果,请联系丽台科技(下同)
单精度浮点运算性能是显卡一项重要的指标,很多计算都是使用单精度完成的。从测试结果来看,RTX PRO 2000 Blackwell 的单精度和 32 位整数计算能力是 RTX 2000 Ada 的 1.78 倍,RTX PRO 2000 的双精度性能是 RTX 2000 Ada 的 1.61 倍,RTX PRO 2000 的 64 位整数计算能力是 RTX 2000 Ada 的 1.48 倍,RTX PRO 2000 的 24 位整数计算能力是 RTX 2000 Ada 的 1.67 倍。
2. 图形性能:SPECviewperf 15
SPECviewperf 15 主要是用来评测显卡专业图形性能的软件,其中包括了我们常见的 3ds Max、Maya、Catia、SolidWorks、Creo、Blender、Enscape、Unreal_engine 软件性能测试,以及医疗和能量仿真性能测试。通过模拟对软件场景的交互操作的速度来评分,最终得出显卡的图形性能的相对性能。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
从 SPECviewperf 15 的测试结果看,RTX PRO 2000 和 RTX 2000 Ada 的图形交互性能在 Unreal_engine、Medical、Maya、3ds Max 的测试中均有 1.4 倍左右的提升。RTX PRO 2000 在 Solidworks、Creo、Catia、blender 的测试中是 RTX 2000 Ada 的 1.5 倍左右,RTX PRO 2000 在 Energy 的测试中是 RTX 2000 Ada 的 1.72 倍,RTX PRO 2000 在 Enscape 的测试中是 RTX 2000 Ada 的 2.33 倍,图形性能普遍提升。
3. 实时渲染性能
3.1 FurMark
FurMark 是 GPU 测试中常用工具,可以做 OpenGL 性能测试,主要用于评估 GPU 性能级稳定性测试。本次测试 OpenGL 的 4K 实时渲染图形性能,以及室温下 GPU 散热表现。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
从 FurMark 的实时渲染测试结果中可以看出, RTX PRO 2000 的 OpenGL 4K 性能是 RTX 2000 Ada 的 1.46 倍。通过长时间烤机(稳定性测试),RTX PRO 2000 的温度控制在 76 度以下。这个温度是在显卡满载运行的情况下测得的,反映了 RTX PRO 2000 在高负载下的散热能力。
3.2 3DMark
3DMark 主要是测试基于大型 3D 场景图形性能的软件,此次测试我们找了两个相对较大的场景进行测试,并测试了 DXR 和 Vulkan 的性能,使用 Port Royal 测试光追的性能。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
从 3DMark Steel Nomad 的测试结果看,基于 DX 和 Vulkan 的性能测试,RTX PRO 2000 的性能是 RTX 2000 Ada 的 1.4 倍。在 Port Royal 光追性能测试中 RTX PRO 2000 是 RTX 2000 Ada 的 1.5 倍。RTX PRO 2000 的渲染性能和光追性能都有了很大的提高。
3.3 NVIDIA Omniverse 工作流实时渲染
NVIDIA Omniverse 是一个包含 API、SDK 和服务的平台,使开发者能够将 OpenUSD、NVIDIA RTX 渲染技术和生成式物理 AI 集成到工业和机器人用例的现有软件工具和仿真工作流中。可以支持多人同时在线进行 3D 立体场景的协同搭建,支持丰富的 DCC 生态融合,可以支持光线追踪极具真实感的实时渲染。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
在 Omniverse 实时渲染中,分别测试了开启 NVIDIA DLSS 和关闭 DLSS 进行测试。针对相同场景的 4K 实时渲染,在启用 DLSS 时 RTX PRO 2000 的性能是 RTX 2000 Ada 的 5.6 倍性能,在不启用 DLSS 时,RTX PRO 2000 的性能是 RTX 2000 Ada 的 3.2 倍。由于 RTX PRO 2000 具备第 5 代的 Tensor Core,并且支持最新一代的 NVIDIA DLSS 4,因此在开启 DLSS 功能后增帧效果显著。
4. 离线渲染性能
渲染在媒体娱乐、设计制造以及建筑行业被广泛的应用,目前很多渲染器均支持 GPU 渲染,而 GPU 渲染的速度就取决于显卡的计算速度。
4.1 V-Ray Benchmark
V-Ray Benchmark 是一款免费的独立渲染速度测试软件,用于测试您计算机的渲染速度。它可以简单快速的测试两种渲染引擎:
> V-Ray GPU CUDA — GPU 渲染模式测试
> V-Ray GPU RTX — RTX GPU 渲染模式测试
本次测试不同 GPU 在不同 V-Ray 5 渲染引擎下的离线渲染性能,并记录最终得分。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
在使用 CUDA 和 RTX 渲染测试中,RTX PRO 2000 的性能都是 RTX 2000 Ada 的 1.42 倍。
4.2 Blender Benchmark
在 Blender Benchmark 中分别使用 3 个场景 monster、junkshop、classroom 进行渲染性能的测试。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
其中在 monster 场景的测试中,RTX PRO 2000 是 RTX 2000 Ada 的 1.22 倍。在 junkshop 的测试中 RTX PRO 2000 是 RTX 2000 Ada 的 1.23 倍。在 classroom 的测试中 RTX PRO 2000 是 RTX 2000 Ada 的 1.17 倍。
5. AI 性能测试
Procyon 推出了面向专业用户的基准测试。Procyon 是 UL 专为工业、企业、政府、零售和媒体领域的专业用户打造的全新基准测试套件。每个 Procyon 基准测试都采用通用的设计和功能集,提供熟悉且一致的体验。灵活的许可机制意味着您可以根据自身需求选择最合适的基准测试。
随着更多测试即将推出,Procyon 基准测试套件将很快为专业用户提供一系列基准测试和性能测试。每个基准测试都针对特定用例而设计,并尽可能使用真实的应用程序。
5.1 AI Compute Video benchmark
在此项测试中,我们选择 NVIDIA TensorRT 来进行测试 NVIDIA GPU 的推理性能,使用精度 Float16 进行推理计算,推理速度越快,得分越高。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
针对 AI 视频计算在 TensorRT Float16 位精度的测试中,RTX PRO 2000 是 RTX 2000 Ada 的 1.30 倍。
5.2 AI Text Generation Benchmark
在此项测试中,软件分别使用 4 个模型进行测试,分别基于 Llama 2、Llama 3.1、Mistral 7B、Phi 3.5 四个大模型进行推理生成,通过推理速度相对应的时间来对比 GPU 的性能。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
从上图测试的结果来看,在 Llama 2 测试中 RTX PRO 2000 是 RTX 2000 Ada 的 1.40 倍。在 Llama 3.1 测试中 RTX PRO 2000 是 RTX 2000 Ada 的 1.34 倍。在 Mistral 7B 测试中 RTX PRO 2000 是 RTX 2000 Ada 的 1.38 倍。在 Phi 3.5 测试中 RTX PRO 2000 是 RTX 2000 Ada 的 1.31 倍。
5.3 AI Image Generation Benchmark
本项测试 Procyon 将调用 Stable Diffusion XL 进行测试,分别使用 FP16、W8A16 以及 XL 版本 FP16 进行推测试,来测试 GPU 的图像生成性能。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
从上图测试的结果来看,使用 Stable Diffusion 1.5 Light 进行测试时,RTX PRO 2000 是 RTX 2000 Ada 的 1.35 倍。使用 Stable Diffusion 1.5 FP16 精度进行测试时,RTX PRO 2000 是 RTX 2000 Ada 的 1.53 倍。在 SDXL 中使用 FP16 精度测试,RTX PRO 2000 是 RTX 2000 Ada 的 1.51 倍。
5.4 Flux.1 AI Image Generation
使用 Flux.1 量化 FP4 的模型,对比上一代产品使用 FP8 精度的生成速度。

▲ RTX PRO 2000 Blackwell 测试结果截图

▲ 测试结果图表
由于 Blackwell 架构的 Tensor Core 可以支持 FP4 精度的推理,所以在很多 AIGC 的应用领域中,在不影响生成质量的情况下可以使用 FP4 来进行加速生成。而上一代 Ada Lovelace 架构的产品仅支持 FP8,在这种情况下,在相同的任务下使用 RTX PRO 2000 的性能是 RTX 2000 Ada 的 6.14 倍。
总结
NVIDIA RTX PRO 2000 Blackwell GPU 采用节能高效的紧凑外观规格,可提供卓越的性能。测试结果表明,其综合性能较前代产品 RTX 2000 Ada 有大幅提升。
CUDA 核心数相较上一代产品增加了 54%,因此在诸多应用场景下性能都有了很大的提高。
在 AI 性能方面,第 5 代 Tensor Core 增加了对 FP4 精度的支持,并结合 GDDR7 显存,可加速 AI 增强型工作流,所以这个功能未来会在 AI 推理上会有很大的应用,对应的推理性能也会有很大提升。原本使用 FP16 或者 FP8 的推理的场景,也有了 30%~50% 的提升。
在 DLSS 的应用上,可以支持最新的帧生成技术,从 Omniverse 的测试中可以看出,对实时渲染的帧数确实有很大的提升作用。
在专业 CAD 和 DCC 的交互性能提升幅度巨大,可以适配小机箱,支持更多的工业制图、DCC 内容生产的更大应用场景。
在离线渲染方面也有了 20%~40% 的性能提升,渲染出图或者视频的性能会更快。
综上所述,在半高专业图形卡中,NVIDIA RTX PRO 2000 凭借其紧凑的外型及出众的性能,在新技术的加持下,为小机箱用户提供了更好的选择。此外 RTX PRO 2000 带有全高档片,也可适配于 4U 全高机箱,结构紧凑,性能强大。
全部0条评论
快来发表一下你的评论吧 !