RTX 4070 SUPER首发评测

描述

一、前言:性价比爆棚的GeForce RTX 40 SUPER系列显卡

新一代的Ada Lovelace架构带来了令人咋舌的能效比,RTX 40系列显卡在性能相同的情况下,功耗只有上代一半甚至更低,只是价格并不是那么亲民。

2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型号。

 

其中RTX 4070 SUPER以4899元的售价提供了接近于RTX 4070 Ti的性能;

而RTX 4070 Ti SUPER售价与RTX 4070 Ti同为6499元,但性能与9499元的RTX 4080相差无几;

至于RTX 4080 SUPER,它在规格大幅度提升的情况下,将售价降到了8099元,比起RTX 4080足足便宜了1400元。

新一代RTX 40系列SUPER GPU的到来,瞬间让NVIDIA显卡性价比爆棚!

CUDA

完整的AD104核心

RTX 4070 SUPER使用了与RTX 4070(Ti)相同的AD104核心。

完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代Tensor Core张量核心、60个第三代RT Core光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。

CUDA

AD104-350核心(RTX 4070 SUPER)

RTX 4070 SUPER做了部分精简,依然是5组GPC,只是将其中2组中的6个TPC减到了5个,也就是5组GPC、28个TPC、7168个流处理器、228个Tensor Core、56个RT Core、80个ROP单元、36MB二级缓存。

除了二级缓存之外,其他规格削减不到7%,而显存规格维持不变,可以想象,它的性能会非常接近RTX 4070 Ti。

RTX 4070 SUPER的详细规格参数如下:

CUDA

二、图赏:与RTX 4070长一样 6+3相供电电路

CUDA

包装盒和RTX 4070公版差不多,区别在于原来是白字,现在改成了黑色字体。

CUDA

开箱。

CUDA

附赠一条2x8Pin转16Pin的电源线。

CUDA

上面是RTX 4070 SUPER,下面是RTX 4070,长相也几乎一模一样,差别在于4070的金属条是银灰色,4070 SUPER是深黑色,而且还能反光。

CUDA

背面。

CUDA

依然是16Pin供电接口,不过功耗很低,完全不用担心烧化接口的情况。

CUDA

3个DP1.4和1个HDMI 2.1接口。

CUDA

没有用均热板,和RTX 4070一样,都是铜底+热管的散热设计。

CUDA

依旧是RTX 4070的PCB版,非常mini,改造成ITX版型也不难。

6+3相供电电路设计,虽然简单,但也足够应付220W的TGP。

CUDA

这是RTX 4070的PCB板,对比一下,二者区别在于RTX 4070多一个空焊位,也就是少一相供电。

CUDA

PCB板背面。

CUDA

RTX 4070 SUPER采用的是AD104-350核心,芯片面积295mm2,拥有358亿晶体管。

GPU旁边是6颗美光GDDR6X显存,单颗2GB,总容量12GB,等效频率21GHz,带宽504GB/s。

三、理论性能测试:3DMark运行频率可达2805MHz

测试平台如下:

CUDA

1、3DMark Fire Strike

CUDA

在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4070 SUPER图形分数达到了24185分,核心温度最高68℃,热点温度最高85℃,核心运行最高频率为2805MHz,最高风扇转速1397PM,整卡最高功耗222W。

CUDA

在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4070 SUPER图形分数达到了12112分,核心温度最高69℃,核心运行最高频率为2805MHz,最高风扇转速1397RPM,最高功耗222W。

CUDA

2、3DMark Time Spy

CUDA

在2K分辨率3DMark Time Spy测试中,RTX 4070 SUPER图形分数达到了20649分,核心温度最高753℃,核心运行最高频率为2790Hz,最高风扇转速2028RPM,最高功耗223W。

CUDA

在4K分辨率3DMark Time Spy Extreme测试中,RTX 4070 SUPER图形分数达到了9948分,核心温度最高74℃,核心运行最高频率为2790Hz,最高风扇转速13990RPM,最高功耗224W。

CUDA

四、1080P游戏性能测试:与RTX 3090 Ti旗鼓相当

1、刺客信条:英灵殿

CUDA

CUDA

2、地平线:零之曙光

CUDA

CUDA

3、孤岛惊魂5

CUDA

CUDA

4、孤岛惊魂6

CUDA

CUDA

5、古墓丽影:暗影

CUDA

CUDA

6、霍格沃茨之遗

 

CUDA

7、极限竞速:地平线5

CUDA

CUDA

8、赛博朋克2077

CUDA

CUDA

9、巫师3

 

CUDA

10、无主之地3

CUDA

CUDA

11、星空

CUDA

CUDA

12、战争机器5

CUDA

CUDA

测试结果汇总如下:

CUDA

在1080P分辨率下,RTX 4070 SUPER的性能与RTX 3090 Ti不相上下,差距仅有1%。比起RTX 4070强了13%,和RTX 4070 Ti相比就差了3%。

六、2K性能测试:强于RTX 3080 Ti

1、刺客信条:英灵殿

CUDA

CUDA

2、地平线:零之曙光

CUDA

CUDA

3、孤岛惊魂5

CUDA

CUDA

4、孤岛惊魂6

CUDA

CUDA

5、古墓丽影:暗影

CUDA

CUDA

6、霍格沃茨之遗

 

CUDA

7、极限竞速:地平线5

CUDA

CUDA

8、赛博朋克2077

CUDA

CUDA

9、巫师3

 

CUDA

10、无主之地3

CUDA

CUDA

11、星空

 

CUDA

12、战争机器5

CUDA

CUDA

测试数据汇总如下:

CUDA

2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti强2%,与RTX 4070相比,也有14%的优势,但是比RTX 4070 Ti则有5%的差距。

此外我们还测试了4K分辨率下的成绩,汇总如下:

CUDA

由于192Bit显存位宽的关系,RTX 4070 SUPER在4K分辨率下的性能会明年不如RTX 3080 Ti,但大多数游戏依旧能保持60FPS以上的帧率。

我们测试的12款3A大作,有3款帧率低于60FPS,但这几款游戏都支持DLSS 3,开启之后帧率会有翻倍提升。

六、Stable Diffusion体验:TensorRT加持 生图速度提升350%

2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能让具备Tensor单元的GeForce显卡在Stable Diffusion Web UI 中获得翻倍的性能。

本次我们将对比SDXL加速方法与PyTorch xFormers(常规加速方法)的性能差异。

CUDA

我们生成10张太空大战图像,分辨率1024*1024,使用PyTorch xFormers加速时,耗时9分17秒。

CUDA

使用SDXL加速之后,耗时仅为2分02秒,性能提升350%。

CUDA

从终端中也可以看到,RTX 4070 SUPER使用默认加速器时,生图速度只有1.1it/s,而在TensorRT加持下,生图速度猛然提升到了4.50it/s。

七、DLSS 3游戏测试之一:3款DLSS 3游戏

此次我们一共测试了6款游戏,包括3款支持DLSS 3的游戏:《3DMark》、《毁灭全人类》、《燕云十六声》。

另外还有3款同时支持DLSS与光追的游戏:《光明记忆》:《生死轮回》、《赛博朋克2077》。

所有DLSS 3以及光追测试都是在2K分辨率下进行。

1、DLSS3 测试--燕云十六声

燕云十六声》是一款开放世界中国风武侠动作游戏,画质精良,号称国产3A破阵制作。目前这款游戏还处于内测阶段。

CUDA

这款游戏于日前推送了对于DLSS 3支持的更新,下面我们来看看RTX 4070 SUPER SUPER的表现,测试分辨率为2560*1440,画质选项为“超高”。

 

默认超高画质下,游戏帧率为91FPS。

 

开启DLSS 2(性能模式)之后,帧率达到了146FPS,提升了60%。

 

打开DLSS 3(插帧)之后,帧率来到了198FPS,相比默认画质帧率提升了117%。

CUDA

2、3DMark

CUDA

DLSS 2模式下帧率为140FPS,比默认的65FPS提升了133%。

CUDA

DLSS 3的成绩为150FPS,相比默认提升了150%。

CUDA

3、毁灭全人类2:重新探测

 

最高画质下,RTX 4070 Ti的帧率为131FPS。

 

开启DLSS 3之后,帧率来到了242FPS,近乎翻倍。

CUDA

八、DLSS 3游戏测试之二:3款支持DLSS 3的光追游戏

1、光明记忆:无限

 

开启RTX时,游戏的帧率为109FPS。

 

开启DLSS 3之后,帧率提升到了235FPS,提升了116%。

CUDA

2、生死轮回

 

开启光追之后,游戏的帧率仅有65FPS。

 

打开DLSS 3之后,帧率提升到了195FPS,提升幅度为195%。

CUDA

3、赛博朋克2077

 

开启光追时,帧率为40FPS。

 

这是DLSS 3的画面,与原生画面的差距难以分辨,但是帧率提升到了155FPS。

CUDA

CUDA

九、功耗测试:2K游戏平均功耗仅为3080 Ti的62%

CUDA

将Furmark的参数设定为1920*1200分辨率、0AA。

运行13分钟之后,RTX 4070 SUPER的温度稳定在74度附近,功耗稳定在220W,烤机时GPU频率为1620MHz,CPU风扇转速只有2153RPM。

2)、真实游戏功耗测试

1、GTA V

 

这是1080P分辨率。RTX 4070 SUPER功耗126W,温度53度。

CUDA

2K分辨率下,RTX 4070 SUPER功耗164W。

2、绝地求生

CUDA

1080P分辨率下,RTX 4070 SUPER功耗203W,温度689度,运行频率2760MHz。

CUDA

2K分辨率下,RTX 4070 SUPER0功耗212W。

3、古墓丽影:暗影

CUDA

1080P分辨率下,RTX 4070 SUPER的功耗为207W。

CUDA

2K分辨率下,RTX 4070 SUPER功耗是212W,运行频率2745MHz,温度64度。

测试数据汇总如下:

CUDA

在1080P分辨率下,RTX 4070 SUPER在3A游戏中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,仅相当于RTX 3080 Ti的62%。

十、总结:堪称业界良心

本次测试小结如下:

1、AI性能

即使没有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion画图首选,而今在TensorRT加持下,RTX 4070 SUPER的生图速度在原有基础上提升了350%,这样的表现相信是不会再有任何竞争对手了。

2、1080P游戏性能

CUDA

我们所测的12款游戏,除了《星空》之外 ,剩余11款游戏RTX 4070 SUPER的帧率全部都超过了160FPS,就连显卡杀手《赛博朋克2077》也有169FPS。

就性能而言,1080P分辨率下,RTX 4070 SUPER几乎能与RTX 3090 Ti并驾齐驱,相比RTX 3080 Ti强了6%,比RTX 4070则强了13%,和4070 Ti的差距只有3%。

3、2K游戏性能

CUDA

2K分辨率下,同样是除了《星空》之外,RTX 4070 SUPER在其他11款游戏中都能保持120FPS以上的帧率。

在2K分辨率下,RTX 4070 SUPER依旧能比RTX 3080 Ti强2%,不过和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070则强了15%左右。

另外,我们也测试了4K,RTX 4070 SUPER在此分辨率下帧率会有较大损失,不过在绝大部分游戏中依旧能够跑出60FPS以上的帧率。

少数几款显卡杀手游戏虽然帧率只有50PFS左右,但好在这些游戏都支持DLSS 3,开启之后帧率甚至能突破100FPS。

4、功耗

CUDA

我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。

2K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗是207W,RTX 3080 Ti则是332W。

4K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗为214W,RTX 3080 Ti则已经跑到了350W的TGP上限。

5、DLSS 3和光追

目前能玩的DLSS 3游戏多达数十款,我们测试了6款。

在开启DLSS 2之后,游戏帧率平均提升幅度为107%。打开DLSS 3,游戏帧率平均提升幅度达到了159%。

 

如今的NVIDIA GPU早已不是单纯的游戏显卡,特别是在AI应用方面,有了SDXL,能将Stable Diffusion生图速度提升4倍左右,让原本已经大幅度领先对手的N卡彻底无敌。

至于价格,4899元就能买到一块1080P性能堪比RTX 3090 Ti、2K性能强于RTX 3080 Ti的显卡,同时游戏功耗仅有200W左右,堪称业界良心。

RTX 4070 SUPER只是开始,接下来的RTX 4070 Ti SUPER和RTX 4080 SUPER将会带来更多的惊喜。

NVIDIA GeForce RTX 40 SIUPER系列现已上市,请到京东DIY SUPER超能年货节上选购GeForce RTX 4070 SUPER/4080 SUPER 公版和合作伙伴显卡。







审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分