NVIDIA RTX 4070详细评测

处理器/DSP

891人已加入

描述

一、前言:比想象中性能更强的RTX 4070显卡

GeForce RTX 4070解禁发布之前,不少人对它有点迷惑。

首先,它的CUDA核心(流处理器)与上代RTX 3070完全相同,都是5888个。另外一点就是它的显存位宽只有192Bit,RTX 3070则是256Bit。

有鉴于此,很多玩家预测RTX 4070的性能不会比RTX 3070强多少,大概也就是RTX 3070 Ti的水准。

RTX 4070真的如此不堪吗?当然不是!

RTX 4070使用了与RTX 4070 Ti相同的AD104核心,完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代Tensor Core张量核心、60个第三代RT Core光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。

流处理器

完整的AD104核心

流处理器

AD104-250核心(RTX 4070)

RTX 4070做了部分精简,拥有4组GPC共5888个流处理器、184个Tensor Core、46个RT Core和5888个流处理器单元、64个ROP单元、36MB二级缓存。

这其中很多参数与RTX 3070相同,比如流处理器、Tensor Core、RT Core,2款显卡一模一样,而ROP单元数量和显存位宽甚至还不如RTX 3070。

不过不要忘了,RTX 4070采用的是第四代Tensor Core和第三代RT Core,相比RTX 3070都领先了一代。

另外在台积电4N制程工艺加持下,RTX 4070的加速频率高达2475MHz,实际游戏频率更是高达2800MHz,相比RTX 3070提升了接近50%。

如此巨大的频率自然也会带来更强的游戏性能。

流处理器

AD104的晶体管数量2倍于GA104,而流处理器数量却并没有翻倍,这是因为大量的晶体管用在了二级缓存上。

RTX 4070二级缓存容量高达36MB,9倍于RTX 3070,更大容量的二级缓存可以降低GPU对于显存带宽的需求。

另外,虽然显存位宽只有192Bit,但是由于采用了频率高达21Gbps的GDDR6x显存,位宽达到了504GB/s,而256Bit的RTX 3070位宽只有448GB/s。

更大容量的二级缓存再加上更高的显存带宽,RTX 4070的性能到底会比RTX 3070强多少呢?

二、图赏:可以看作是迷你版的RTX 4090


 

和巨大的包装盒比起来,RTX 4070显得十分小巧。

流处理器

送来一条2x8Pin转16Pin的电源线,RTX 4080是3x8Pin、RTX 4090上是4×8Pin。

流处理器

看起来就像是RTX 4080的缩小版。

流处理器

背面。

流处理器

依然是16Pin供电接口,不过功耗很低,完全不可能出现烧化接口的情况。

流处理器

3个DP1.4和1个HDMI 2.1接口。

流处理器

拆掉外框。

流处理器

铜底+热管的散热设计。

流处理器

非常mini的PCB板,改造成ITX版型也不难。

5+3相供电电路设计,虽然简单,但也足够应付200W的TGP。

流处理器

背面空空如也。

流处理器

RTX 4070采用的是AD104核心,芯片面积295mm2,拥有358亿晶体管。

GPU旁边是6颗美光GDDR6X显存,单颗2GB,总容量12GB,等效频率21GHz,带宽504GB/s。

流处理器

流处理器

流处理器

RTX 4070就是迷你版的RTX 4090/4080。

三、理论性能测试:3DMark运行频率可达2800MHz

测试平台如下:

流处理器

1、3DMark Time Spy

流处理器

在2K分辨率3DMark Time Spy测试中,RTX 4070图形分数达到了17924分,核心温度最高68℃,热点温度最高86℃,核心运行最高频率为2820MHz,最高风扇转速1709PM,最高功耗173W。

流处理器

在4K分辨率3DMark Time Spy Extreme测试中,RTX 4070图形分数达到了8587分,核心温度最高69℃,核心运行最高频率为2805MHz,最高风扇转速1700RPM,最高功耗173W。

流处理器

2、3DMark Fire Strike

流处理器

在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4070图形分数达到了21351分,核心温度最高63℃,核心运行最高频率为2835Hz,最高风扇转速1409RPM,最高功耗169W。

流处理器

在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4070图形分数达到了10095分,核心温度最高64℃,核心运行最高频率为2835Hz,最高风扇转速1410RPM,最高功耗168W。

流处理器

四、1080P与2K游戏测试:都比RTX 3080强

1、刺客信条:英灵殿

流处理器

流处理器

2、德军总部:新血脉

流处理器

流处理器

3、地平线:零之曙光

流处理器

流处理器

4、孤岛惊魂5

流处理器

流处理器

5、孤岛惊魂6

流处理器

流处理器

6、古墓丽影:暗影

流处理器

流处理器

7、极限竞速:地平线5

流处理器

流处理器

8、赛博朋克2077

流处理器

流处理器

9、巫师3

流处理器

流处理器

10、无主之地3

流处理器

流处理器

11、战争机器5

流处理器

流处理器

1080P分辨率测试数据汇总如下:

流处理器

2K分辨率测试数据汇总如下:

流处理器

1080P分辨率下,RTX 4070要比RTX 3080强了5%,到了2K分辨率下仍有1%的性能优势。

和RTX 3070相比,在2K分辨率侠下RTX 4070都能领先30%左右。

至于RTX 2070 Super,RTX 4070要比它强68%。

五、4K游戏测试:稍弱于RTX 3080

1、刺客信条:英灵殿

流处理器

流处理器

2、德军总部:新血脉

流处理器

流处理器

3、地平线:零之曙光

流处理器

流处理器

4、孤岛惊魂5

流处理器

流处理器

5、孤岛惊魂6

流处理器

流处理器

6、古墓丽影:暗影

流处理器

流处理器

7、极限竞速:地平线5

流处理器

流处理器

8、赛博朋克2077

流处理器

流处理器

9、巫师3

流处理器

10、无主之地3

流处理器

流处理器

11、战争机器5

流处理器

流处理器

测试数据汇总如下:

流处理器

4K分辨率下,RTX 4070相比RTX 3070 Ti的领先优势降到了13%,比起RTX 3070快了25%,但被RTX 3080反超,落后后者5%。

六、DLSS 3游戏测试之一: 3款无光追DLSS 3游戏

此次我们一共测试了8款游戏,包括4款支持DLSS 3但无光追的:《3DMark》、《超级突破》、《毁灭全人类》。

另外还有4款同时支持DLSS与光追的游戏:《暗影火炬城》、《光明记忆》:《无限、生死轮回》、《赛博朋克2077》。

所有DLSS 3以及光追测试都是在2K分辨率下进行。

1、3DMark

流处理器

DLSS 2模式下帧率为121FPS,比默认的65FPS提升了133%。

流处理器

DLSS 3的成绩为132FPS,相比默认提升了156%。

流处理器

2、超级人类

这是默认最高画质,RTX 4070的帧率为158FPS。

DLSS 3的画质与原生画质相比有那么一点差别,不过不仔细看到话,很难发现差异。

流处理器

3、毁灭全人类2:重新探测

最高画质下,RTX 4070的帧率为114FPS。

开启DLSS 3之后,帧率来到了222FPS,近乎翻倍。

流处理器

七、DLSS 3游戏测试之二:4款支持DLSS 3的光追游戏

1、暗影火炬城

开启光追时,帧率为127FPS。

流处理器

2、光明记忆:无限

开启RTX时,游戏的帧率为105FPS。

开启DLSS 3之后,帧率提升到了225FPS,提升了114%。

流处理器

3、生死轮回

开启光追之后,游戏的帧率仅有56FPS。

打开DLSS 3之后,帧率提升到了180FPS,提升幅度搞到221%。

流处理器

4、赛博朋克2077

开启光追之后,游戏的帧率仅有38FPS。

打开DLSS 3之后,帧率提升到了136FPS。

流处理器

测试数据汇总如下:

流处理器

八、功耗测试:烤机仅67度、能效比二倍于RTX 3070 Ti

1)、烤机测试

使用Furmark来对RTX 4070进行烤机测试,测试是室温为28度。

流处理器

将Furmark的参数设定为1920*1200分辨率、0AA。

运行14分钟之后,RTX 4080的温度稳定在67度附近,功耗稳定在196W,烤机时GPU频率为2460MHz,CPU风扇转速只有1794RPM,基本上听不到风扇的噪音。

2)、真实游戏功耗测试

1、GTA V

流处理器

1080P分辨率下,RTX 4070的功耗为117W,而RTX 3070 Ti则高达202W。

流处理器

2K分辨率下,RTX 4070功耗是165W,运行频率2805MHz,温度56度。

RTX 3070 Ti的功耗为262W,运行频率1905MHz,温度73度。

2、绝地求生

流处理器

这是1080P分辨率。

左边是RTX 4070,功耗186W,温度65度。

右边是RTX 3070 Ti,功耗285W,温度80度。

流处理器

2K分辨率下,RTX 4070功耗190W,RTX 370 Ti功耗是288W。

3、古墓丽影:暗影

流处理器

1080P分辨率下,RTX 4070功耗183W,温度59度,运行频率2805MHz。

流处理器

2K分辨率下,RTX 4070功耗188W,RTX 3070 Ti则是282W。

测试数据汇总如下:

流处理器

在1080P分辨率下,RTX 4070在3A游戏中的平均功耗只有171W,2K分辨率也只有186W;就算是到了4K分辨率,平均功耗也不到190W,这个功耗不到RTX 3070 Ti的2/3。

虽然RTX 4070的TGP是200W,但实际上基本上没有游戏可以跑到这个数字。相比之下,RTX 3070 Ti可以轻松跑满290W的TGP。

九、Stable Diffusion与RTX VSR体验

1、Stable Diffusion出图速度测试

如今已是AI时代,ChatGPT是最火的聊天机器人,而当前最火的AI作图工具则是Stable Diffusion,只需要输入一句话、或者特定的关键词,就能生成一幅你想要的图像。

只不过Stable Diffusion也是有要求的,你需要一张显存容量6GB以上的NVIDIA显卡。

下面我们来看看RTX 4070的出图速度。

流处理器

生成图像宽度864、高度1264,采样迭代步数70。

实测RTX 4070出图耗时82秒,显存占用5GB,功耗168W。

流处理器

RTX 2070 Super耗时122秒,功耗210W。

流处理器

RTX 3070 Ti耗时86秒,GPU功耗277W,温度76度。

流处理器

RTX 3070出图耗时95秒,GPU功耗210W。

小结:4张显卡中,RTX 4070不仅出图速度最快,功耗也是最低的,比RTX 3070 Ti低了110W。

另外我们这里只是出一张图,如果是大量出图,从中筛选优质图片,耗时会更久,这个时候高端显卡可以节约大量时间。

2、RTX VSR效果体验

其实很早之前就有AI图片画质增强工具,但是视频超分辨率技术一直是空白,主要是处理视频需要极高的算力。近期NVIDIA上线了RTX VSR 视频超分辨率技术,可以利用Tenser Core张量核心硬件单元,智能锐化和强化特征和边缘,同时消除恼人的压缩伪影。

流处理器

想使用RTX VSR 视频超分辨率技术,只需要下载最新版本的GeForce显卡驱动和Chrome浏览器即可。

驱动安装完成之后,在NVIDIA控制面板中会出现RTX 视频增强选项,一共有4档可供选择,1档画质最低,4档画质最好。

左边是360P分辨率视频,右边是RTX VSR 4x画面,可以增强后的画面已经达到了1080P的画质水准,线条更加清晰、背景也纯净了很多。

就算是1080P视频,经过RTX VSR 4x增强后,画面中的噪点、锯齿都减轻了很多,细节更为丰富。

十一、总结:不仅仅只是一款游戏显卡

2022年12月上市的AMD次旗舰RX 7900 XT,其性能能媲美RTX 4080,价格仅售7499元,比对手足足便宜了2000元。

然而4个月过去了,如今许多非公RX 7900 XT已经降到了6000元以下,比RTX 4070 Ti还便宜不少,但依旧无人问津,真是让人唏嘘不已。

原因很简单,显卡只是单纯的游戏性能强是远远不够的,能效比、生产力、光线追踪等等这些综合起来,重要性上远远超过GPU的传统游戏性能。在这些方面,AMD显卡落后的已不是一点半点。

就拿目前大受欢迎的AI作图工具Stable Diffusion来说,A卡直接就无法识别……

以下是本次测试小结:

1、性能

RTX 4070最适合1080P和2K分辨率。我们测试了11款游戏,在2K分辨率下,除了《赛博朋克2077》“只有”92帧之后,其他10款游戏的帧率都超过了100FPS,平均帧率比RTX 3080还要强1%。

如果和RTX 3070 Ti相比,RTX 4070在1080P和2K分辨率下的优势接近20%,和RTX 3070相比,领先优势则接近30%。

我们也测试了图灵时代的RTX 2070 Super,这款显卡已经根本上时代,RTX 4070比它快了近70%。

2、功耗

RTX 4070的TGP为200W,不过根据我们的测试,这块显卡在游戏中的功耗实际上是很难触及到200W的。

流处理器

我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下RTX 4070的平均功耗是171W,而RTX 3070 Ti是264W,RTX 3080则是300W。

2K分辨率下,RTX 4070在6款游戏中的平均功耗是186W,RTX 3070 Ti和RTX 3080则分别是279W、313W。

4K分辨率下,RTX 4070在6款游戏中的平均功耗为188W,RTX 3070 Ti是286W,而RTX 3080已经跑到了320W的TGP上限。

三款显卡中,RTX 4070在1080P和2K分辨率下的性能最强,但功耗还不到3080的60%。

3、DLSS 3和光追

目前能玩的DLSS 3游戏多达数十款,我们测试了7款。

在开启DLSS 2之后,游戏帧率提升幅度为95%。打开DLSS 3,游戏帧率提升幅度达到了136%。

而与RTX 3070 Ti相比,RTX 4070在开启DLSS 3之后领先前者超过50%。

流处理器

4、附加价值

此次我们还体验了Stable Diffusion与RTX VSR技术。

和RTX 3070 Ti相比,RTX 4070在Stable Diffusion中的出图速度不仅更快,同时功耗也低了110W。如果要生成大量图片,RTX 4070仅仅160W的功耗对于机箱内部的散热也不会造成太大影响。

至于RTX VSR,这是一个实打实的视频画质增强技术,实测360P视频通过RTX VSR 4x增强,最终画面效果甚至可以媲美1080P视频。1080P视频经过增强后,画面观感与4K分辨率已相差无几。

但是笔者感觉RTX VSR技术其实用在大屏电视上效果更好,如今86寸甚至100寸电视已经开始普及,这么大的屏幕,如果视频分辨率1080P,锯齿感会非常明显。

5、价格

NVIDIA GeForce RTX 4070建议零售价4799元起,此次NVIDIA备足了库存,首批商家的非公版将会有一半以上以建议零售价进行销售,甚至第三方渠道首发特惠低于4799元的也会有一些。

也许这会是第一块大家都买得起的RTX 40系显卡!

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分