什么是NVIDIA DLSS？NVIDIA DLSS的发展过程

丽台科技 2023-12-21 11223

描述

本文将要介绍的一项黑科技叫做 NVIDIA DLSS，它始于 3D 游戏，又被广大游戏玩家戏称为“大力水手”。如今它已更新发展到了 DLSS 3.5，并已登陆包括 NVIDIA Omniverse、D5、Chaos Vantage 在内的专业 GPU 渲染器，开始进军专业图形领域。

那么，这个 NVIDIA DLSS 究竟有何神奇之处？其“大力”又何以体现？

1►

什么是 NVIDIA DLSS？

NVIDIA DLSS，全称叫做 Deep Learning Super Sampling（深度学习超级采样）。由 NVIDIA RTX GPU 上的专用 AI 处理器（即 Tensor Core）提供支持，是一个经过改进的全新深度学习神经网络，能够在提高帧数的同时生成精美、清晰的实时渲染图像。

用最简单的话来说，DLSS 就像大力水手一般，靠吃 AI 算法这颗“菠菜”开挂，“脑补”出实时渲染中缺失的像素，从而提升实时渲染的帧数。开启 DLSS 之后，GPU 只需要先输出一个或多个低分辨率的画面，DLSS 就能调用 GPU 的 Tensor Core 进行 AI 运算，“脑补”出高分辨率画面并输出，以达到高分辨率下提升实时渲染帧数的效果。

展开来说 NVIDIA DLSS 深度学习超级采样这项技术的话，在 3D 游戏中，渲染的帧并非直接显示，而是先对其执行后期处理图像增强步骤。在此步骤中，将来自多个渲染帧的输入组合在一起，以在保留细节的同时，消除诸如锯齿等视觉失真现象。例如，时域抗锯齿 (TAA) 是目前最常用的图像增强算法之一，这是一种基于着色器的算法，使用运动矢量组合两帧，以确定在何处对前一帧进行采样。然而，这种图像增强过程从根本上来说很难正确实行。而这类没有清晰算法解决方案的图像分析和优化问题可通过应用 AI 来完美解决。为解决这一难题而开发的深度神经网络 (DNN) 模型被称为深度学习超级采样 (DLSS)。

DLSS 针对一组给定输入样本所产生的输出质量要比 TAA 高得多，虽然 TAA 以最终目标分辨率渲染，然后组合帧，而 DLSS 通过消除细节，能够以更低的输入样本数更快地渲染，这意味着以目标分辨率得到的结果与 TAA 结果的质量不相上下，但是只需执行大约一半的着色工作。在 DLSS 的训练过程中，DLSS 将有机会学习如何根据大量超高质量的示例生成所需的输出。为了训练网络，需要收集成千上万的“真值”参考图像，这些图像均采用黄金标准方法渲染，具有出色的图像质量，即 64 倍超级采样。

64 倍超级采样 (64xSS) 是指我们在像素内以 64 个不同的偏移量进行着色，然后将输出组合在一起，生成具有理想细节并抗锯齿的优质图像，而不是对每个像素进行一次着色处理。同时还会捕捉与之相匹配的正常渲染的原始输入图像。接下来，开始训练 DLSS 网络来匹配 64xSS 输出帧，通过遍历每个输入，要求 DLSS 产生一个输出，测量其输出与 64xSS 目标之间的差值，并根据差值调节网络中的权重，这个过程称为反向传播。经过多次迭代后，DLSS 可以自行学习生成接近 64xSS 质量的图像，同时还避免出现影响 TAA 等传统方法的模糊、不清晰和透明问题。

总之，DLSS 是利用深度神经网络来提取所渲染场景的多维特征，并通过智能地组合多帧中的细节来构造高质量的最终图像，画质与传统渲染方式相差无几，但性能更高。

而利用专用的 Tensor Core 的 AI 渲染技术，可提供令人惊叹的强大性能，不仅能提升帧率，还能提供足够的性能优化空间，从而以较低的消耗增强了图形显示性能，提高了分辨率，甚至可以将分辨率提升至 8K。

2►

NVIDIA DLSS 的发展过程

▲ DLSS 各版本特性对比

目前，NVIDIA DLSS 已更新迭代到 DLSS 3.5 版本。下面就一起梳理下 DLSS 发展史中几次重大的更新。

DLSS 1

2018 年 8 月，随着 NVIDIA RTX 20 系列显卡的正式发布，NVIDIA DLSS 技术首次问世，并引入到了 NVIDIA Turing 架构的 GPU 显卡。NVIDIA 推出 NVIDIA DLSS 的初衷，是利用基于 AI 的超高分辨率技术重新定义实时渲染，在减少像素渲染的基础上，使用 AI 构建更清晰、更高分辨率的图像。

DLSS 2

2020 年 3 月，NVIDIA 发布了 NVIDIA DLSS 2， DLSS 也成为了 NVIDIA RTX 显卡的一项独立功能。

DLSS 2 也是由 RTX GPU 上的专用 AI 处理器 Tensor Core 提供支持，是一个经过改进的全新深度学习神经网络，能够提高帧速率，同时生成精美、清晰的实时渲染图像。DLSS 2 为实时渲染提供了充足的性能，有助于在开启光线追踪的效果下，提高输出的高分辨率帧数。

DLSS 2 在原始版本的基础上进行了以下增强：

出色的图像质量：DLSS 2 可在仅渲染四分之一到半数像素的前提下，提供与原始分辨率相媲美的画质。其采用全新时间反馈技术，能够实现更清晰的图像细节，同时提高帧与帧之间的稳定性。

在不同 RTX 显卡和分辨率上均具有出色的扩展性：全新 AI 网络能够更高效地使用 Tensor Cores，执行速度比原始版本快一倍。这不仅有助于提高帧率，还可消除以前显卡、设置和分辨率上的限制。

一个适用于所有游戏的网络：原始 DLSS 需要针对每个新游戏训练 AI 网络。DLSS 2 则使用非特定于某一游戏的内容开展训练，从而能够提供一个跨游戏使用的通用网络。这意味着游戏集成更快，最终将能支持更多 DLSS 游戏。

自定义化选项：DLSS 2 为用户提供“质量”(Quality)、“平衡”(Balanced) 和“性能”(Performance) 这 3 种画质模式来控制游戏的内部渲染分辨率；启用“性能”(Performance) 模式后，可实现高达 4 倍的超高分辨率（即从 1080p 到 4K）。这意味着用户选择更丰富，性能提升更显著。

DLSS 3

2022 年 10 月，NVIDIA 再次突破性地推出了 DLSS 3，开启了新的帧生成 (Frame Generation) 功能。

DLSS 3 以 DLSS 2 超分辨率技术为基础，结合使用光学多帧生成技术来生成全新帧，并运用 NVIDIA Reflex 低延迟技术来优化响应速度。DLSS 3 由基于 NVIDIA Ada Lovelace 架构的全新第四代 Tensor Core 和光流加速器 (Optical Flow Acceleration) 提供支持。

启用 DLSS 3 后，AI 会使用 DLSS 超分辨率技术重建第一帧的四分之三，并使用 DLSS 帧生成技术重建完整的第二帧。综合来看，DLSS 3 会重建所有显示帧的八分之七，使性能显著提升！

DLSS 3.5

2023 年 8 月，NVIDIA 发布了 DLSS 3.5。在继承了深度学习超采样 (DLSS)、深度学习抗锯齿 (DLAA) 以及随着 DLSS 3 上线的帧生成 (Frame Generation) 技术之外，DLSS 3.5 还引入了针对性改善实时光线追踪视觉表现的新特性：光线重建 (Ray Reconstruction) 技术。

DLSS 光线重建技术，这也是进阶版 AI 驱动的神经渲染器的一部分，通过将需要人工设计的降噪器替换为 NVIDIA 超级计算机训练的 AI 网络（在采样光线之间生成更高质量的像素），从而提升 RTX GPU 的光线追踪图像质量。

该功能可改善光线反射、全局光照和阴影等光线效果，打造更加身临其境、真实可感的实时渲染体验；同时，它还能对光线追踪计算机图形进行降噪，通过填补缺失的像素来更高效地合成最终图像。与 DLSS 3 相比，NVIDIA DLSS 3.5 的训练数据量增加了 5 倍，因此它能识别不同的光线追踪效果，并在何时使用时域累积和空间差值数据方面做出更明智的决策。

DLSS 3.5 还能提高实时 3D 创作应用的图像质量，并让专业 3D 创作者无需花费数分钟或数小时进行最终渲染，就能立即展示更优质的图像。

那么，大力水手 DLSS 的实时渲染实战表现究竟如何?持续关注，下期内容带您观战、为您解密！

审核编辑：黄飞

打开APP阅读更多精彩内容