利用NVIDIA RTXMU改进游戏显存分配

描述

  实时光线追踪提升了电子游戏中的光照艺术效果,但该过程需要消耗大量算力。为了减少消耗,NVIDIA 开发了一款显存实用程序,它将规整和二次分配技术相结合,可优化和减少加速结构的显存消耗。我们已将此解决方案变为名叫 RTXMU 的 SDK,并在今天将其作为开源版本提供。它专为支持各种 DXR 或 Vulkan 光线追踪应用程序而构建。

  通过利用 RTXMU 规整加速结构,可消除初始构建操作中浪费的显存。对于使用 RTXMU 的应用程序,NVIDIA RTX 显卡的显存占用量减少了大约 50%。此外,利用 RTXMU 二次分配加速结构缓冲区可防止出现碎片和浪费的空间。包含数千个不同的小 BLAS 的场景将从二次分配中受益匪浅。

  RTXMU 如何立即提供帮助?

  RTXMU 易于集成,可立即带来好处。

  二次分配和规整显存管理器需要花费大量工程时间进行验证。RTXMU 可缩短开发者将规整和二次分配技术集成到 RTX 游戏中所需的时间。

  RTXMU 还会抽象化 BLAS 的显存和规整状态管理,并管理规整尺寸回读和规整副本所需的所有屏障。

  更深入地说,RTXMU 使用 BLAS 数据结构的句柄间接层来防止错误管理 CPU 内存(包括访问已取消分配或不存在的 BLAS)。此外,二次分配通过将更多 BLAS 装入 64 KB 或 4 MB 页面中,带来了提高 TLB(页表缓存)命中率的好处。

  简而言之,RTXMU 让开发者毫不费力地就能让实时光线追踪游戏和应用程序更快速地运行。

  关于作者

  Ethan Einhorn 是一位有21年游戏行业经验的资深人士,曾担任编辑、营销、制作和创意指导等职位。目前,他是 NVIDIA 的高级产品营销经理。

  审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分