NVIDIA Nsight Compute 是一款用于 CUDA 应用程序的交互式内核分析器。它通过用户界面和命令行工具提供详细的性能指标和 API 调试。 Nsight Compute 2022.2 包含扩展支持的环境和工作流程的功能,用于 CUDA 内核评测和优化。
NVIDIA OptiX 加速结构查看器
使用新的 NVIDIA OptiX acceleration structure viewer ,用户可以在启动光线跟踪管道之前检查他们构建的结构。加速结构描述渲染场景的几何体,用于光线跟踪交点计算。用户创建这些加速结构, OptiX 将其转换为内部数据结构。有时,用户创建的描述很容易出错,很难理解渲染结果为什么不符合预期,或者是什么限制了性能。
有了这个新功能,用户可以在三维可视化工具中浏览它们,并查看创建过程中使用的参数,如构建标志、三角形网格顶点和 AABB 坐标。此查看器可用于识别重叠或低效的层次结构,从而产生亚像素光线跟踪性能。
图 1 带 3D 场景导航的 Nsight Compute acceleration structure viewer
每个内核的问题检测
最新版本在摘要页面中添加了一个新的“检测到的问题”列,用户可以根据检测到的性能问题的数量对所有分析的内核进行排序。这为用户提供了在多个结果(内核配置文件)中集中精力的指导。如果用户不确定要将优化工作集中在哪个内核上,那么一个长时间运行且检测到大量问题的内核是一个很好的起点。
图 2 摘要页面中的“检测到的问题”列标识性能问题最多的内核
其他改进
源页面上的度量分组和选择选项有改进,使其更易于使用。此外,此版本还增加了对在基于 ARM SBSA 和 L4T 的平台上运行 Nsight Compute 用户界面的支持,用户无需远程连接或单独的主机即可进行配置。
关于作者
Jackson Marusarz 是 NVIDIA 计算开发工具的产品经理。他关注如何使用工具使所有开发人员能够轻松高效地评测、调试和优化 CUDA 代码。杰克逊拥有 Boulder 科罗拉多大学计算机工程硕士学位。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !