通过NSight Compute 2021.3优化GPU利用率

描述

NVIDIA 发布了最新的 NSight 计算 2021.3,它具有用于测量和建模占用率、源代码和汇编代码相关性的新功能,以及用于识别访问缓存造成的瓶颈的分层屋顶线模型。

占用率计算器

NSight Compute 2021. 3 添加了一个新的占用率计算器活动,帮助您了解内核的硬件资源利用率,并建模调整如何影响占用率。

占用率是每个 SM 的活动扭曲与活动扭曲理论最大数量的比率。占用率低可能表示内核太小、工作负载不平衡或资源争用。所有这些都会限制 GPU 上具有特定可用资源集的内核的性能。

计算器

图 1 NSight 计算占用计算器的显示

命令行源页面

此版本添加了一个高要求的功能,允许直接从命令行从 GUI 中的源页面访问信息。通过使用--page source标志,用户可以在命令行上看到源代码行、 PTX 行或程序集行以及这些行的收集指标。

在分析收集的数据以及编写脚本和后期处理结果以进行进一步报告和分析时,此功能提供了额外的灵活性。

计算器

图 2 命令行源输出功能的示例。

分层屋顶线

屋顶线图表现在支持分层屋顶线,除了设备内存之外,还为 L1 和 L2 缓存添加屋顶线。您可以查看它们的内核与每个内存级别的带宽限制有多接近,以确定它们的内核是否存在与访问内存相关的瓶颈。

计算器

图 3 NSight 计算显示屋顶线层次结构比较。

其他增强功能

进一步的功能包括更多可配置的基线比较、从 CLI 直接访问源代码级信息以及附加的 SSH 功能。

关于作者

Jackson Marusarz 是 NVIDIA 计算开发工具的产品经理。他关注如何使用工具使所有开发人员能够轻松高效地评测、调试和优化 CUDA 代码。杰克逊拥有 Boulder 科罗拉多大学计算机工程硕士学位。

Chaitrali Joshi 是 NVIDIA 的产品营销经理,专注于电信 5G 系统的设计和开发。她对网络空间有着深入的了解,是移动通信系统和云栈方面的专家。在英特尔之前,她是一名领导,向开发人员宣传电信技术和边缘计算技术。她获得了加利福尼亚大学计算机科学硕士学位,戴维斯专注于软件定义的网络和多址边缘计算( MEC )。

审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分