新版本CUDA 11.6工具包的功能

描述

  NVIDIA 发布的 CUDA 开发环境 CUDA 11.6 的最新版本。本版本的重点是增强 CUDA 应用程序的编程模型和性能。 CUDA 继续推动 GPU 加速度的边界,并为 HPC 、可视化、 AI 、 ML 和 DL 和数据科学中的新应用奠定基础。

  CUDA 11.6 有几个重要特性。这篇文章概述了关键功能:

  GSP 驱动程序架构现在默认为图灵和安培 GPU

  新 API 允许禁用实例化图中的节点

  完全支持 128 位整数类型

  协作组命名空间更新

  CUDA 编译器更新

  Nsight Compute 2022.1 版本

  CUDA 11.6 附带 R510 驱动程序,这是一个更新分支。 CUDA 11.6 工具包可供下载 。

  GSP 驱动程序体系结构

  GSP 驱动程序体系结构现在是所有列出的图灵和安培 GPU 的默认驱动程序模式。较旧的驱动程序体系结构作为后备支持。有关更多信息,请参阅 R510 驱动程序自述 。

  实例化的图形节点 API 添加

  我们添加了一个新的 API cudaGraphNodeSetEnabled,以允许禁用实例化图中的节点。在此版本中,支持仅限于内核节点。相应的 API cudaGraphNodeGetEnabled允许查询节点的启用状态。我们还添加了禁用空内核图节点启动的功能。

  128 位整数支持

  CUDA 11.6 包括 128 位整数(__int128)数据类型的完整版本,包括编译器和开发工具支持。主机端编译器必须支持__int128类型才能使用此功能。

  协作组名称空间

  协作组名称空间已更新为新函数,以提高命名、函数范围以及单元维度和大小的一致性。

  CUDA 编译器

  在编译过程中向目标安装的 GPU 添加了-arch=native编译选项。这扩展了现有的-gencode=arch=compute_xx,code=sm_xx体系结构规范

  添加从nvlink创建 PTX 文件的功能

  不推荐的功能

  不推荐使用用于设备上 fork 和 join 并行的cudaDeviceSynchronize(),以便为具有更高性能的替换编程模型做准备。这些函数在本版本中继续工作,但这些工具会发出有关即将发生的更改的警告。

  CentOS Linux 8 已经到了生命的尽头 在 2021 年 12 月 31 日,对这个操作系统的支持现在在 CUDA 工具包中被弃用。 CentOS Linux 8 支持将在未来版本中完全取消。

  关于作者

  Rob Armstrong 是 CUDA 工具包的主要技术产品经理。 20 多年来,他一直专注于使用异构硬件平台加速软件,并对计算机体系结构和硬件/软件交互特别感兴趣。

  Arthy Sundaram 是 CUDA 平台的技术产品经理。她拥有哥伦比亚大学计算机科学硕士学位。她感兴趣的领域是操作系统、编译器和计算机体系结构。

  Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高级产品营销经理。弗雷德拥有加州大学戴维斯分校计算机科学和数学学士学位。他的职业生涯开始于一名 UNIX 软件工程师,负责将内核服务和设备驱动程序移植到 x86 体系结构。他喜欢《星球大战》、《星际迷航》和 NBA 勇士队。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分