英伟达GTC2025大会关键信息点总结 Blackwell Ultra 量子计算与机器人

描述

英伟达 GTC 2025 大会关键信息点总结

一、‌新一代硬件架构与芯片发布

  1. Blackwell Ultra(GB300)芯片
    • 采用液冷与硅光子技术,单芯片集成288GB HBM3e显存,FP4算力达15 PetaFLOPS,推理速度较前代Hopper架构提升40倍‌。
    • 支持72颗GPU互联的NVL72超节点架构,专为大规模推理场景设计,在复杂任务中性能显著优于传统8卡服务器‌。
    • 预计2025年第三季度量产,HBM容量从192GB升级至288GB,运算效能较B200提升50%‌。
  2. Vera Rubin架构前瞻
    • 下一代架构计划2026年发布,集成HBM4内存与NVLink 144技术,单系统支持144颗GPU,算力目标3.6 ExaFLOPS‌。
    • 强调量子计算与AI融合的长期愿景,预示英伟达在量子计算领域的布局‌。

二、‌AI技术演进路线

  1. 技术发展路径
    • 从生成式AI(Generative AI)迈向Agentic AI(自主决策AI)阶段,最终目标是Physical AI(物理世界交互AI),推动AI从数字领域向物理世界延伸‌。
  2. 推理效能革新
    • 针对指数级增长的推理需求,Blackwell Ultra通过机架级液冷技术实现1 ExaFLOPS算力密度,同时降低30%能耗‌。
    • 推出开源推理框架Dynamo,采用分离式推理架构优化资源分配,大模型token生成效率提升3倍‌。

三、‌软件生态与端侧部署

  1. 端侧AI设备
    • 发布桌面级AI计算机DGX Spark(1 PetaFLOPS算力)和DGX Station(784GB内存),支持本地运行200B参数模型,降低边缘端部署成本‌。
  2. 工具链升级
    • 推出CUDA生态新工具,优化Windows工作站AI推理性能,覆盖数字人、聊天机器人等应用开发‌。
    • 小语言模型(SLM)工具链发布,支持开发者训练本地化任务模型,兼顾效率与准确性‌。

四、‌应用场景与行业布局

  1. 人形机器人技术
    • 展示GR00T N1模型在Fourier GR-1人形机器人上的应用,实现语言控制的双臂协调操作,强调物理世界交互能力‌。
  2. 汽车与通信领域
    • 推出NVIDIA Halos安全方案,结合Omniverse数字孪生技术优化自动驾驶训练环境‌。
    • 布局6G通信网络,探索AI在基站边缘计算与网络优化中的潜力‌。

五、‌量子计算与未来展望

  • 英伟达提出量子计算实用化仍需10-20年,但Feynman架构(2028年)已瞄准量子与AI融合方向,展现长期技术野心‌。

审核编辑 黄宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分