英伟达Orin 的系统结构解析

描述

2020年前后,英伟达分别发布了新一代面向机器人和自动驾驶(车载要慢一些)领域的Orin芯片和计算平台。这全新的SoC采用ARM Hercules CPU内核和英伟达下一代GPU架构,这已经成为中国自动驾驶的标准化配置。根据现在的眼光,我们来重新审视一下这颗芯片。

晶体管

一)Orin架构概述和应用场景

Orin SoC包含了高达170亿晶体管,几乎是Xavier SoC的两倍,搭载了12个ARM Hercules内核,并集成了NVIDIA下一代Ampere架构的GPU,提供了惊人的200 TOPS@INT8性能,接近Xavier SoC的7倍。Orin SoC采用先进的7nm制程工艺,功耗水平出色,在200TOPS的算力下,TDP仅为50W。Orin的应用范围广泛,从入门级ADAS解决方案到L5级Robotaxi系统(实际没有实现),Orin计算平台有助于并发运行多个自动驾驶应用和深度神经网络模型算法。Orin达到了ISO 26262 ASIL-D 等级的功能安全标准,为自动驾驶系统的安全性提供了强有力的支持。

晶体管

1)CPU和GPU架构

Orin的CPU部分采用ARM Cortex-A78AE架构,共包括12个Cortex-A78核心和基于Arm Cortex-R52的功能安全岛。这样的设计使得Orin-x能够提供通用高速计算能力,并满足功能安全要求,无需额外增加功能安全CPU芯片。

晶体管

GPU方面,Orin采用NVIDIA Ampere GPU,具有两个GPC(Graphics Processing Clusters)和128个CUDA Core。总计2048个CUDA Core和64个Tensor Core,INT8稀疏算力高达170 TOPS。Ampere GPU支持CUDA语言,提供高级并行处理计算能力,并在图形处理和深度学习方面表现卓越。

晶体管

2)加速器和硬件引擎

Orin还包括特定域硬件加速器(DSAs)如PVA(可编程视觉加速器)和DLA(深度学习加速器)。

PVA是第二代NVIDIA视觉DSP架构,专门用于计算机视觉、ADAS、ADS、虚拟现实系统。

DLA用于加速卷积神经网络中的推理操作。  

晶体管

这些加速器通过实现计算引擎多任务、高效、低功耗等特性,提高了整体系统性能。

二)系统平台和优化的电

Orin的视觉处理包括第二代视觉加速器PVA和视频成像合成器VIC。PVA经过升级,支持计算机视觉中的各种功能。VIC则提供了图像处理功能,包括镜头畸变校正、时间降噪、视频清晰度增强等。为了调用Orin SoC上的多个硬件组件,英伟达开发了视觉编程接口(VPI),VPI附带了多种图像处理算法和计算机视觉算法。

Orin最高支持64GB的256位LPDDR5和64GB的eMMC。DRAM支持3200MHz的最大时钟速度,每个引脚6400Gbps,支持204.8GB/s的内存带宽,强大的内存配置为Orin提供了充足的存储和快速的数据交互能力。

当然现在Orin-X的平台,由于车企在不断简化,降本的核心逻辑

● 内存是不是能少一些

● 外围的激光雷达是否能去掉

● 摄像头是不是能用比较简化的考虑

● 毫米波雷达是不是能优化下

Orin作为自动驾驶平台的核心,具备强大的计算和功能安全性能,所以在L2+级别上,围绕城市的使用,围绕算法不断提升的前端感知、规划等计算应用场景,这套自动驾驶系统架构能用多少成本做下来是核心

小结:回头来看,小鹏和大量新势力的尝试,让我们看到了英伟达的Orin芯片的潜力,但是这套东西如何往前走一步,如何能让L2+智能驾驶更有性价比,这是目前卷的核心!

审核编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分