描述
电子发烧友网报道(文/李弯弯)智能驾驶是未来的必然趋势,近几年汽车智能化技术越来越成熟,同时政府也在不断出台新政策,支持和鼓励智能驾驶的稳步发展。
未来几年汽车智能化商业进程将持续加速,数据显示,2025年全球自动驾驶汽车出货量预计达5000万台,中国L2级以上智能汽车销量将破1000万台,
智能汽车渗透率将达50%。
在不久前某论坛上,后摩智能创始人&CEO吴强博士谈到,智能驾驶规模化商用需要满足3个要素,一是强智能,二是低成本,三是安全性,而这也对智能驾驶计算芯片提出了新的要求,需要未来的智能驾驶芯片满足大算力、低功耗、低成本、高可靠的要求。
而从当前的情况来看,矛盾点在于:需求侧,算力需求在不断增长,原因是智能汽车配备的传感器数量持续增加和升级,需要处理的数据量越来越大,比如2019年Model3,配备传感器21个,包括8个120万像素摄像头,12个超声波雷达,1个毫米波雷达,算力为144T;到2022年,蔚来ET7,配备了33个传感器,包括7个800万像素摄像头,4个300万摄像头,12个超声波雷达,5个毫米波雷达,1个激光雷达,算力达到1000T。
另外算法越来越复杂,芯片需要更高的开放度,未来OTA升级需进行算力预埋,比如新势力车厂预埋的算力就超过500T,包括蔚来、理想、小鹏等。
而供给侧,传统方案面临挑战,比如依赖先进制程和工艺,3nm/5nm先进制程成本昂贵,HBM/3D封装依赖先进IP,需要牺牲通用性换取计算效率,算法和芯片高度耦合。
也就是说,传统方案成本昂贵,且依赖少数国际大厂的IP,功耗过高,增加散热系统成本,高度耦合的封闭方案无法支持未来的算法演进和OTA升级,那么可以如何解决呢?吴强博士认为,创新计算架构存算一体,是解决智能驾驶算力和功耗难题很好的方式。
存算一体是与传统冯诺伊曼架构安全不同的架构形式,即直接在存储内做计算,过去几年国内外不少芯片巨头和初创企业投入到存算一体技术的研究中,目前已经在终端一些应用领域实现商用,随着技术的不断进步,有企业逐渐将产品推向边缘、汽车等应用领域。
相比较来看,存算一体的优势体现在几个方面,一、可以做到更高的有效算力,突破1000TOPS,成本低,不依赖于先进工艺、3D封装等昂贵的技术;二、低功耗,相同算力下,AI部分能效比2-3个数量级提升,更低散热成本,更高可靠性;三、低延时,较GPU延时有2-10倍提升,更高的安全性;四、弱工艺依赖,不依赖先进工艺,可以用成熟制程,更好应对供应链被压制的挑战。
比如在散热方面,汽车最好的方式是采用自然风冷,功耗小于15W,成本低可靠性高,维修成本低,而冯诺伊曼架构,自然风冷功耗限制下,物理算力约只能做到20TOPS,存算一体架构,自然风冷功耗限制下,物理算力可以超过60TOPS。从这个层面来看,对于未来的智能驾驶汽车来说,存算一体架构会更加合适。
从电子发烧友的了解来看,目前后摩智能在将存算一体推向智能驾驶领域方面是最为领先的,这家公司于2020年9月完成天使轮融资,2020年11月正式成立,启动存算一体大算力AI芯片的研发,2022年4月已经完成PreA+轮融资。
该公司在2021年8月完成首颗芯片技术验证流片,据吴强介绍,后摩智能首颗芯片,算力20T@INT8(可扩展到200T+),已成功跑通自动驾驶典型算法,完成11个类别的检测、识别、语义分割,是存算一体芯片首次达到运行智能驾驶的复杂AI场景所需算力和精度要求。
根据规划,2022年到2025年间,后摩智能将主要基于SRAM,推出系列产品,包括HM300,HM500,HM1000,算力从30Tops@INT8提升到500Tops@INT8,能效比实现10倍提升;到2025年之后,将推出基于MRAM/RRAM的产品系列,包括HM310,HM510,HM1010,实现算力从50Tops@INT8到2000Tops@INT8突破,能效比的提升100倍。
另外,后摩智能的存算一体芯片,采用类CUDA的编程模式,这样可以降低客户应用的开发成本,支持TensorFlow、PyTorch、ONNX等算法框架。
就如上文所言,未来几年中国汽车智能化将会持续加速发展,这必将带动上游芯片、零部件的持续创新,虽然从目前来看,存算一体芯片还未真正在智能驾驶汽车上实现商用落地,不过存算一体创新架构在算力、功耗等方面的优势确实明显。相信未来在技术的不断更迭,以及智能驾驶汽车市场的驱动下,将会逐渐取得成绩,当然作为一项新兴技术,面临的困难也是不言而喻的。
打开APP阅读更多精彩内容