描述
电子发烧友网报道(文/李弯弯)随着技术发展,AI应用将会无处不在,AI芯片作为支撑算力的基石,具有至关重要的作用。然而在传统的冯诺依曼架构下,AI芯片功耗大,算力利用率低。为了解决这些问题,业界积极探索新的架构形式。
在这样的背景下,九天睿芯独创的模拟感知前处理+数模混合存内计算的感存算一体架构,可以在成本极低的情况下,将芯片的功耗降到uW级别。基于此全新的架构,九天睿芯的研发团队设计了多款芯片,并且已经实现量产应用。
功耗只有其他芯片产品的十分之一
九天睿芯片成立于2018年,专注神经拟态感存算一体芯片研发。公司创始人刘洪杰博士从事神经仿生工程领域的科研研发工作多年,围绕类脑芯片和视觉处理芯片,已发表数篇国际一流会议/期刊论文,是事件及帧融合处理芯片发明人以及6T SRAM存内计算发明人。
团队核心成员毕业于瑞士联邦理工、新加坡南洋理工大学、清华大学、北京大学、电子科技大学等,并曾就职于华为、IMEC、高通、腾讯等名企/单位,在芯片设计开发、神经网络及计算架构领域研发经验超过十年,在顶级会议和期刊上发表文章。
该公司推出的第一代芯片ADA100,可应用于语音命令词识别、人声监测、噪声环境识别,以及角速度传感器的识别和处理等。该芯片已经于今年5月量产,现在已经应用于TWS耳机、手表、助听器等可穿戴产品中,以及照明、开关、遥控器等IoT领域。
九天睿芯感存算一体芯片有一个很大的特点,就是具有超低的功耗。该公司销售总监袁野在接受电子发烧友采访的时候表示:“ADA100在KWS语音识别等应用上,功耗都可以保持在微安级别(70-150微安)。公司的芯片功耗,与同行产品相比只有其十分之一。同时在成本方面,同样芯片的算力,也只有数字芯片的三分之一。”
为什么功耗可以做到如此低?据袁野介绍,可以分为两部分来看:第一,九天睿芯的芯片采用的是感存算一体架构。在前端就有一个模拟的处理单元,可以对感知信号进行特征提取,再传输给ADC进行数据转换。也就是说,转换的不是所有感知到的信号,而只是特征信号,这样转换的数据量,就只有原始数据的十分之一,甚至是二十分之一。
而本身ADC进行数据转换,在整个芯片里面的功耗占比就很高,当它的功耗大幅降低的话,整个芯片的功耗也就会有很大幅度的下降。
第二,九天睿芯的芯片,在后端计算部分采用的是基于SRAM的存内计算。存内计算,也就是在存储内直接做计算,减少了数据搬运,功耗会比传统的冯诺依曼架构降低很多。九天睿芯基于SRAM的存内计算的芯片,与传统的数字NPU相比,功耗只有其五分之一。
这样,从前端的数模转换到后端的计算,功耗都很低,整个芯片的功耗也就非常低了。
在商用进程方面,目前九天睿芯已经与歌尔等六家企业合作,合封智能麦克风,即基于九天睿芯第一代芯片ADA100的裸Die,与上述几家公司的MEMS,合封在一个基板上,做成智能麦克风,让其可以实现语音识别功能。现在与这几家合作的智能麦克风都已经合封完成,测试也已经通过,将会在今年11月份左右进行大批量生产。
另外ADA100单独芯片的应用,也已经在华为、小米、OPPO等厂商推广,目前都处于DEMO测试阶段。在其他客户的合作方面,ADA100已经接到100多万pieces的订单,预计将在今年11月份左右完成初期交付。公司计划明年能达到千万级出货,在更多产品中实现应用。
九天睿芯感存算一体,超低功耗、低成本的特性,切实地在帮助客户解决面临的痛点问题。比如,在助听器上的应用。现在的助听器,主要有两个模式:一个是需要去医院适配,调好增益幅度,给老人带上。但是大部分老人,当时的感受跟平时的感受可能不一样,佩戴的时候其实并不舒服,可能增益开太大了,但是他又没有办法做调整。
另一个是比较新的一种助听器,用的是蓝牙主控跟手机连接,通过APP调节它的增益状态,如果觉得声音大,就调小一点。不过它也有一个痛点,就是很多老年人,操作智能手机并不熟练,需要年轻人帮他先调好。同样的问题是,在调的时候用的舒服,并不代表他一直用着舒服,比如他现在在外面,环境吵,而它的增益还是开很大,就会对耳朵有损伤。
所以,现在所有新兴的助听器客户都会提出,在内部增加一颗环境噪声识别感知的芯片,帮助助听器自适应的调节增益幅度。比如说,外面比较安静的时候,增益就可以开大一点,让用户可以听得更清楚。外面声音很吵的话,就可以把降噪开大一些,屏蔽噪声,把人声放大。
袁野向电子发烧友介绍:“我们的芯片可以感知到外部环境的变化,之后推送一个指令给主控,主控再自适应地调节它的降噪和增益幅度,这样就可以实现,老年人佩戴的智能化,体验会更好。这算是助听器真正意义上的智能化升级。”
九天睿芯在与客户交流的时候发现,这些助听器的厂商普遍认为,他们的助听器产品迫切需要这个功能。而且更重要的是,对于助听器产品来说,超低功耗是刚需,不然的话,电量坚持不了24小时也很麻烦。九天睿芯芯片超低功耗特性的作用在这里就很好的体现出来了。
一款可直接连接事件相机单独存在的SoC
除了第一代ADA100,九天睿已经规划设计了多款产品,包括第二代芯片ADA200,第三代芯片ADA300,以及一颗高性能ADC产品。其中ADA200已经流片成功,ADA300在规划中。
ADA200同样是采用数模混合+存内计算的架构模式,不过与ADA100不同的是,ADA200算力更大,可以达到4-10TOPS。九天睿芯市场总监Johney Lu向电子发烧友介绍:“到了这么高算力后,ADA200就可以接大量的视觉及其他传感器,比如传统的CIS、雷达,以及事件相机(DVS)。同时可以接多路(4路或者8路)的视觉信号。”
这颗芯片可以有好几种用法:一是作为单独的边缘计算SoC,成为一个相机模组,或者一个单独运作的产品;二是在AR/VR上做协处理器,完成一些功能,比如做slam,ISP的图像增色、渲染;三是做不同传感器接入时的处理和预处理,还可以接事件相机,目前在市面上,九天睿芯是唯一可以直接接事件相机的单独存在的SoC。
基于此,也就可以面向三个市场:一是在汽车上,做碰撞预警,或鬼探头等视觉的边缘计算;二是在AR/VR上做协处理器;三是在IoT产品上作为独立存在的SoC。
上面提到的事件相机(Event Camera),也称神经形态像机,或动态视觉传感器(DVS,Dynamic Vision Sensor),是一种能够响应局部亮度变化的成像传感器。事件相机不像常规相机那样使用快门捕获图像。相反,事件相机中的每个像素都独立且异步地运行,并在发生亮度变化时输出这些变化,否则保持沉默。
据Johney Lu介绍,事件相机有几个很典型的特点:一是它的动态范围非常高,可以达到140dB;二是因为它只输出有效信息,不输出无效信息,它的数据量非常小;三是它的速度非常快,可以达到1/10000s,甚至更高。
因为这三个特点,行业普遍认为,事件相机可以应用于在汽车上做鬼探头或者碰撞预警。自动驾驶是未来的必然趋势,如今乘用车基本还处在L2自动驾驶阶段,现在已经有很多厂商在做碰撞预警,不过相对来说,它还不是必须的功能。然而到L3/L4之后,基本就不需要驾驶员参与了,汽车需要自己去驾驶,这时候汽车都需要具备碰撞预警功能。在低光照、或者突发状况下,汽车需要依靠各种传感器、计算芯片,以及各种算法,自己进行处理。
然而问题是,对于L3/L4自动驾驶来说,还是有5%-15%的corner case,传统视觉非常难以处理,事件相机却没有问题。相对来说,在低光照下,高动态范围,或者突发事件的情况下,事件相机的效果会比传统视觉好很多。
目前市面上已经有事件相机产品量产,比如索尼。而九天睿芯的ADA200是一款可以直接事件相机的单独存在的SoC。Johney Lu表示:“我们的SoC可以和传感器厂商的事件相机一起,帮助汽车在L3之后的自动驾驶阶段,实现对这5%-15%的corner case的处理。”
这是在汽车上面的应用,目前九天睿芯已经与国内外几家主流车企达成合作。另外在AR/VR上面的应用,ADA200可用来做视觉上的slam,接RGB或DVS做眼球追踪。完成定位、手势识别,还有多重不同传感器的融合等功能。
现在一些主流的AR/VR公司对这方面都非常感兴趣,包括Meta。现在的趋势是,用主芯片加一颗协处理器,来解决AR/VR上所有传感器的融合。很多时候,主芯片的迭代速度比较慢,没有办法引入最新的技术,而协处理器迭代比较快,正好可以解决这个问题。另外协处理器也分担主芯片的功能,降低它的功耗和成本。
九天睿芯规划中的ADA300,算力将会更大,可以达到24TOPS以上,可以作为一颗主芯片SoC,应用在非常多的场景中。并且ADA300可以和很多大厂合作,做成超大算力的产品。
Johney Lu表示,很多大厂非常认可,存内计算+数模混合这样的架构,面效比、能效比都比较有优势,因此九天睿芯会以存内计算的IP、以及design一部分的方式跟大厂合作。
除了ADA100、ADA200、ADA300三款产品,九天睿芯还有一颗激光雷达ADC,已经流片成功,会在明年实现量产。
小结
整体来看,九天睿芯创新架构的特性非常明显,芯片产品功耗低、面积小、成本低,在可穿戴、AR/VR、自动驾驶上都有其独特的优势,因此获得了不同领域客户的认可。ADA100今年会逐渐在更多产品中应用,随着明年ADA200、ADC的量产,基于九天睿芯创新架构的芯片产品,将会更多更好的服务于各个行业和客户。
打开APP阅读更多精彩内容