拼命甩开“伪需求”污名的边缘AI

描述

电子发烧友网报道(文/周凯扬)作为用户,我们已经见证了人工智能从产品向功能的演化,而这股趋势正在蔓延至边缘端。然而边缘端由于功耗、算力要求严格,部分现有的方案效果不佳,边缘AI常常被冠以“伪需求”的污名,但对于无论是AI芯片厂商、IP供应商还是软件方案商,都在竭力证明自己的潜力。
 
换着法子追求低功耗
 
在不少人看来,AI芯片分为云端和边缘端,云端AI芯片面向服务器和HPC,自然要求做到高性能,但与此同时功耗自然不低,且往往将推理和训练分隔开。而边缘芯片的要求则恰恰与其相反,追求的首先就是低功耗。
 

AI芯片

旭日3 / 地平线

 
在当前的趋势下,由于边缘端设备涉及的范围太大,小到一个智能水表,大到自动驾驶汽车,所以对在对于算力和功耗的要求上各有不同,所以即便同属边缘AI芯片,也不好直接对比。比如有的是独立的AI芯片,有的是起到辅助作用的协处理器。以地平线的旭日3系列就是针对智能前视和边缘计算市场的边缘AI芯片,其中X3M可以提供5TOPS的AI等效算力,X3E可以提供3TOPS的AI等效算力,在台积电16nm的制程和地平线的芯片设计下,该系列的功耗已经做到2.5W。但即便是这样的低功耗,也不能说覆盖所有的边缘AI场景。
 

AI芯片

AML100 / Aspinity

 
今年年初,AI初创公司Aspinity发布了AML100 AnalogML芯片,一个主打模拟机器学习的低功耗边缘AI芯片,最高支持4个模拟传感器。该芯片面向那些需要实时唤醒的边缘AI应用,比如智能家居中的安全监控、可穿戴设备上的智能语音控制、以及预防性和预测性维修中的异常检测等。这些应用都有着一个共通的特质,那就是离不开传感器。传统的实时唤醒结构将传感器的模拟信号传递给ADC,转换成数字信号后再发往数字处理器,如今这类方案已经可以实现极低的功耗。
 

AI芯片

传统架构与AML100架构的对比 / Aspinity

 
但在Aspinity看来,这种结构需要模拟和数字系统均保持实时在线,ADC对传感器输出的数据“来者不拒”,因此数字处理器承担了对所有数字信号的处理工作,如此一来功耗基本都在3000-5000µA的水平。而AML100的可配置模拟核心支持直接对模拟数据进行特定的信号处理,比如频谱分析、神经网络特征提取等,最终输出真正有用的传感器数据,最后再传给数字处理器。如此一来数字处理器不需要时刻处于唤醒状态,只需要在检测到必要数据时唤醒即可,而AML100组成的模拟系统功耗可以做到100µA以下。据Aspinity的说法,AML100可见电池寿命延长20倍。
 
模型带来的困扰
 
光靠AI芯片自然是不足以支撑起整个边缘AI的发展,大家也都知道模型是AI中不可或缺的一环。然而边缘侧的定义已经注定了跑不起那些大规模的AI模型,所以只能跑那些规模较小,并随算力扩展的机器学习模型,比如TinyML等,所以边缘端的软件栈同样挑战不小。此外,为不同的硬件调整AI模型也是边缘端部署AI的一大痛点。如此一来,虽然不少边缘AI芯片已经做到了足够的优异的性能,在软件生态尚未成熟之下,应用场景依然少之又少。因此,边缘AI的优化往往以缩小开销优化模型为主,使其适应边缘端这一应用场景,在低功耗也能实现绝对的优势。
 
最近又一家美国AI初创公司浮出水面,并获得了来自高通创投和Foothill Venture等公司的1000万美元种子轮融资。其初创团队包括深鉴科技(被赛灵思收购)联合创始人兼Deep Compression技术开发者韩松、前Facebook AI的技术主管Di Wu等。从几位创始人的履历来看,都在AI和深度学习上有着丰富的经验,而且都是清华电子工程出身的,考虑到Foothill Venture也就是改名前的清源创投,倒是不稀奇了。
 

AI芯片

OmniML的创始人 / OmniML

 
团队上就不过多展开讲了,毕竟阵容再豪华的初创公司也得拿实力说话,OmniML的王牌又是什么呢?单看几位创始人过去的成果,确实很擅长减少模型的压缩优化,尤其是他们也活跃于TinyML的开发社区。在OmniML官网的描述中指出,OmniML提供的软件方案可优化AI/ML模型,将它们轻易部署在边缘设备中,又不会损失性能和精度,与此同时,OmniML提供一种硬件感知的神经架构搜索,只需训练模型一次,就可以部署在任何硬件中,无论是GPU、AI芯片还是低功耗的MCU,即便是老的硬件设备也能在OmniML的助力下获得强大的AI/ML能力。
 
根据高通的说法,OmniML的神经架构搜索并不是单纯的压缩模型来做到优化,而是从一开始就创建一个高效的新模型,对于边缘硬件的客户来说,不仅可以降低时间和资金成本,还能有效提升精度。OmniML声称他们这种神经架构搜索已经用于亚马逊的AutoML和Meta的PyTorch深度学习框架中。
 
考虑到开发团队有着深厚的机器视觉背景,OmniML也首先面向自动驾驶和智能摄像头,他们展示了6车载摄像头传感器融合的3D检测方案、以及基于Cortex M7 MCU的人体检测和人脸/口罩检测。
 
边缘AI的需求不算小众

 
在呈现的无尽潜力面前,边缘AI还是常常被人“边缘化”,但如果我们直接看应用市场的话,就会发现边缘AI的需求巨大。无论是TWS耳机的主动降噪,服务机器人的语音识别还是汽车的自动驾驶,边缘AI的发展必将为这些场景带来更大的功耗优势,节省成本的同时加快落地速度。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分