耐能以NPU为方向 或成为AI产业的arm

人工智能

621人已加入

描述

  AI已经无疑是现在市场的绝对主角。随着概念的火热。围绕着AI芯片、算法和应用应运而生的企业已经不胜枚举。当中的很多凭借自己的优势也已经获得了客户和投资人的认可,耐能(Kneron)就是其中的一个。

  在去年11月宣布从阿里、奇景光电、中华开发资本、高通、中科创达、红杉资本与创业邦获得了超过千万美元的A轮融资以后,AI初创企业耐能最近推出了他们的全新人工智能IP产品。而这个市场,在国内外都不缺乏竞争者,尤其是ARM和寒武纪的优势最为突出:前者拥有包括CPU、GPU、工具和晶圆厂配套IP在内的庞大生态,后者则由于Kirin 970的采用,在容量巨大的手机市场找到了一个入口。

  在AI这个已经巨头林立的市场里,成立仅四年的耐能如何才能突破包围圈?为此,半导体行业观察特意采访了耐能科技的创始人刘峻诚博士,了解一下他的“攻城”之道。

  从客制化开始,以NPU为方向

  在创立耐能之前,刘峻诚曾在 、三星和高通等企业任职。到了2014年,由于看到人工智能NPU的潜力,在高通从事了三年多神经网络终端应用等工作开发的刘峻诚创立了耐能。

  所谓NPU就是Neural-network Processing Unit的简称,也就是神经网络处理单元,这是一种针对深度学习而设计的专业芯片。这种脱离了传统冯诺依曼结构的处理器通过专门的设计,非常适合深度学习的实现,进而实现人工智能。这是现在实现人工智能的几种方式之一,华为Kirin 970就是采用了NPU的方式。但另外还有CPU、GPU、FPGA和DSP等多种方案可以执行人工智能的算法。但耐能从成立伊始就专门从事AI专用芯片NPU的IP产品的研发。采用ARM那样的IP授权方式进行经营。

  在问到为何选择这个方向的时候,刘峻诚告诉半导体行业观察记者:“会选择IP的主要考量是成本和风险,以及弹性。若要直接提供芯片,需要的资本非常雄厚,以新创公司来说,负担会很大,也意谓著风险会很高。此外,提供IP授权的商业模式较为弹性,我们希望能借重合作伙伴的力量,共同推广AI,让它更快普及。”

  在团队的努力下,耐能于2016年推出了相关的IP。但据刘峻诚介绍,当时的IP主要是根据客户的特殊需求定制的。例如腾讯就和他们合作研发了智能导航、脸部识别和AI算法,甚至连腾讯的智能车“神眼”项目都是用的耐能产品。

  在积累了丰富的经验并充分了解了客户的需求之后,耐能在日前推出了全新的三大产品线。

  推三大产品线,最低做到5mw功耗

  这次耐能推出的是Kneron NPU IP系列产品。

  所谓Kneron NPU IP,据耐能介绍,那就是该公司针对终端设备所设计的专用人工智能处理器,能让终端设备在离线环境下,就能运行 ResNet、YOLO等深度学习网络。Kneron NPU为完整的终端人工智能硬件解决方案,包含硬件IP、编译程序(Compiler)以及模型压缩(Model compression)三大部分,可支持各种主流的卷积神经网络(ConvolutionalNeur al Networks,CNN)模型,如Resnet-18、Resnet-34、Vgg16、GoogleNet、以及Lenet等,以及支持主流深度学习框架,包括Caffe、Keras和TensorFlow。

  由于Kneron NPU IP能结合Kneron影像识别软件,提供实时识别分析、快速响应,不仅能更稳定,也能满足安全隐私需求。由于软硬件可紧密整合,让整体方案体积更小、功耗更低,以协助产品快速开发。

  对这系列IP有了基本了解后,我们回到最新发布的三系列产品:超低功耗版KDP300、标准版KDP500、以及高效能版KDP 700。

  据耐能方面介绍,KDP300锁定手机3D脸部识别应用,可进行3D结构光与来自双镜头的立体影像识别分析,让真人脸部识别更快速精准。KDP300亦适用于需要超低功耗的终端设备,该处理器包含运算与静态随机存取内存(SRAM)的功耗不到5毫瓦;

  KDP500则是可进行快速实时、大规模的脸部、手势、身体识别与分析,以及深度学习。适用于智能家居、智能安防等领域。运算能力可达152GOPS(500MHz) (每秒十亿次运算),功耗仅有100毫瓦;

  KDP 700能处理更进阶与复杂的人工智能运算,以及深度学习推理应用,可应用在高阶智能型手机、机器人、无人机、智能监控设备等。KDP 700具有优异的运算能力,信息吞吐量可高达4.4 TOPS(1GHz) (每秒万亿次运算),功耗为300~500毫瓦;官方表示,这系列产品可满足智能家居、智能安防、智能手机,以及各种物联网设备的应用。

  在接受半导体行业观察采访的时候,刘峻诚指出这些产品拥有以前产品不具备的特性:例如他们首度推出的,功耗不到5毫瓦的产品,体积也首度达到了长、宽可以在2毫米以内,这就让它可以满足非常小体积产品上的设计。

  “又因为技术上的提升,每瓦效能也有了突破,过往大约是1~1.5 TOPS/W,但以这次推出的高效能版KDP 700在16纳米制程下,可以高达11.6 TOPS/W”,刘峻诚强调。

  KDP 500预计第二季进入量产制造(Mask tape-out)阶段,KDP 300和KDP 700的量产时间也和客户密切讨论中。

  高手林立,底气来自哪里?

  耐能并不是唯一一个做NPU的厂商,在前面我们已经提到寒武纪,在这个领域就是一个专家,甚至一个独角兽,并且已经在Kirin 970上得到了验证。作为一个产品相对新的企业,如何与对手竞争时?在问到这个问题的时候,刘峻诚并没有直接回答,但他强调:“AI解决方案,无论是软件或是硬件 IP,有一个关键处,就是它的规格跟功能会跟应用有很大的关系,举例来说,提供给手机跟提供给车用的方案,就会有很大的差异。目前不同厂商锁定的领域都有些差异,很难直接做比较。”

  他指出,耐能的IP拥有以下几点优势,这是他们未来在市场上立足的根本:

  首先,在IP产品上,耐能这次推出了很完整的产品线,而且规格非常优异。以KDP 300来说,在功耗如此低、体积这样小的规格下,就能在手机上做3D影像分析辨识,以作为解锁等应用,市场上应该还没有其他厂商可以做到这种程度。我们很有信心我们的解决方案在市场上非常有竞争力,刘峻诚强调。

  其次,相较于某些厂商仅提供硬件架构IP,瑞能的NPU IP是一个更完整的解决方案,除了有NPU IP架构,还包含模型压缩技术,可以把未经压缩的模型压缩数十倍。另外,也包含已经训练好数据的软件,所以说瑞能的NPU IP本身其实就是一个完整的软硬件整合方案。

  第三,除了NPU IP之外,瑞能还自己开发影像辨识软件产品。结合Kneron NPU和Kneron影像辨识软件,将软硬件紧密整合,这样获得的整体方案体积更小、功耗更低,能协助客户快速开发产品。

  另外,刘峻诚还强调,耐能的优势在于拥有应用范围比较广的产品线,这也是很多其他对手所不能比拟的。

  市场竞争激烈,利基是成功关键

  无论哪个市场,有丰厚利益收入的时候,必然会伴随着巨大的风险,AI芯片市场也不例外。从诞生开始,耐能就经历着巨大的压力和挑战。但就刘峻诚看来,这些压力并不是来自特定厂商,而是来自多变的AI市场,因为这个市场实在太新了,且变化很快,这就让其具有极大的不确定性。

  “为了在这个市场中找到生存的空间,利基很重要”,刘峻诚告诉半导体行业观察的记者。耐能在这方面也一直在在前面。由于他们在AI领域发展得早,也一直在加快其步伐,这让他们在其他厂商开始谈他们的AI策略跟规划时,自己就就已经开发出产品,并有了客户;在竞争对手发展出产品时,我们甚至已经可以提供了完整的解决方案,刘峻诚补充说。

  以智能手机市场为例,耐能很早就看到了这个领域会成为AI应用的重点战场,也知道当中盘绕着包括ARM在内的众多竞争对手,为此他们一早就规划了自己的应对措施:现在的耐能在智能手机方面拥有完整的解决方案,覆盖了高中低三个完整产品线。

  而根据研究机构Gartner预测,虽然目前智能手机上的AI应用仍处于相当早期的阶段,但到了2022年,智能手机当中将有80%内建AI功能。这和耐能的“利基”观点也是吻合的。

  刘峻诚强调,市场有很多可能性和不确定性,谁能够洞烛先机,并作快速的调整和回应,就能取得优势

  “我们的目标是,让AI不只是高阶产品的专属,而是成为人人都可以使用的功能”,刘峻诚说。他也同时指出,在AI市场,不会再有那些能在所有市场获得成功的玩家,但某个细分领域必然会出现霸主,这是显而易见的。

  在问到耐能是否有机会成为人工智能IP领域的ARM的时候。刘峻诚首先指出,如果要做到ARM这样大的影响力,那就需要布局量比较大的行业(例如汽车和手机),虽然在汽车方面耐能布局不深,但是在手机方面则会有比较好的表现,尤其是今年,这部分有很大机会会给耐能带来巨大的机会。

  除了手机外,安防、IoT也是耐能所专长的领域,尤其是后者。在刘峻诚看来,IoT这个领域他们基本没看到什么竞争对手。

  刘峻诚坦言,如果公司能在以上这三个领域能够达到几千万和上亿的出货量,这样公司的影响力就不言而喻。从目前看起来有一两个领域很有机会达到这个数字,刘强调。

  这样看来,成为AI产业的ARM,对耐能来说,并不是没有机会!

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分