电子说
AI 芯片近两年成为大热门,养出不少独角兽,但在今年下半年行业已经出现不小震荡,先是深鉴科技被美国半导体公司赛灵思(Xilinx)收购,华为在全联接大会上推出了昇腾 910、昇腾 310 两款 AI 芯片,坐实了传闻已久华为要自己做芯片的说法。而 2 个月前,阿里巴巴宣布设立平头哥半导体公司。
有人选择被收购,有人面对危机就是转机,也有新人加入战局,包括华为及阿里巴巴,后续 AI 芯片初创领域又会怎么发展?“大厂已经投入资源切入,就是行业洗牌的时候!”,耐能创始人刘峻诚在接受 DT 君采访时说。对于同属 AI 芯片创业一员的耐能,其开发的神经网路处理器(NPU,Neural Processing Unit)芯片,预计明年第二季出货,并通过与 3D 传感供应商合作,全力抢攻 3D 传感商机。
不同于几家媒体上常曝光的 AI 芯片初创公司多是从学术圈走向创业,耐能的创始团队则是来自半导体业内人士,刘峻诚曾任职于高通、三星,耐能首席科学家李湘村则是前高通多媒体研发部门总监,也曾在展讯、朗讯(Lucent Technologies)担任高管。
云端的 AI 服务可以通过 GPU、服务器、高性能计算机群(HPC)提供强大的算力,但越是终端的产品随着系统计算能力的减弱,可以运行的深度学习网络就越小,因此如何让终端设备也能执行一定程度的 AI 功能,就是耐能锁定的市场。
2016 年推出自家第一款终端装置专用的 NPU 以及软体开发套件“重组式人工智能神经网路(Reconfigurable Artificial Neural Network)”,芯片体积小、功耗低,更做到可以在终端上跑 ResNet、SSD(Single Shot MultiBox Detector)等深度学习网络框架。
在深度学习领域有几个被广泛使用的模型架构,像是 AlexNet 有 5 或 8 个网络层,ResNet 有 18 层、50 层、101 层、152 层等,而 SSD VGG-300、VGG-512 则是庞大的模型,目前主要应用在安防领域,让机器可以在空间中判断出各个物体的位置、距离等。耐能的 NPU 使用 ARM Cortex-A7、A9 处理器,却能跑得动 ResNet 和 SSD,这就是其技术独到之处。
正因如此,吸引了不少重量级投资者,去年底耐能宣布完成超过千万美元的 A 轮融资,就是由阿里创业者基金(Alibaba Entrepreneurs Fund)领投,其他投资者还包括高通、中科创达、红杉资本等。今年 5 月耐能完成由香港富商李嘉诚旗下维港投资(Horizons Ventures)领投的 1800 万美元 A1 轮融资,累计融资金额超过 3300 万美元。
尽管大股东自己当起了平头哥,要做 NPU 以及嵌入式芯片,但并不影响耐能的生意,刘峻诚透露,近期将宣布完成新一笔融资,此轮金额将超过先前累计的 3300 万美元。另外,耐能最初的商业模式是采取先卖软体、NPU IP 授权的商业模式,合作客户包括 ARM、家电巨头格力等,随着营收来源稳固,明年将开始销售自有 NPU IC。
进军 3D 传感,协同大厂供货结构光、双目方案
苹果 Face ID 刷脸解锁技术的问世,定义了整个科技行业的新方向,不仅 Android 阵营的手机品牌全部跟进 3D 传感,也延伸到了新零售,像是刷脸支付,或是通过扫描面部或身体的 3D 建模,可为消费者定制化产品,还有门禁解锁,就有汽车公司思考通过 3D 传感技术来取代车钥匙。
除了取代人们口袋中的东西,像是钱包、钥匙之外,还有 AR 应用,业界就盛传苹果有意在 iPad 平板电脑采用 ToF 技术,预计在 2019 或 2020 年问世。在苹果的力拱下,3D 传感技术无疑依旧是 2019 年产业的热点。
不过,目前 3D 传感技术的问题在于方案成本仍昂贵,举例来说,苹果 Face ID 的结构光模组打出 3 万多个光点到用户的脸,然后把这些讯息丢到 iPhone 的主芯片 A12 Bionic,这块主芯片里有一个神经网络引擎(Neural Engine),由这个人工智能专用加速处理器执行运算,而结构光模组成本大概是 20 多美元,主芯片大概是 70~80 美元,两者加起来就逼近 100 美元的成本,并不是所有终端产品都适合,例如物联网产品、智能家居产品等。
简单来说,3D 传感方案包括 3D 传感器以及后段的运算处理,目前较流行的做法是利用 NPU 芯片或神经网络引擎来进行后段的运算,3D 传感器取得光的信息和深度信息后,由 NPU 来运算这些数据。因此,耐能的战略是开发一个专门处理 3D 传感的 NPU 芯片,实时进行三维建模,像是人脸识别、物体或行为识别,同时解决耗能高及成本的问题,他进一步指出,一些简单的功能靠这一颗芯片就可独立运作,“该芯片价格大概在 10 美元左右”,并可搭配不同的传感器如结构光、双目或 ToF。目前已与奇景光电及***半导体公司钰创分别合作结构光、双目方案,进攻 3D 传感市场。
除了新零售应用,刘峻诚指出,3D 传感应用在安防领域是一大商机,将 2D 平面信息转为 3D 模型,立体化之后的好处是提高准确度,除了多加了“深度”信息之外,还能用光来感测体温,拿了照片、甚至是蜡像、雕像也无法矇混过关,除了强化系统安全性,另一个优点在于“赋予行为识别能力”,过去安防领域是通过 2D 视频来判断,可能因为角度错位导致系统容易出现误报,通过 3D 传感让机器具有行为识别能力,促使安防产品进入下一个时代。
另一个就是产线的异常检测,目前在工厂生产线上采用自动化光学检测(AOI)技术已行之有年,也就是利用高精度跟高速度的光学镜头来协助检查产品是否有缺陷,不过,近来 AOI 也兴起一股很明显往机器学习靠拢的趋势。刘峻诚认为,传统 AOI 主要是应用在“平面的”印刷电路板(PCB)、面板等行业,其他行业的曲面、立体的产品不见得适用,另外 AOI 准确度仍有很大的改进空间,更多时候是需要靠人力来检查,通过 3D AI 技术即时 3D 建模,可以更精确检查产品的焊锡是否准确等,同时成本得以下降。
从卖 IP 到卖 IC,瞄准物联网及新应用
从初期卖 NPU IP 到准备开始卖自有 IC,特别是耐能的投资方还有一个芯片巨头高通,难道不怕得罪投资方?“在手机跟安防领域,我们是不可能自己做芯片去跟巨头竞争,”刘峻诚说得很坦白。
他进一步分析,目前手机市场就只有前五大业者才有出货量,但手机芯片行业已被高通及联发科拿下,而在安防领域,行业巨头海康威视、大华也自己跳下来做晶片,“今天做个晶片跟巨头 PK,那我就是找死!而且 NPU 其实只是一个协处理器,耐能做的是帮助客人强化他们的产品线,”因此耐能在手机及安防领域的策略就是销售 NPU IP,一是让客户的芯片在 3D AI 功能更强大,二是让新切入芯片领域的巨头能够加速 IP 整合、开发芯片。
在手机跟安防领域不直接与巨头竞争,耐能瞄准的是物联网以及新兴应用,“有些领域并没有这种独占性,物联网至今就没有所谓的赢家,但是有很多生态链,像腾讯、阿里巴巴、小米等,”刘峻诚指出,这些就是耐能将直接销售 NPU 芯片的领域。
芯片是老师傅当道,AI 芯片初创公司的前景如何?
对于今年 AI 芯片初创公司陆续有一些变化,未来整个市场发展又会如何?他认为,“大厂已经投入资源进来,华为就是一个代表”,华为的两款升腾芯片 910 和 310,各自对准云跟端,“当大厂切进来打的时候,这个行业洗牌的时候就到了”,“半导体芯片门槛还是高的,是老师傅当道”,例如,高通是不会让一个 7 年以下工作经验的人到第一线做产品,“直接做大型晶片,跟大厂竞争是傻的”。
其实可以检视一下 AI 芯片独角兽们的产品策略,有两家企图攻进云端市场,像是数据中心,但云端市场早已是巨头把持的天下,谷歌自研的 TPU 已经开始对外提供服务,除了半导体巨头 NVIDIA 之外,更不用说还有一个在数据中心具有极高市占率的英特尔,不只芯片,内存以及传输介面(Interface)都是它的强项,因此英特尔的优势在于“整体系统”的性能强大。
另外,汽车领域也吸引了不少芯片初创企业投入,国内就有一家知名的独角兽推出了自动驾驶芯片,“但车的整个开发周期是三年到五年,时间很长,小公司没有营收,发展会比较辛苦”,更重要的是,在这个领域会遇到 NVIDIA。众所皆知,NVIDIA 跟国际车厂包括奔驰、奥迪等,已经建立深厚的关系,而且汽车并不在意功耗问题,只重视系统的稳定度及可靠度,因此想要跟 NVIDIA 抢食自动驾驶芯片的蛋糕,难度其实很高。
因此,耐能的策略很清楚,“我们不碰“云”跟“汽车”行业,专攻“端”,”刘峻诚强调,把过去依赖大量云端算力进行的 AI 计算,搬到终端上来实现,也就是边缘运算,但尽管是锁定“端”的 AI 市场,在安防跟手机领域是以卖 IP 为主,不会去跟大厂竞争,而是帮助他们技术提升,抓住自己的独有性。
内存跟 I/O 将是下一个重要趋势
面对这场 AI 芯片大混战,刘峻诚倒是看得很冷静,“估值喊得再高,本质还是要创造价值”,就是“比谁的气比较长”,“能做的就是赶快找一些细分领域做突破、做前沿技术开发”,他进一步分析两大趋势,AI 发展后,未来一定是多个 NPU 多核堆叠起来,因此内存跟中间的 I/O 传输会是下一个非常重要的领域,像是内存内计算(In Memory Computing)以及高速传输介面 SerDes。
由于 AI 或认知运算都需要处理非常大量的资料,如何有效率处理这些数据就成了关键,现今的电脑架构都是使用冯诺伊曼架构(von Neumann architecture)来运行,但基于冯诺伊曼架构,在执行 AI 应用时,处理器和记忆体之间需要大量传输资料,耗费资源且效能不佳。
许多重量级研究机构都已经投入相关研究,除了美国美国国防高级研究计划局(DARPA)资助开发一种全新的非冯诺伊曼(non-von-Neumann)架构处理器之外,今年 4 月 IBM 研究团队发表了一个全新的混合式精确内存内运算架构(Mixed-precision in-memory computing),将计算型内存单元(Computational memory unit)加入冯纽曼架构(von Neumann architecture),来提高 AI 训练的效能。
随着 AI 芯片的行业正走向洗牌,初创公司必须开始做出差异化,因此耐能已经投入上述两大领域的开发,希望在未来的前沿领域仍可跟巨头竞争。
全部0条评论
快来发表一下你的评论吧 !