AI造芯路上,最不缺的就是梦想和勇气。不管是高通、英伟达这样的巨头,还是无数前仆后继的成长型企业。
关于AI,前景无疑足够有吸引力,才能转化为放手一搏的动力。
这场围绕AI的造芯热潮,被认为将在2019年经历落地应用的关键考验。未来是否能如期而至?纷纷落地的赛道上,什么样的AI芯片能够稳稳着陆?
巨头的盛宴
4月19日,高通在人工智能开放日上,
正式推出布局云端的AI推理加速处理器——Cloud AI 100。在此之前,高通一直致力于无线网络边缘终端侧的耕耘,推出了四代基于骁龙平台的AI芯片。从终端到云端,高通一个更为完整的AI版图呼之欲出。
4月23日,特斯拉的自动驾驶芯片公布。
这款马斯克口中“世界上最好的自动驾驶芯片”,与上一代由Nvidia驱动的硬件相比,据称每秒帧数处理能力提高了 21 倍,可使每辆车的硬件成本降低约 20%。这项重磅芯片系统的研发、更新、量产和应用无疑需要耗费无数心力与金钱,能不能撑住这个“世界最强”,还要看特斯拉的长远表现。
瑞芯微:老牌企业拥抱AIoT
去年,在全球前20名的AI芯片企业排名中,中国大陆仅占两个席位,瑞芯微便是其中之一。面对扑面而来的AIoT时代,瑞芯微针对视觉、图像感知、语音交互等领域,推出一系列AI芯片产品,以多种应用形态量产并商用。
瑞芯微日前在福州举办千人开发者大会,期间发布的人工智能计算棒AI加速器是一大亮点,内置的NPU算力最高可达3.0TOPs。相同性能下,功耗相比28nm工艺可降低30%左右。
这个加速棒被称为是AI、物联网从业者、开发者的“产品研发利器”,在众多与场景结合的学习能力方面被寄予厚望。开发者通过U盘大小的计算棒,外加一台Linux系统的终端,即可获得强大的算力与深度学习推理能力,大大降低了开发门槛。
而在此之前,瑞芯微的AI芯片RK3399和RK3399 Pro已经有了成熟的落地应用案例。在支付宝一款人脸支付产品“蜻蜓”中,采用的正是RK3399 芯片方案。
多年来的技术积累,深耕产业形成的敏锐触觉,以及在终端市场的强大生态链,或许都是瑞芯微在AI芯片商业化道路上先声夺人的主要因素。
云知声的AI哲学:“全栈”和“硬核”
近来,云知声的AI技术开放日很热闹,四地巡回日程过半,北京、深圳已盛大举行。以语音识别及语言处理技术起家的云知声,去年5月推出其首款面向物联网的AI芯片UniOne,采用自主AI指令集,号称性能比通用方案提升超50倍。
谈及造芯动力,云知声创始人/CEO黄伟说,“在AIoT市场加速爆发的今天,云端方案在网络、带宽、能耗、隐私以及边缘计算等方面的限制,使得面向物联网的AI芯片成为必然抉择。”不论是CPU还是GPU、FPGA,现有的芯片架构并非为 AI 专门设计,并不能满足物联网AI算力需求,且考虑了太多的向后兼容性,因此在性能上远非最优。“基于业务方面对芯片产品、场景的反复验证,以及对AIoT终局的判断,云知声在2014年就明确必须自主研发面向物联网的AI芯片。”黄伟表示。
在今年的技术开放日上,云知声董事长/CTO梁家恩将云知声的 AI 哲学概括为“全栈”和“硬核”,
所谓全栈是指贯通技术创新到产业应用的价值闭环,硬核则指破解产业规模化应用难题。四大“硬核”技术包括:语音感知与表达,语言与知识计算,AIoT芯片落地,超算平台与图像、翻译拓展。
2014年开始布局AI芯片,2016年正式启动,2018年拿到第一块芯片——云知声的AI造芯之路算是稳健。芯片对于云知声的战略布局有多重要?梁家恩表示,这是规模化量产中最重要的硬核技术。面向方案商与开发者,可提供更完整的AI 应用参考方案,帮助客户更快、更高效地打造AI未来应用。
在云知声的“云端芯”生态中,AI芯片还将发挥哪些作用?值得期待。
嘉楠耘智:区块链巨头的AI摘星之旅
作为区块链领域数一数二的企业,嘉楠耘智涉足AI可以说是顺势而为。如果说区块链是当时的脚踏实地,那么AI就是必须要仰望的星空。幸运的是,嘉楠耘智这场摘星之旅开始得够早、够及时,目前已经小有成果。
2016年,嘉楠耘智开始了AI造芯之路。历时两年,
于2018年9月发布量产RISC-V商用边缘计算芯片勘智K210,该芯片是一颗集成机器视觉与听觉的SoC,定位于AI与边缘计算领域。
“AI市场化需要高效、可靠且有一定性价比优势的芯片来为相关应用提供计算平台。嘉楠耘智起步于区块链领域,专注于高性能、高算力的ASIC芯片设计,可以通过这些积累来把握AI落地的机遇。”嘉楠耘智销售总监黄波说。“我们的AI产品计划,将着力为客户提供高度定制化和弹性化的解决方案,与合作伙伴共同打造生态系统并实现技术与商业的双赢。”
勘智K210支持8路麦克风阵列预处理流程,通过多路麦克风阵列信号采集,并结合对应的算法,可实现声源的方向识别。同时,基于芯片和人脸识别AI算法能力,可以将预先录入的人脸图像与对应用户人脸进行特征比对,从而进行身份权限管理。搭配智能云台摄像头可以进行目标人脸追踪和捕捉。
通过深度神经网络处理器,勘智K210能够灵活运用图像识别、语音识别、视频处理、信息检索等功能。可应用于智能家居、新零售、物流检测等场景,还可以为未来社区、智慧城市提供整套解决方案。
勘智K210采用RISC-V架构,双核处理器,最高主频400M,拥有CNN神经网络加速单元、KPU和音频预处理单元,单芯片可实现图像和语音识别能力。
在区块链的技术、资金和资源积累,对嘉楠耘智在AI领域能起到哪些推进作用?由于矿机芯片出货量巨大,嘉楠耘智已成为台积电在中国市场的前五大客户。在ASIC芯片设计和自研算法方面的积累,都有助于设计和产品化的快速推进。
如何看待AI芯片市场当前的竞争格局?黄波表示,从资本和技术角度来看,国际巨头仍处于优势地位。从芯片架构角度来看,AI时代完全不同于以往。它有着大量丰富的应用,技术路线有分散、碎片化的特征,因此终端需要实现很多可定制化的功能,也需要芯片架构更有弹性、更为开放。
正是如此,嘉楠耘智不遗余力推动着RISC-V商用边缘计算芯片的落地。“x86架构在PC领域的成功毫无疑问,ARM架构在移动终端一时风头无两。一个处理器架构能在一个时期胜出,最主要还是它适应了本时期产业发展的需要。现在,
RISC-V在短短几年时间迅速被业界认可,主要原因是它满足IoT边缘计算的需求。”黄波表示。
在AI领域,嘉楠耘智目前主要聚焦于本地边缘计算。“去中心化的技术是我们的信仰,”黄波强调,“许多数据并不一定需要发送到服务器去处理,例如采集的声音、人脸,本地端就能够实现存储识别,这对于提高处理效率、保护消费者隐私都大有益处。”
“基于RISC-V的解决方案大量落地仍需要两三年时间,我们已经率先实现商用。下一步,将继续致力于优化功耗控制,将单位晶圆下的算力发挥到极致。”黄波表示,“算法方面我们也更欢迎与更多的第三方伙伴进行合作,共同打造生态系统建设,推动在更多行业的落地应用。”
结语
集成电路与其他行业的最大差别在于,玩家除了要拥有规模和成本优势之外,决胜关键关乎持续的创新能力。芯片作为高投入、高尖精的技术,布局不仅要看眼前,更要看未来,要做好深耕五年十年甚至几十年的准备。
这样的行业和技术属性,注定了AI造芯本身就是一场冒险。
但值得庆幸的是,经历了轰轰烈烈的造芯大潮,我们看到越来越多的芯片走向落地应用。
而随着IoT的大规模实施、5G商用的到来,AI的落地应用也有望得到革命性的进展。
好戏才刚刚开始。