在CES 2018上语音和人工智能应用的大爆发

NJ90_gh_bee81f8 2018-01-16 3409

电子说

1.2w人已加入

描述

在今年的国际消费电子展(CES 2018)上，语音(voice)、连接(connectivity)和人工智能(AI)成为最受关注的焦点。如果说今年的CES能为我们带来什么指标，那么这三项建构模块将是组成2018年及未来消费电子设备缺一不可的神圣“三位一体”。

语音助理已经准备好进入可穿戴设备、耳机、婴儿监视器、灯具、电视遥控器和车辆。DSP Concepts创办人兼首席技术官Paul Beckmann在接受《EE Times》时说：“我们似乎正见证着一场围绕着语音的‘寒武纪大爆发’。”

DSP Concepts首席技术官Paul Beckmann

在CES上，被称为“中国Google”的百度大力向开发商展示并开放其基于Duer OS的平台。无论是其声控台灯或挂在天花板上的投影机和屏幕，都不需要Alexa或Google Assist。就像百度常挂在嘴边的“中国速度”，越来越多的厂商开始朝向语音发展。

百度展示了一款整合台灯功能的声控智能喇叭（来源：Baidu）

消费设备必须具备连接能力已经是不争的事实。Silicon Labs首席执行官Tyson Tuttle强调，接下来的必备功能是“混搭”不同的无线网络。他解释说，直接将原本为智能手机设计的连接芯片加进物联网(IoT)设备，已经无法满足要求了。系统需要动态的多协议软件，以及为不同的无线网络划分时间的能力。

尽管AI在高度自动化汽车中占据主导地位，但Ceva首席执行官Gideon Wertheizer告诉我们：“我看到AI开始摆脱幻想世界。”供应商如今正试着“设置参数，在随机环境中使用AI来解决特定问题。”
Ceva首席执行官Gideon Wertheizer

换句话说，许多公司开始学习在小规模应用中导入AI，并将其用于特定任务，而非依靠AI来解决世界上的问题。

语音随车上路

无论是在家庭或开车行驶中，语音都将至关重要。

博世(Robert Bosch)在CES宣布计划将其语音助理设计在方向盘后方。博世管理董事会成员Dirk Hoheisel表示：“我们正致力于让驾驶舱内的按钮乱象划下句点。”Elektrobit在CES上承诺，该公司将成为亚马逊(Amazon) Alexa的第一批汽车软件整合商之一。

Bosch开发“自然语言”车内语音辅助系统（来源：Bosch）

百度宣布其基于Duer OS的Apollo 2.0平台被称为“自动车辆的Android”，并称语音辅助系统将成为该平台的一部份。百度总裁兼COO陆奇表示：“家庭与车辆之间已经不存在界限了。无论你在家中做什么，应该也都可以在车子里实现。”

Wertheizer则指出，无论是在家中还是车内，隔离声音以及直接向云端发送清晰的讯号都非常困难。 “我们的周遭充斥着噪音和噪声着。”很自然地，家庭和汽车的解决方案必须能够因应一连串完全不同的嘈杂环境。

语音算法缺少标准

让问题变得更复杂的原因在于业界还没有任何标准的语音算法。

Wertheizer表示：“每一家公司都有自家处理语音的专有算法。”

系统业者开始求助于学术界发表的技术论文，竞相找出如何最有效隔离语音的解决之道。而当他们使用不同的麦克风和扬声器类型时，还必须优化其算法，以因应不同的设置要求。

而在Ceva，Wertheizer说：“我们必须建立一个类似原子庇护所的工作室”，用于研究所有的选择，并开发波束成形、远场和近场、回声消除和环境降噪等算法。

Beckman也呼应了这个观点。就像人们喜欢语音作为自然的用户接口一样，他说：“遗憾的是，对于实际执行的产品设计人员来说，它是最具挑战的技术之一。”他已经看到了太多的语音项目出错了，最终得回到草图阶段重新开始。

Beckman曾经在Bose Corp.担任研究工程师长达9年，在2000年初成立了他的咨询业务。当他与客户讨论语音项目时，他发现业界需要一套有效执行的“完整软件解决方案，以及能为其实现差异化的底层技术”。但是，最主要的关键在于赋予其能够自行调整系统的能力。

随着语音市场爆发，Beckman的业务也随之成长。DSP Concepts不再只是一家咨询公司，现在还提供了一套完整的算法作为软件库和除错工具，有助于客户调整系统。Beckman说：“我们提供调整、整合和验证工具。”

语音UI解决方案需要一套完整的算法（来源：DSP Concepts）

DSP Concepts的语音用户接口(UI)技术称为Audio Weaver，它是第一家获得亚马逊(Amazon) Alexa产品认证的第三方软件公司。DSP Concepts共同创办人兼首席执行官Chin Beckmann展示一款Audio Weaver语音助理产品——相较于亚马逊Echo使用了7支麦克风，Audio Weaver仅用了2支麦克风，据称就能够“听”得比Echo或Google Home更清楚。

在边缘实现AI

Wertheizer说，隔离语音是第一步，但接下来还有其他步骤：语音助理必须辨识语音的位置，而且必须能够追踪语音。而且，它必须能侦测以及辨识谁在房间里说话。

直到最近，云端才刚被认为是处理和学习的地方。如今，这个假设将在2018年发生改变。

Wertheizer解释说：“我看到人们对于AI的态度越来越务实。他们希望在边缘设备执行AI而非在云端进行，以避免隐私、延迟和成本等问题。”

联发科技(MedaTek)首席财务官顾大为对此表示认同。相较于亚马逊在其Echo设备中推动云端到云端的服务，联发科看到了“边缘和云端”融合模式的可能性。他在CES时告诉我们，语音助理竞赛如今已经着重于在本地增加“智慧”、区别人类与非人类的声音分开、消除背景音乐、辨识声音模式等。

Petcube Wi-Fi宠物照相在远程进行机监测并与宠物互动（来源：Petcube）

Wertheizer说：“以Petcube设计的交互式Wi-Fi宠物相机为例，它能在主人不在家时，透过双向音讯和1080p高分辨率(HD)视频摄影机进行监控，以及与狗或猫互动”。Wertheizer说：“我不确定Petcube是否意识到这是一家物联网公司。但是，像这样的连网产品中，语音识别系统显然必须能够辨识狗吠声，并且确定狗是处于压力还是处于危机之中。换句话说，系统需要有智能才能进行学习。”

Neupro低功耗AI处理器

虽然Ceva为语音系统的设计者提供了名为ClearVox的语音算法，但它也知道系统厂商需要的更多。系统制造商希望在其物联网设备中整合学习和推论的能力，使其产品能够持续变得更加智能化。

目前的市场上亟需AI处理器。为了满足这一需求，Ceva在CES上推出了NuePro，这是一款“专用的低功耗AI处理器系列，用于在边缘进行深度学习”。NuePro是一款独立的专用AI处理器，可广泛用于物联网、智能手机、安全监控、汽车、机器人、医疗和工业等市场。

Ceva推出AI处理器（来源：Ceva）

值得注意的是，Ceva并非深度学习领域的新手。据报导，NeuPro是以Ceva在计算机视觉应用深层神经网络方面的经验为基础。

Wertheizer说，NeuPro AI处理器是Ceva从头开始研发的第一款“非DSP”技术。他在发布Neupro时说：“我有点紧张。但是你必须知道AI并不是讯号处理方面的问题。”

NeuPro处理器搭载两个硬件——NeuPro引擎和NeuPro VPU (向量处理单元)。Wertheizer指出，虽然引擎处理定义良好的人工智能算法，如CNN、启动和规范层，但是，可编程的向量引擎NeuPro VPU是执行专有AI算法的一种延伸。“我们选择了这种硬联机的建置方式，而不是使用GPU或CPU，让我们能够增加AI处理器的利用率。”

Ceva声称，这款新的专用AI处理器系列带来了“相当高的性能提升，从入门级处理器的2TOPS到为最高阶配置的12.5TOPS”。
NeuPro硬件模块；Ceva首席执行官Gideon Wertheizer强调，“NeuPro VPU和NeuPro引擎之间的无缝切换至关重要”。（来源：Ceva）

Ceva表示，NeuPro AI处理器将于2018年第二季向客户提供授权，并计划在第三季全面发布。

同样地，联发科准备推出一款由意腾科技(Intelligo Technology)设计的AI处理器和算法。Intelligo是2016年时从联发科独立而出的新创公司。

Intelligo设计的这款AI SoC被称为“智能DNN语音处理器”应用范围较有限。联发科表示，该处理器提供“可配置的深度神经网络和高效率推论引擎(每秒每瓦特1 TOPS运算性能)”。

顾大为表示，联发科正在寻找一种小型的AI加速器，为辨识20到30个关键词而设计。另一方面，联发科也正推广其“分布式处理”的观念，期望语音和AI功能不只是整合于像Echo或Google Home的智能音箱，而是更落实于广泛的小型设备——如电灯开关。

打开APP阅读更多精彩内容