在设计智能音箱和其他语音功能的设备,例如可穿戴设备、可听觉设备时,开发者面临的首要挑战是如何让麦克风准确有效地检测 “Alexa ”和 “Hey Google ”等唤醒词,以便在云端处理。
当DSP Group推出支持语音的语音系统级芯片(SoC)DBM10时,EDN向该公司SmartVoice芯片的产品经理Yosi Brosh提出了这个问题。这款基于DSP和神经网络(NN)加速器的双核SoC,针对电池设备中的语音和传感器处理进行了优化,如可听、可穿戴设备、真正的无线立体声(TWS)耳机和智能家居遥控器等。
上图:用于语音智能产品的DBM10芯片宣称的采用平台方式,具有全面的软件框架支持。
Brosh表示,像亚马逊网络服务(AWS)这样的云平台对在芯片上配置寄存器不感兴趣。相反,这些云服务关注的是语音算法如何高效检测唤醒词。Brosh说“他们希望算法能够检测到唤醒词,而不需要工程师花费大量时间研究和配置芯片上的寄存器。”
因此,DSP Group开发了一个API,使语音检测算法很容易集成到云服务中。他补充道;“在某种程度上,云服务提供商的语音算法成为芯片的黑匣子。”
通常的做法是,设备制造商发布带有麦克风设置的软件代码,并告诉算法提供商如何在麦克风驱动中集成算法。以DSP Group的DBM10芯片为例,它使用语音固件采集音频,使语音采集算法的集成变得高效简单。
DSP Group一直在与十几家云公司密切合作,其中包括阿里巴巴、亚马逊、百度、谷歌和三星,同时在其芯片上移植他们的语音算法。据Brosh介绍,该公司在某些情况下还提供一套完整的软件。
该芯片能够为系统设计人员提供简单的部署路径,Brosh表示,公司对运行在DBM10语音接口芯片上软件的支持一直提供到生产层面,“系统工程师不需要编写一行代码”。
这就是为什么DSP Group称其DBM10芯片为完整解决方案的原因。该SoC通过通用DSP和名为nNetLite的神经网络处理器对音频算法以及传感AI算法进行了优化。除此以外DSP Group还提供运行在Wi-Fi芯片上用于与DBM10芯片进行通信的额外驱动程序。
SoC还具有跨平台的工具链,支持所有常用的人工智能(AI)和机器学习(ML)框架,以简化算法部署。工程师们可以开发、训练和测试算法,然后将算法以标准格式保存,工具链会将其提取并创建一个图像,下载到SoC中。
上图:nNetLite编译器可以快速优化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。
该SoC的外形尺寸很小,只有4平方毫米,可以进入像智能手表这样的极小设备。同样,在SoC的神经网络nNetLite引擎上运行的始终处于开启状态的wake word算法只消耗几微瓦的电能。
编辑:lyn
全部0条评论
快来发表一下你的评论吧 !