回顾声智科技发布全新的DSP低功耗语音交互方案参与中国用户大会

声智科技 2019-08-12 3857

描述

一年一度的Cadence CDNLive中国用户大会2018于8月10日在上海浦东嘉里大酒店开幕，作为Cadence的战略级合作伙伴，声智科技带着全新的DSP低功耗语音交互方案出席了此次大会。

CDNLive大会是由Cadence公司举办的一年一度的全球巡回用户大会。从今年4月由美国硅谷伊始，覆盖德国、日本、***、印度、以色列等七大地区和国家。大会以“联结、分享、启发”为主题，行业巨头、技术用户、业界顶尖开发者与业界专家都将聚集于此，共同分享高阶工艺芯片、复杂SoC和系统设计的技术和理念，为行业的发展提供灵感和启发。对于科技行业来说，这个集会可谓是一年一度最大的盛典。

2017年声智科技与Cadence建立了战略合作关系，开始为Cadence Tensilica DSP系列产品研发设计低功耗远场智能语音交互解决方案。本次Cadence CDNLive中国用户大会上，声智科技展示了基于Cadence Tensilica Fusion和HiFi DSP设计的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit智能语音交互系统。

融合远场语音交互和远场实时通话技术的SoundAI Voice Kit（以下简称SVK）是一款为手机、智能机器人、智能电视、机顶盒、机顶盒等消费电子产品和IOT产品提供低功耗的远场语音唤醒，语音识别，语音控制，语音搜索，远场声纹识别，远场实时通话（VoIP）等功能的理想软件解决方案。

（1）满足低功耗需求

随着亚马逊Echo、谷歌Google Home，阿里天猫精灵、小米小爱同学等产品在市场上大获成功，支持远场语音交互的智能设备越来越普及。远场智能语音交互势必是未来人机交互的新趋势。智能语音交互必然会推动消费电子品、物联网的革命，包括如汽车、家用设备，手机以及可穿戴设备。然而，耗能过高的困扰一直是制约物联网发展。

本次大会推出的SVK智能语音交互系统提供的远场语音唤醒算法，具有低功耗的特点，可以保证SoC和系统成本，也可以满足家居和移动场景的不同需求。该算法计算量少，计算复杂度低，占CPU内存小，但是语音交互的顺畅度不打折。

该算法搭载了最新的Voice Activity Detection技术，可拾取环境语音以检测和响应唤醒词或触发命令，通过关键字检测支持低功耗实时监听，实现低功耗远场语音唤醒功能。而且针对可能出现的多线程同时工作场景，也可以随时唤醒识别，不影响人机交流自然顺畅的体验，只为语音交互带来方便，不增加重量。在手机上应用，可实现锁屏唤醒、多任务唤醒、远场声纹唤醒等功能。

该远场语音唤醒算法可实现五米之内95%以上的唤醒率，支持Duel-wake（双名唤醒）、Free-cut（随时打断、随时唤醒）、One-shot（一句连控）的功能。目前，小米、百度、阿里、腾讯、华为、联想、猎豹移动等公司均采用声智科技提供的远场语音唤醒技术。

Dual-wake（双名唤醒），即唤醒词不再是单一的一个，设备可以拥有两个名字，使用任意一个名字都可以将其唤醒并进行无差别的操作，这样的设计与改进为设备后期功能扩展以及实现智能家电之间的联动留下了空间。

Free-cut（随时打断、随时唤醒）技术可以让设备任意时刻终止当前任务，立即响应新的用户需求，这就实现了连续唤醒执行新的命令，而无需等待上一任务完成后响应，随叫随应。

One-shot（一句连控），采用“唤醒词+语音语义识别”一体化方式，实现唤醒词与语音操控之间无缝对接，用户叫了设备的名字后无需等待设备应答就可以直接说出命令，无需等待设备回应“诶”、“我在”等之后才能说出命令，响应速度更快，更加符合人类语音交互习惯。

（2）匹配复杂场景

随着智能语音设备应用场景的增加，由近场语音交互过渡到远场语音交互，场景中的噪声种类越来越多，越来越复杂，对于语音交互的要求也越来越高。针对可能出现的极端噪声场景，本次推出的SoundAI Voice Kit智能语音交互系统也进行了定制优化。

集成通话降噪、混响抑制、回声抵消、噪声抑制、波束形成、增益控制等噪声抑制技术，针对远场语音交互所处的复杂应用场景，定制了OpenAEC算法，可以解决弱参考信号或者无参考信号等更为复杂场景的回声抵消（自噪声抑制）问题，可实现更加精准的唤醒。

同时搭载了针对智能家居、办公环境、车载等场景的抗强噪唤醒算法（AKS技术），保证在噪声环境中，也实现精准的远场语音唤醒。在车载环境中，针对主副驾驶的方向性降噪问题，通过麦克风阵列波束成型技术在主方向语音不失真的前提下，有效去除空调、胎噪等平稳噪声，平稳噪声抑制量大于30dB。

并在保护主方向语音的同时，去除环境中的语音、车载娱乐设施等非稳态噪声的干扰。其中非稳态噪声抑制量大于20dB，在噪音环境下可以大幅提升远场语音唤醒和识别率。解决行车过程中，主驾驶与智能语音设备语音交互易受干扰的问题，确保准确识别主驾驶方向的指令，抑制其他方向噪声。

针对家庭场景下，易出现的大电视噪声、音响噪声等非稳态噪声，声智推出了

家庭非稳态噪声抑制技术、垂直抗强噪识别技术，专门匹配相应场景，带来更出色的远场交互体验，无惧环境，想说就说，声随心动，保证远场语音交互的完美体验。

（3）快速开发集成

声智科技推出的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit是众多audio/voice/speech软硬件合作伙伴生态系统的重要支撑，通过提供包括唤醒、降噪、ASR、NLP在内的领先的语音交互技术，帮助用户快速打造自己的硬件产品，更加易于集成，易于开发，易于扩展，更安全，更自由。

一直以来，DSP芯片具有大规模集成性、稳定性好、精度高、可嵌入性、接口和集成方便等特点，而且相较于通用芯片（AP芯片），价格更具优势。随着智能电子消费品、IOT产品越来越多的涌现，目前市场还没有专门的语音芯片应用到智能语音设备中，还没有经过市场验证。

目前更多的还是采用通用芯片（AP芯片/平板芯片等）+Codec芯片/DSP芯片等组合的方式。DSP芯片通过对数字信号进行处理，包括回声消除、噪声抑制、语音降噪/增强等，使语音便于后端的语音识别，再由通用芯片进行处理传输到云端提供语音处理的计算力支持。

人工智能的大爆发给消费电子产品和IOT设备的变革塑造了更多的可能性。此次出席Cadence大会，声智科技带来的全新的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit智能语音交互系统，将更好的赋能客户的智能硬件产品快速的落地，拥有更精准的、更符合人性习惯的远场语音交互能力与智能语音交互体验。

打开APP阅读更多精彩内容