智能家居新的增长点——离线语音

模拟技术

2409人已加入

描述

在阿里巴巴以天猫精灵的智能音箱为核心载体,大举进军智能家居市场的形势下,也许带给业界的有两点思考:智能家居正在被巨头带热,智能语音在智能家居的重要性突显。
 
智能语音分为离线语音、在线语音以及离线+在线三种。电子发烧友网记者从最近的行业走访来看,离线语音的智能家居方案正在兴起,并在智能家居的单品和全屋智能中大力出货。
 

提升智能单品、智能家居的智能化和体验

 
智能语音晾衣架是一个比较火爆的单品,智能语音晾衣架品牌主要有好太太、晾霸、晒霸、邦先生等等。电子发烧友网记者从渠道了解到,晾衣架企业正在将部分传统晾衣架产品逐渐转向智能语音,以提升产品的价值和智能使用体验。
 
中国建筑装饰装修材料协会晾衣架专委会数据显示,2017 年我国电动(智能)晾衣架出货量约为 350 万台,连续两年增速接近 100%,增长迅速,预计未来随着用户认知度提升,智能晾衣架渗透率也有望快速提升。
 
在采访中,电子发烧友记者看到智品惠推出的一款离线语音淋浴屏,在流水声等嘈杂环境下仍能够控制自如,还可用方言进行编辑。智品惠科技总经理李希途表示,离线语音已经成为家居市场的一个新选择,以其更快速的响应、更亲民的价格,新颖的产品形态满足市场的需求。
 
实际上,全屋智能的控制类产品都是离线语音的主战场。阿凡达智控总经理冯惠军博士在接受电子发烧友网采访时表示,离线主打控制,在线主打交互,是目前智能家居落地比较亲民的一种模式,从市场端他们也感受到这股热潮。
 
阿凡达的离线语音方案可控制家居的照明、空调、电视、窗帘等物品的开关,其控制时间最短仅需0.2秒,相较在线语音的体验,交互效率大大提升。这个离线语音模块能够以智能音箱的形式独立存在,成为家居的中控,也可以安装在例如台灯、吸顶灯等家居用品上,十分方便。
 
阿凡达提供了一套离线语音全屋智控生态系统,涵盖以小宝精灵为中心,通过匹配红外家电遥控器实现传统家电的声控,通过配套RF智能单火开关面板、RF随意贴无线开关、RF智能插座、RF通断器、RF开合窗帘等功能拓展设备,实现了照明、家电、遮阳管理、电源管理等由离线语音打造的全屋智能生态。
 
不同于在线语音交互对云端的依赖,离线语音技术可以让设备本身具有交互能力。优势是无需网络,无需APP,无需布线,插电即用,本地识别,轻松唤醒,反应灵敏,后续维护服务少等。冯博士认为,离线语音的特性满足了用户对家居控制的基本需求,成本低易于推广,这个市场处于爆发的前期。
 
从渠道反馈来看,以单品看,目前离线语音控制空调的智能插座出货量比较大。智能家居、酒店、民宿等市场对离线语音的需求正在放量。
 
 

离线语音方案有哪些?

 
前不久,Google推出了Google Local Home SDK,通过边缘计算在本地进行语音识别,不用在云端处理。电子发烧友网记者了解到,目前可实现离线语音方案的芯片包括启英泰伦、国芯、思必驰、互问、新唐、君正等等。
 
 
启英泰伦:人工智能语音芯片CI1006和最新CI110X系列
 
2016 年 9 月推出了全球首款人工智能语音识别芯片 CI1006,并于 2017 年 1 月实现量产。这是全球首款 DNN 处理器内核人工智能语音芯片,具备高 NN 算力、高识别率、远距识别、快速响应、超低功耗等特性。  
 
2019年9月发布第二代语音 AI 芯片 CI110X 系列集成了更丰富的功能、拥有更强大的性能、同时具备更低的成本和功耗。
 
CI110X 系列基于 NPU+MCU 架构设计,内置升级了的脑神经网络处理器 BNPU v2,并新增了语音加速传感器。CPU 主频也较上一代的 100 MHz 提升到了 160MHz。
 
同时,CI110X 系列还内置高性能低功耗 Audio Codec 模块和硬件音频处理模块,可以外接麦克风实现单芯片远场降噪和回声消除等功能。同时该芯片还集成多路 UART、I2C、SPI、PWM、GPIO 等外围控制接口,可以开发低成本的单芯片智能语音离线识别方案。
 
而通过内置的高速 UART 或 SDIO 接口对接 Wi-Fi、蓝牙等无线模块,实现离在线语音方案。基于 CI110X 系列芯片开发的产品,语音交互的基本功能可通过离线语音实现,而语音内容和服务则可以通过联网实现。
 
杭州国芯:GX8008和GX8009芯片
 
GX8008芯片是专为智能语音前端信号处理而设计的嵌入式SoC芯片,支持麦克风阵列,集成专用于语音信号处理的DSP处理器,内置处理前端信号的语音算法,可以让传统的设备保留其原先硬件的基础上,通过一个简单的USB口实现语音能力的升级。独特的待机模式,可以让主机完全休眠,只用GX8008芯片来做降噪和激活,并恢复系统。
 
GX8009芯片是专为AI语音应用设计的嵌入式SoC芯片,拥有独特的多核异构架构,集成自主产权的NPU神经网络处理器,用于语音信号处理的DSP处理器等模块,使得产品能处理深度神经网络计算,离线运行麦克风阵列信号。GX8009芯片针对语音应用产品进行深度优化,可运用于多种形态的AI语音产品。
 
 
思必驰:深聪TAIHANG芯片(TH1520)
 
TH1520主要面向智能家居、智能终端、车载、手机、可穿戴设备等各类终端设备。解决方案包含算法+芯片,具有完整语音交互功能,能实现语音处理、语音识别、语音播报等功能,支持离线语音交互。
 
 
君正:Halley2 IoT模组
 
采用君正 X1000E 处理器,最高1GHz主频,支持硬件浮点,支持SIMD指令加速。可运行各类语音识别、图像识别、降噪、消回音、APE/FLAC解码等算法。待机功耗2mW,平均运行功耗200mW,最高运行功耗700mW。支持WiFi、蓝牙、以太网、LCD显示、录音、放音、摄像头、SD卡、USB 2.0 OTG、I2C、UART等。超小模块,镀金半孔PCB板,可直接量产,大大降低产品开发难度,缩短产品上市时间。硬件设计和软件Linux SDK开源,便于客户进行二次开发。
 
互问:LS416、W02x
 
LS416 是一颗高度集成化的语音处理芯片,内置互问离线语音识别引擎,支持多命令词本地语音控制应用。 内置spi flash 和高性能codec,使用低成本轻量化神经网络语音处理单元,以及低功耗MCU,支持多种逻辑应用开发。
 
互问W02x芯片 是一款高度集成的本地语音系统级芯片(SoC),自研基于神经网络深度学习的本地唤醒和前端降噪算法,无需额外license。支持多级唤醒和多个本地固定词命令词,支持多通道/多麦克回声消除功能,可作为AEC前端处理+本地唤醒,支持I2S作为super codec使用。内置深度定制的神经网络处理单元、逻辑控制单元,无需MCU处理简单逻辑。
 
新唐ISD9xxx系列:
 
此方案提供简单指令辨识与喇叭独立语音识别,并可由用户训练听从指令,一旦辨识出指令,装置就能在预先储存在芯片上的闪存中的音频提供音效。目前支持 9 种语言及多种方言。
 
在音讯功能部份,ISD9xxx系列包括一颗具备80dB SNR效能的Sigma-Delta ADC,搭配具有最高至56dB增益的可程式增益放大器(PGA),以直接连接麦克风。音讯输出是由能对8Ω喇叭输出1W功率的差动Class D放大器 (DPWM)所提供的。
 
ISD9160VI能提供对于少数字节的简单指令,例如开灯、关灯、退出、播放等语音辨识,一旦辨识出指令(关键字),装置就能在预先储存在芯片上的快闪记忆体中的音讯提供音效。
 
根据Strategy Analytics最新发布的研究报告显示,2019年,消费者在智能家居相关硬件、服务和安装费用上的支出将达到1030亿美元,预计到2023年将增长至1570亿美元。到2023年,21%将拥有远程监控和控制,设备支出将占智能家居设备总支出的52%。未来,离线语音以及离线加在线语音等多种语音形式,将更加广泛地应用于智能家居、智能办公等多种场景。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分