2018年Q3中国最火的智能音箱!秘密竟然是远场语音技术

描述

本站原创,作者:章鹰,电子发烧友执行副主编。

美国研究公司Strategy Analytics近日发布了《2018年第三季度全球智能音箱市场报告》。报告显示,全球智能音箱出货量第三季度达到2270万,同比增长197%,创历史新高。亚马逊在第三季度依然市场占有率最高,占据了32%的份额,谷歌以23%的份额紧追其后。百度的加入改变了全球智能音箱的市场格局,市场占有率猛增至8%,进入全球前四名。

语音识别

“据IDC统计,2018年第三季度,搭载百度DuerOS的智能音箱在中国市场出货量第一名,小度系列智能硬件在中国市场增速最快,市场份额增至24%。百度在远场语音技术上有很大的突破。我们和Duer OS生态一起发展,上周Duer OS产品的出货量突破2亿。这与百度远场语音技术的突破是密切相关的。“百度语音部门负责人在1月16日深圳举办的百度大脑硬件及平台发布会现场表示。

远场语音技术三大关键点

2017年年初,各家开发厂商针对远场语音技术进行军备竞赛,智能音箱的市场大战,从2017年开始到现在,是从近场语音技术到远场语音技术的过度阶段,厂商会介绍自己的远场语音技术多么厉害,现在很少有人提手机上语音识别的效果。

远场语音技术的三大关键点:第一、信号处理,没有信号处理,就没有现在的远场语音的效果,信号处理用于定位,定位算法才能创造远场语音智能;第二、软硬结合,在远场交互时代,需要与硬度深度结合,将算法、软件在硬件上打磨好,提升用户体验;第三、端到端语音语言一体化,信号处理基于端到端建模,声学模型是匹配好场景的,还有唤醒技术,采用端到端思路,对端到端词汇进行建模,再将唤醒技术和信号处理技术结合,下沉到Duer OS系统层,才能达到很好的唤醒效果。

语音技术软硬一体化解决方案

教会机器听懂人话的过程,就是通过深度神经网络训练声学模型和语言模型的过程。而一些公司宣传的机器识别准确率过高,速记员都达不到这一水平,还有很多相关的工作需要去完成,不能单靠深度神经网络的方法来实现。语音识别准确率涉及多方面原因,例如远场精确识别就是业界难题。

“最新一年百度在语音技术上两大进展:一次唤醒多次交互技术,技术特点是信号尾点和语义尾点联合优化模型;第二点,针对声学模型和语义模型做双重的置信度模型,在唤醒一次后可以和机器进行自由交谈,技术的关键点是将干扰信息去除。需要端到端的思路,用信号衰减的思路,配合声纹技术,进行交互。这个技术会在小度系列的硬件产品落地。” 百度语音部门负责人解释说。

百度在远场语音交互技术突破,包括一次唤醒多次交互技术以及 SMLTA 模型,SMLTA 模型在百度输入法正式发布这个技术,特点是语言和语义进行建模训练,这个模型可以跑在手机端,取得和在线识别媲美的效果。

百度历经一年多的打磨和开发,全新推出了百度远场语音开发套件,包括远场语音端到端技术、两款分别主打高性能和高性价比的计算板卡、3种形态的麦克风阵列,形成了环形6+1麦、线形4麦和车载3麦的多形态麦克风阵列套件方案。

“让硬件制造商、ODM、OEM做智能音箱、智能电视、语音机器人、可穿戴设备和车载可以在百度大脑上找到和使用语音开发套件。我们希望提供一条产业链,让上下游合作起来。” 百度语音部门负责人强调说。“这套开发套件的优势,灵活、快速让开发者对接自己在场景中的资源,对接语义理解能力,对接知识库。“

百度远场语音开发套件基于端到端方案,严格按照最佳技术实践指导生产,可解决语音交互产品研发过程中无可用设备选型、选型调试成本大、调试效果不佳等问题。该方案支持回声消除、声源定位、波束形成、噪声抑制等处理算法,一、三、五米识别和唤醒效果优于同类产品,目前已落地150多款产品。

车载三麦克阵列,车上语音识别要求比较高,不仅是主音区,而且是双音区的语音识别,除了主驾驶位,还包括副驾驶位,百度车载三麦克钝角阵列放置在车顶,可以轻松实现主音区和双音区的语音识别,解决方案已经在百度车联网联盟内的被多个车厂采用。百度还在做DSP相关技术,配合麦克风阵列,价格更有竞争力。

主流芯片价格透明,两年原厂开发经验,主板方案非常有竞争力。合作模式:语音端到端产品,开发时间长,需要重新开模和设计,直接贴牌,提供产品原型,在这个基础上做二次开发;线下做开发,把方案放入适用的产品内部。

百度大脑AI硬件生态联盟

发布会现场,百度联合首批合作伙伴成立百度大脑硬件生态联盟,首批联盟伙伴包含芯片厂商赛灵思,摄像头模组厂商奥比中光、睿识、慧谷航天,开发套件厂商天启,终端设备厂商华正联等等。作为联盟发起人和组织者,百度大脑希望与联盟伙伴一起,共同制订端计算与AI硬件标准,共同促进和繁荣AI落地应用。



百度大脑也将对联盟合作伙伴提供深度技术支持、渠道支持、品牌授权、产品折扣和运营资源等权益,全面开启AI技术终端化的大门,赋能合作伙伴的同时为产业带来加速的交流和融合。正如百度AI技术生态部总经理喻友平所言,人工智能若要长期推动各个产业的升级与优化,需要合作伙伴的共同努力,打造适合AI发展的健康环境。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分