音视频及家电
(文章来源:猎云网)
近年来,全球智能语音市场呈现连年增长的趋势,预计到2020年,全球市场规模将达到191.7亿美元——相比2015年的61.9亿美元,四年内其增长速度翻了三倍多。当前,语音识别在行业落地遇到的最大问题,是行业数据与需求的不对等,即语音识别缺乏专业性。纵使是语音识别头部企业,也很难覆盖到各细分市场,从而导致行业整体识别率提升困难。
从技术角度来看,当前NLP(自然语言处理)的发展仍面临着“四大挑战”:词法、语义等不同层面存在着不确定性;新的术语和词汇等导致未知语言现象的不可预测性;数据资源的不充分难以覆盖复杂的语言现象;相关语义知识等难以用简单的数学模型描述,对参数庞大的深度模型需求迫切。所以,NLP并未真正实现技术突破,这也使得整个语音领域的产品落地与客户期望之间存有一定差距,尤其是在客服、问答等领域。
近日,猎云网接触到语音界的新生力量——北京孚睿星辰智能科技有限责任公司(FreeNeb),其是一家专注语音处理技术研究,并面向企业提供“独具一格”的声纹识别和语音识别解决方案与专业服务的创业公司。FreeNeb依托清华大学语音AI核心技术研究力量,目前在语音、声纹识别等语音相关领域已取得一系列成果。
其核心产品包括语音及声纹识别服务私有化平台、嵌入式语音和声纹识别服务,同时配套了智能语音翻译、智能语音门锁等多种解决方案。现已触达到教育、金融、政府、客服等多个领域。FreeNeb COO刘荣在接受猎云网采访时表示:“基于目前整个语音领域的产品落地情况,FreeNeb要做一个为企业量身定制的语音优化工具,旨将语音识别技术经验做成一个简单可用的工具。“
近年来,FreeNeb在产品定位上:旨要做一个标准化、可应用、高效率的语音优化工具,并且未来这将会是一个可铺量的标准化工具。FreeNeb日前推出产品“创新企业开放语音平台(CeaOS)”是由智能语音创新企业开放联盟(CeaFos)支持的企业级私有引擎开放系统。其从本质上看,CeaOS系统是一款服务于中小企业的“语音识别优化工具”。
中小企业及微小型创企都可以利用该开放平台免费获得企业级语音服务引擎,从而可以自由地打造属于自己企业的“专业语音服务”。目前FreeNeb的产品工具已达到标准化,同时上线了语音识别私有引擎和自适应训练平台,若究其技术原理,便涉及到声学及语言两种模型。
声学模型在技术上称为自适应学习,是根据语音数据中不同人的年龄、性别、生理等造成的差异来进行声学模型的提升,在原有的基础上进行自适应学习。整个过程就像是做一个迁移学习,让模型学会这种变化、差异,使其更偏向于数据所描述的特定领域。而语言模型则是将语言转化成文本时的专业术语转化率,而这需要相应行业领域内的文本数据,让语音识别引擎知道更多的行业知识,从而再面对时会变得更加聪明。
CeaOS的主要目的是让更多初创企业可以获得免费的语音技术,从而减少语音产业落地过程中的摩擦成本。另外,对于行业用户,FreeNeb推出私有化训练平台解决方案,提供用户私有化学习功能,一键训练快速提升,可以应用到电话端语音识别、网络端语音识别等场景。目前已有行业用户应用到金融端的呼叫中心应用解决方案中。
当下声纹识别的应用较为广泛,其技术在各个领域都有渗透。自2016年起,中国建设银行便应用了手机声纹支付。不仅如此,声纹技术也同样应用于:呼叫中心的反欺诈及VIP认证,智能手机华为、三星的声纹唤醒技术,社保中的远程认证等。目前FreeNeb的声纹技术主要应用于银行金融领域、安防领域、智能硬件领域。与此同时,FreeNeb在与具体企业业务上的结合也正在打磨,得到了来自各方企业的一致认可。
值得一提的是,从目前智能语音市场来看,其中不乏做语控及声纹的厂商,但致力于将声纹与语音技术融合的厂商——FreeNeb是第一家。一方面,FreeNeb依托清华语音AI核心的力量,声纹技术早在清华实验室中积累了十几年的丰富经验;另一方面,FreeNeb发起人王东专注于语音识别技术研究已有20多年,经验极为丰富。此外,目前国内声纹市场刚刚兴起,声纹技术人才相对短缺,FreeNeb团队具有天然优势。
目前FreeNeb正在与相关公司进行合作,推出声纹门锁模组,在原有指纹静态特征的基础上又融入了声纹动态特征,安全性极高。此外,FreeNeb在产品落地的设计上也独具一格。其注重在边缘端上发力,用户的数据信息不需上传至云端服务器,直接在边缘端上进行处理,用户可随时请求数据在边缘端进行删除,此举有效地保护了用户隐私。
全部0条评论
快来发表一下你的评论吧 !