智能语音关键技术不断突破,市场规模将超千亿!

电子说

1.3w人已加入

描述

智能语音是智能时代人机交互的关键接口,近几年随着各行业场景需求爆发式增长,技术突破和应用落地不断深入。从全球范围来看,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长。

根据德勤统计数据,2022年我国智能语音市场将达341亿元,同比增长13.4%。我国智能语音产业整体发展环境积极向好。工信部信息技术发展司副司长王威伟表示,智能语音产业作为新一代信息技术和人工智能产业的重要组成部分,必将迎来更大的发展机遇。

智能语音技术,是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。智能语音技术的研究以语音识别技术为开端,可以追溯到20世纪50年代。随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段。

从当前的发展情况来看,语音合成技术发展最早,应用已较为普遍,除了合成音仍偏机械之外,基本不存在太大技术问题;语音识别在2012年卷积神经网络(CNN)应用之后,准确率大幅提升,已经在C端、B端得到广泛应用,但效果和体验仍有待提高。

比如语音识别鲁棒性问题显著,语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。在真实使用场景中,考虑到远场、方言、噪音等问题,准确率就会打折。

为了解决语音识别鲁棒性问题,企业从多方面进行优化,一是在语音增强、麦克风阵列以及说话人分离等技术领域投入,并结合后端语义,促进对上下文的理解,从而提升识别效果;另一方面是从产品设计上进行优化,比如通过进一步交互,使语音识别变得更为准确。

在语音识别方面,视听融合的多模态交互技术是技术演进的主要方向。据介绍,科大讯飞多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,率先在车载、会议、地铁购票和医疗挂号等场景落地。此外,针对低资源语音识别难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动技术进步。

当前智能语音应用场景正在迅速铺开。据德勤统计数据,预计到2030年,智能语音消费级和企业级应用市场将分别超过700亿元和千亿元的规模。

在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。思必驰此前表示,在中高端车型的车载设备中,具备语音交互能力的中控大屏能为车主带来高清且流畅的智能体验。

另外相对更平民化的传统车型而言,智能网联化成本高,中控大屏的智能化程度有限。针对更多车型智能化改造,思必驰推出了针对前装市场的车载“智能收放机”软硬一体化方案(联网版、蓝牙版),打造无屏版智能中控,围绕“云+管+端+手”四个维度,分别为整车赋予智能化的改造,这将有利于扩大智能语音在汽车领域的应用。

智能语音在教育和医疗领域也已经取得较大规模的应用,比如,在教育领域,科大讯飞全球中文学习平台已覆盖全球183个国家,吸引300多万海外中文学习爱好者使用;在医疗领域,2022年疫情期间,科大讯飞电话机器人助力全国31个省112个地市疫情排查,累计服务超1.1亿人次;智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。

除此之外,智能语音在城市和工业领域也有很好的应用前景。姚建铨院士此前指出,智能语音与建设智慧城市的要求吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新国家队, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。

可想而知,随着智能语音关键技术的不断突破,以及各企业、研究团队在各行业各领域的应用探索,未来智能语音的将会在更多场景中实现规模化应用,市场规模也将随之增长。

审核编辑 :李倩

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分