声音前处理专家炬芯用芯耕耘智能语音产品

CIZON 2019-03-19 2026

今日头条

1191人已加入

描述

语音识别作为人工智能发展最早、且率先商业化的技术，近几年来随着深度学习技术的突破，识别准确率大幅提升，带动了一波产业热潮。继科大讯飞、捷通华声之后，行业内又涌现出思必驰、云知声、出门问问、炬芯科技等后起之秀，在教育、客服、电信等传统行业之外，开辟出了车载、家居、医疗、智能硬件等语音技术应用新天地。与此同时，自然语言处理(NLP)作为人机交互技术的重要一环，也为此提供了助力。Siri的推出打开了语音交互的先河，不仅催生了一批语音语义创业公司，还激发了百度、搜狗等大型互联网公司在语音语义技术上的投入。

在AI快速发展的时代，语音识别技术已经陆续出现在生活日常电子产品中，如何智能芯片让机器听到且听准确人类的语言这将是一大难题。众所周知，生物识别靠人脸或指纹这类的技术都有稳定的特征，可是声纹就不稳定。一个浅显的比喻：人高兴的时候，第一天晚上唱了卡拉OK，第二天声音哑了，怎么能够在变化比较明显的生物特征上做识别是一个很大的挑战。语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号的多样性和复杂性，系统只能在一定限制条件下才能获得满意效果。在真实使用场景中，考虑到远场、方言、噪音、断句等问题，准确率会大打折扣。目前业内普遍宣称的97%识别准确率，更多的是人工测评结果，只在安静室内的进场识别中才能实现。

行业专家表示：想要让语音识别更加准确，需要解决两方面的问题。一方面，在语音增强、麦克风阵列以及说话人分离等多项技术领域持续投入，并结合后端语义，促进对上下文的理解，从而提升识别效果;另一方面，需要从产品设计上进行优化，比如通过进一步交互，使语音识别变得更为准确。在端侧主控芯片上来讲，应该研发出更高端的主控芯片，在声音前处理方面有更加优秀的表现，让拾音的距离和效率都能大幅提升。国内AI芯片主力供应商炬芯科技作为领先的声音前处理技术代表，凭借其20余年对声音研究的经验，曾推出的智能音频和智能机器人芯片备受国内外知名品牌商的青睐，且一直坚持对声音领域的不断投入和研究，坚持通过技术更好地捕捉声音，降低干扰，让有效的声音信息传送至智能机器的“耳朵”。

ATS3605(D)就是炬芯近两年一直在主推的智能语音平台，此芯片的语音前处理算法非常强大，尤其在降噪方面有非常好的表现。ATS3605(D)在相关平台上整合了语音前处理算法、本地语音识别、唤醒、VAD等终端语音的核心算法，对接阿里/Baidu后台，支持LCD显示，支持摄像头，并提供完整的智能语音解决方案。目前应用到的领域包括智能儿童机器人，智能音箱，智能家居中控等产品上，行业口碑甚佳。

通过深耕垂直领域和细分赛道，实现自我造血和快速成长，任何一家公司有机会在这一新兴产业中逐渐做大。接下来，随着语音识别和NLP技术的逐步成熟，智能汽车、智能家居、智能机器人产业的日渐完善，定会有一批优秀的技术类公司在智能语音产业的浪潮中顺势而起。

打开APP阅读更多精彩内容