海岸语音石伟:声矢量技术带入消费级市场还远远不够 我们的目标是整条语音技术链条

电子说

1.2w人已加入

描述

互联网发展至今,面对人工智能大时代的到来,智慧、高效、便捷的人工智能研发应用,发展智能产业成为科技行业工作的重中之重。协会特派记者走进深圳海岸语音技术有限公司,对石伟总经理进行了智能语音行业相关专访。

深圳海岸语音技术有限公司创始人、总经理 石伟

记者:智能语音作为人工智能应用最成熟的技术之一,科技巨头、初创公司纷纷布局,海岸语音是怎样定位与布局?

石伟:从人机交互形式出发,语音识别无疑是人工智能产品与用户之间,最便捷有效的交流形式。语音交互技术链条较长,包括语音识别前端处理、语音识别、语义理解、语音合成等环节。在语音识别方面,百度、科大讯飞、谷歌等技术领先。我们主要做语音识别前端处理的技术,是一家专注于智能听觉感知技术的人工智能初创企业,面向物联网和人工智能时代,提供软、硬件结合加云端引擎的一体化智能听觉感知技术解决方案。

记者:海岸语音的产品及应用有哪些?

石伟:有别于传统的标量麦克风技术,我们产品所采用的是声学矢量传感技术,可同时测量声场的声压信息和方向信息,该技术最早源于潜艇的矢量水听器,在空气中的应用极少。我们团队历经 8 年研发,打造出 AI 时代必不可少的“机器耳朵”:VecSense ™ 智能声矢量传感器。该传感器是世界首款消费级声矢量传感器,可以应用在机器人、智能音箱、家电等诸多领域。

记者:海岸语音的核心竞争力体现在哪些方面?

石伟:把产品做小、成本做低(几美元左右)是我们研发的方向。目前 VecSense ™ 智能声矢量传感器比一毛钱硬币还小三分之一,性能高、成本低、体积小的特性使其在智能语音、机器人、智能家居、无人机、穿戴式设备以及智能车载等领域都有广阔的应用前景。

作为 AI 时代机器必备的器件之一,“机器耳朵”需要更多的信息实现其智能的特性,这是传统的标量麦克风所面临的局限性。虽然在声学传感器的发展史上,各大研究机构尝试了通过多种方式获取除了声压信息以外的声音方向信息,但这些技术都具有各类不同的缺陷,使其无法在消费级产品中使用。

我们在小尺寸的单颗传感器封装内实现平面 360°声音定向,并内置多种语言 / 音频智能算法。不仅在听音辨位、抑制干扰、远场拾音方面表现出超强的性能,因其独特的信号特性还能做到出色语音分离,让智能机器同时听懂多个说话人的指令。

在数量、尺寸、功耗和成本方面,一颗 VecSense ™传感器对应四至八颗传感器组成的麦克风阵列,显然具有突出的优势:尺寸减少 70%,功耗降低 90%,同时成本可降低 90%。

记者:海岸语音发展过程中有遇到哪些困难?

石伟:目前我们产品还未正式推向市场,产品还在不断地优化,找到行业典型应用是将要面临的一大挑战。在未来推向市场的时候,产品的正式落地希望能够找到知名度较高的产品或厂商背书,进一步打开市场。

记者:石总怎么看待科技巨头与初创公司在智能语音领域的发展模式?

石伟:科技巨头主要打造开发者生态系统,使用算法平台吸引开发者,实现数据的快速积累、产品的快速迭代。目前,在国内智能语音领域,科大讯飞是做得比较完善,一整条产业链相关技术产品都有涉及,并将自身语音技术植入相关合作伙伴的产品中,以推动智能语音和人工智能技术在家居、车载、可穿戴等领域的落地。

初创公司目前以垂直领域和细分场景为突破口,切入产品场景应用。初创企业不应求大、求全,而是结合自身优势做最“性感”的技术和产品。

记者:海岸语音未来有些什么规划?

石伟:海岸语音目前专注语音识别前端处理,未来将从前端向一整条语音技术链条进行渗透,实现音频和视频融合的人机交互。我们会将底层的技术打包为完整的交互解决方案,服务 B 端客户。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分