让声音还原度更高,探索Audience成功的奥秘

音频技术

93人已加入

描述

  目前旗下相关音讯处理技术广放应用在高阶智能型手机,甚至微软Kinect也有应用其技术的Audience,此次在Computex 2013期间也做了小型的技术应用讲解,透露目前将因应「二合一」装置的兴起,将大量着重于PC,甚至混合型装置的产品应用市场。

  

  Audience市场营销副总Bart DeCanne

  运用听觉神科学技术 让人声听得更清楚

  Audience本身是一家以打造DSP音讯芯片解决方案的厂商,主要技术着重于透过听觉神经科学技术来模仿人耳所听到环境声音,同时可针对环境噪音滤除降噪,并且提升自然语音部分的呈现,例如将视讯会议时的背景环境声音予以减少,进而让人声部分变得干净、容易识别。而另外的应用则是套用在智能型手机语音指令、查找等应用,不用刻意提高音量才较有办法成功被装置识别。

  而此次主要因为近期混合式装置市场越来越广,同时Intel在此次Computex 2013中也强调「二合一」使用概念,因此Audience认为可以让声音的应用可在这些混合式产品广泛整合语音输入、视讯应用等功能。以现行发展,目前Audience已经与广达、Dell有深度的合作应用,同时相关产品也套用在包含三星Galaxy S 4、LG Optimus G Pro,以及中国小米手机等,未来也将与更多厂商合作,并且相当看好未来语音应用在装置市场上的发展。

  

  目前市场已约有超过150款合作硬件装置,目前全球约超过3亿组芯片出货数量

  

  左侧较小者即为Audience DSP音讯芯片

  「听得清楚」、「听得懂」、「身历其境」

  根据Audience市场营销副总Bart DeCanne说明,Audience现行技术主要包含「听得清楚」、「听得懂」,以及「身历其境」,分别提供可将背景噪音减少,让人声语音部分更显清晰,或者是透过单一或多方指向性处理技术,可捕捉源自特定方向的声音来源,并且完成背景声降噪、去除动作。

  而借助于让语音清楚分离,亦可用于使装置能清楚透过软件或连网方式进行识别、转换语音内容,进而应用在网络资料查找、转为文字输入或简单的语音操作指令等。

  

  至于针对语音识别部分,分别Audience技术可对应最多4公尺长距离与约正常使用笔电的短距离辨识,最多可针对办公室视讯应用作多向性录音,并且在实际交由软件端进行运算时就会进行降噪,因此资料运算时将会以干净音讯内容应用。至于在麦克风数量使用规范部分,Audience目前最高可支持三组麦克风收音,而实际取得音讯质量自然会基于麦克风数量多寡,以及相关录音软件算法而异。

  此外,在降噪部分也与麦克风数量、实际算法应用有关,一般来说,在办公室或一般生活的环境噪音几乎可以顺利降噪,但如大型演唱会般有动态性环境噪音情况,可能就不是那么容易实现降噪效果。不过,随着降噪技术的演进,或许之后也有可能让降噪效果提升。

  音频芯片

  音频芯片


  除提供硬件解决方案 同时提供软件应用

  目前Audience普遍使用DSP音讯处理芯片为earSmart eS325,仍须配额外音效处理器作为辅助处理编解码,而在新一代的earSmart eS515中则采用SoC架构设计,直接将硬件编解码功能做整合,可对应至24kHz声音频率,并且可支持48kHz频段声音,提供类比、数码音讯转换,以及降噪处理功能,同时也能让设计模块体积更精简。

  除了硬件部分,Audience本身其实也提供软件整合的解决方案,例如本身即提供录音应用的App设计,其中分别可对应单向录音、会议模式录音,甚至针对说话者方向做指向性录音,而开发者可以透过API内容直接沿用,或修改后套用于开发内容,而相关技术Advanced Speech Recognition (ASR)的应用,目前合作对象包刮Google Android 4.1版本以上的Google Now、微软查找引擎Bing的语音输入等。

  音频芯片

  提供市场应用整合体验一致 未来也会持续精进

  此外在市场应用部分,目前也与包含AT&T、中国移动等电信厂商针对旗下客制机种做语音使用最佳化,而此类合作部分主要还是以市场渗透率较高者为优先,不过并不排除任何合作可能性,因此若是市场规模足够的话,也可能会选择与其它电信厂商合作。

  由于目前Audience看起来主要着重于硬件方面的音讯处理,我们在现场提问是否有可能将简单的语言识别功能做整合,让OEM厂商不用额外寻找语音识别技术,或配合软件整合即能在旗下产品使用此类技术。就Bart DeCanne的回覆,表示确实Audience技术在此方面是有办法实现,不过因为语言识别必须面临随时更新且比对资料庞大,直接与硬件端整合可能会有所限制,因此目前并不会朝向此方面做发展。

  而针对藉由声纹方式提供装置唤醒技术部分,Bart DeCanne则认为此类应用必须考量DSP音讯芯片常驻时的功耗设计,其实是相当大的挑战,Audience在此方面可配合软、硬件端朝此目标做发展,不过目前暂时还无法透露太多讯息。

  至于在市场合作部分,Audience确实已经与车用系统、导航产品方面做合作,不过基于部分因素无法实际说明有哪里些合作对象,其中一个因素在于车厂对于此方面讯息较为敏感 (同时也可能因为有商业保密条款),以现行技术大致上可实现车窗开启状态下或以高速行驶也能正常识别语音,进而在输入指令或查询比对使用。

  

  提供市场合作体验一致

  暂时未有应用于消费市场耳麦产品

  至于针对耳机产品部分,Bart DeCanne表示耳机麦克风厂商可能本身就有关降噪技术研发,Audience主要瞄准市场还是放在行动装置、个人计算机、AIO等产品,因此目前除了部分紧急救援所使用的特殊麦克风装置有使用Audience产品,目前并没有计划应用于消费市场的耳机麦克风产品。

  而针对智能型电视产品,Bart DeCanne表示未来可能会因为技术精进而投入市场,现阶段主要因为电视使用距离仍与使用手机、笔电或计算机等不同,因此暂时并没有此类应用计划。

  

  紧急救援使用的特殊麦克风装置,有部份使用Audience产品

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分