汽车电子
在先进驾驶辅助系统(ADAS)中,结合视觉处理器的CMOS影像感测器已在协助汽车辨识与分类方面发挥关键作用。至于其“听觉”呢?
麦克风也能扮演像摄影机般重要的角色,为自动驾驶车增添更多“智慧”功能吗?
DSP Concepts执行长与创办人Paul Beckmann表示,在汽车和驾驶人发现救护车接近以前,就已经听到它的警报声响起了。那么为什么汽车产业不会对音讯感兴趣?
系统OEM厂商(不只是汽车制造商)目前正处于“使用更多麦克风以便为人工智慧(AI)产生另一种重要感测器资料——音讯”的关键时刻,Beckmann解释。
正如他所预设的,音讯正“从单纯的在娱乐系统中播放,朝向在情境架构中实现输入、触发与分析。”
由 麦克风所拾取的智慧,也可能用于日常生活的各种系统中,从汽车、数位虚拟助理到可携式装置等。“视觉与听觉应该并驾齐驱,”DSP Concepts业务与行销执行总裁Willard Tu表示。“狗吠声、婴儿哭闹、玻璃碎裂、汽车喇叭、警报声与枪声等等。。.。。.音讯有助于让系统更有效地掌握环境[和情境]。”
图1:音讯“输入”演算法发展蓝图 (来源:DSP Concepts)
如今,有两个重要的发展趋势推动电子产业突然在音讯领域迅速发展。
一 是拥有多颗麦克风的智慧型手机普及;其次则是数位虚拟助理的流行,如Amazon Echo与Google Home。根据SAR Insight & Consulting总监与首席分析师Peter Cooney的观察,“一般消费装置中整合虚拟数位助理的应用越来越多,带动感知与采用语音作为自然的使用者介面,应用于许多日常任务中。”
但是,麦克风能多快超越作为一种自然使用者介面的角色,开始变成真正的‘智慧感测器’?看来业界还得等待一些进展。
为了迎接挑战,音讯需要可以拾取更佳音质的麦克风、善于后处于音讯的处理器、预处理音讯的有效演算法、易于使用的音讯处理工具、相当于绘图用Open GL的音讯标准,以及能以最小功耗维持永不断线的麦克风。
总之,如同Cooney所指出的,市场需要“始终保持监听的技术、语音增强演算法以及麦克风。”
在ARM处理器上实现音讯处理
音讯处理以往是播放系统(如TV、DVD和Hi-Fi音响系统中的等化器)才需要的专业领域。
而今在智慧型手机和其他家用装置的麦克风普及带动下,音讯处理任务已经扩展到几乎无处不在。专用音讯DSP也并不是系统中处理音讯的唯一晶片了。
随着越来越多的音讯开始在ARM处理器上执行,Beckmann指出,更多的OEM“热切地将麦克风视为”AI的输入感测器。DSP Concepts正处于观察这一市场过渡的最佳位置。
Beckmann看好市场成长的态势,特别是因为该公司一款称为Audio Weaver在过去一年来的成果。如同Beckmann描述的,这是“唯一一款可跨平台作业的绘图音讯设计架构。”
业 界分析家认为,DSP Concepts正占据音讯市场上的独特位置。TECHnalysis Research总裁兼首席分析师Bob O‘Donnell认为:“我并未看到DSP Concepts或其Audio Weave工具面对哪几家竞争对手。许多公司都针对音乐与录音等目的进行专业的音讯剪辑与音讯处理,但这毕竟是不同的领域。”
库尼表示同意。“我不知道任何竞争产品音频织女的。”他补充说,“DSP概念有其他的产品也是如此,如声音增强算法(噪音抑制,回声取消,波束赋形),基准和参考设计。”
Cooney也同意这一看法。“我还不知道Audio Weaver有任何竞对手。”他补充说,“DSP Concepts也有其他的产品,例如声音增强演算法(杂讯抑制、回音消除、波木成形等)、基准与参考设计。”
图2:全球麦克风与音讯处理器市场 (来源:SAR Insights & Consulting)
DSP Concepts并未设计或销售DSP。然而,竞争对手一般都是其他的DSP业者。Audio Weaver的竞争产品来自德州仪器(TI)或Cirrus Logic等DSP供应商自行打造的音讯工具。其差异之处在于那些内部开发的工具仅用于DSP供应商自家的晶片。而采用像Audio Weaver这样的独立平台工具,Tu强调,“OEM不必被限制于一种特定的DSP。”
Cooney说,DSP Concepts藉由与Cadence/Tensilica等许多公司合作,主要的业务在于为其客户提供音讯设计解决方案。
除 了Audio Weaver工具,DSP Concepts也授权一些可形成麦克风输入的音讯演算法,包括波束成形、回声消除、杂讯消除与远音场(far-field sound)等演算法。Beckmann指出,在此业界缺乏深谙音讯处理的工程人才之际,市场亟需易于使用的音讯预处理演算法,以便能从不需要的环境杂讯 中区隔出声音来。
音讯:长期受冷落的领域
然而,目前使用音讯进行声学事件检测(和分析)仍然是一种相对较新的应用。
O’Donnell指出,“理论上,可能会有更多专用音讯处理器在做AI,但坦白说,音讯就像是长期受到视讯的冷落一样,而且时至今日也是如此。”
他补充说,声音的另一项重大挑战是“语言与意义”。他说,“一张树的图片以任何语言来说是树,但要瞭解字、词以及最重要的意义与意图,就具有语言与文化的独特性了。这使得语音辨识与自然语言的处理变得十分困难。”
Beckmann坦承,音讯缺乏标准,也造成了差距。
以OpenGL来看,它是一种针对图形渲染的跨语言、跨平台API。对于想要编写程式码的视讯游戏设计人员来说,这种API十分重要。像Nvidia等GPU供应商在使用这种API后就能最佳化其硬体。
音讯世界则可以使用硬体抽象层来实现跨平台的硬体加速渲染,类似于OpenGL所扮演的角色一样。如果缺乏标准,每一家音讯晶片公司都必须最佳化自家硬体以及自给自足。缺乏标准延缓了扩展跨平台的音讯应用所需的创新脚步。
实现永不断电的续航力
Amazon Echo或Google Home等流行的数位虚拟助理下一步要实现的就是“长时倾听”(always-listening)的能力。Amazon正透过其‘tap-then- speak’的语音启动机制加速这方面的进展。但该装置还不能称得上是‘always listening’。
图3:全球语音介面与长时倾听技术市场 (来源:SAR Insights & Consulting)
具有永不断线/长时倾听能力的装置一旦走出家门,将开始面临各种挑战。到了户外,它的音讯处理能力必须从背景杂讯中区隔出需要听到的声音。此外,Beckmann强调,更大的问题还在于电池寿命。
为此,他指出,“位于波士顿的新创公司Vesper开发的静态感测MEMS元件就十分关键。”Vesper专门开发压电MEMS麦克风,不久前还发布了一款新的声学感测器,可利用声能唤醒完全待机中的系统。
Vesper 执行长Matt Crowley表示,这款新的压电MEMS麦克风VM1010可在倾听模式下汲取仅3μA电流,该元件预计在今年第四季出样。Crowley并承 诺,VM1010的新版本将会配备“鉴频”(frequency discrimination)功能。这表示系统设计者可因应枪声、玻璃粉碎或人声等特定的杂讯特性编程MEMS麦克风。
汽车内部
回过头来看看汽车内部的音讯应用。语音为汽车内部提供了自然的人机介面(HMI)。
为了提高驾驶人使用免持听筒的语音品质,一线业者与汽车OEM严重地依赖音讯处理技术。Beckmann说,“配备多声道(从8-32声道)扬声器的汽车,带来了十分复杂的音讯系统。”
不 仅如此,随着电动车的出现,汽车产业开始使用假引擎噪音——或“电子声音”。从BMW到福斯(Volkswagen)等越来越多的汽车制造商开始玩各种共 鸣放大器技巧。事实上,不只是电动车,当今更省油的引擎声音更安静,也较不那么有力了。汽车制造商担心所有的平静可能会让潜在买家却步。
对于汽车产业的许多人来说,音讯是熟悉的领域。汽车制造商们知道,音讯可以为其提供差异化。车内的声学感测器不仅可以听到外面发生的事情,未来,车子自己的引擎也能够针对诊断应用侦测任何异常情况。
编译:Susan Hong
(参考原文:Audio Rises for Event Detection,by Junko Yoshida)
全部0条评论
快来发表一下你的评论吧 !