“比做语音的公司更懂车,比做车的公司更懂语音。”这或许是车载语音交互战场的杀手锏。
2017年4月,大众汽车集团(中国)与人工智能初创公司出门问问正式建立合作伙伴关系,双方确定将共同成立一家合资企业,在汽车领域展开合作。
这家名为问众智能的合资公司,基于出门问问领先的语音识别、自然语言处理、垂直搜索和主动式搜索技术,以及大众汽车集团在汽车和移动出行领域的地位,为未来的智能移动出行提供解决方案。
“公司成立之后比较低调,”1月15日下午,在2018高工智能汽车年会开幕式环节,来自问众智能的CEO张亚登台亮相,“大众汽车大家都比较熟悉,出门问问则是一家AI语音企业,也是在可穿戴式设备,比如手表、耳机以及智能音箱等领域有比较好积累的AI独角兽。”
这样的行业组合背后,是快速增长的车载语音市场需求。有数据显示,全球车载语音助理市场预计将在2017到2023年间以39.27%的年复合增长率增长,到2023年将达到78亿美元市场规模。而根据高工智能产业研究院(GGAI)发布报告称,到2020年中国前装车载语音年均市场规模将达到25亿元左右。
此外,车载语音交互市场的竞争也在从后装市场向前装蔓延。目前,各家汽车OEM厂商推出的2019年新车都将配置智能语音交互系统,前装车型的市场争夺战也在悄然打响。
一、技术公司没有商业边界
之所以过去一年多时间公司一直没有太多信息披露,张亚表示,做前装的车载项目需要花很多的精力,这是一个比较漫长的过程,它和互联网开发一个APP是不一样的。
问众智能从2017年初成立以来,其语音全栈式解决方案正在覆盖大众集团旗下多个乘用车品牌,包括一汽大众、上汽大众、江淮大众,奥迪等等。去年8月,问众智能成为南北大众五百万辆级车联网系统的语音方案提供商。
“按照正在进行中的项目装机覆盖率计算,到2020年问众智能在前装语音市场的占有率将位居市场NO.1。”张亚表示。
不过,问众智能并没有局限于内部客户。“我们以开放的心态,做技术的公司不太会介意自己的商业边界,只要我们的产品和技术是过硬的,一定会赢得更多客户的亲睐。”张亚对此信心满满。
二、从标准化到差异化
车载语音,这并不是新鲜的细分市场应用,语音和汽车的捆绑是在3、4年前就开始了。张亚表示,曾经问自己一个问题,车载语音这个行业是不是需要多一家像问众智能这样的公司?我们认为自己对这个问题有答案。
传统的语音供应商,接触那么多潜在客户之后,发现它只能提供标准化的语音服务方案,如果所有的客户都是用同一种语音方案,显然无法做到差异化的用户体验。
业内人士表示,虽然国内能够提供语音交互方案的公司众多,但真正应用到车载领域,获得规模化用户的企业并不多。通用的语音平台一般功能相对完善,但是对应到车企的定制化需求,用户的体验就千差万别了。
在张亚看来,问众智能愿意与客户做更多定制化的产品设计。像BAT互联网巨头进入到这个行业,很多OEM客户在考虑要不要跟BAT合作。BAT真正的问题是不太懂车厂,车厂的开发流程,质量要求,包括产品的体验。
往往对于BAT而言,则是希望把自己的一整套系统方案(不仅仅是语音)放在车上去用。而AI初创公司,对于车载上面的技术积累比较浅薄。
对于语音技术公司来说,产品效果,客户服务能力和方案的稳定性是决定成败的关键因素,尤其是客户服务能力。
对此,问众智能坚定认为作为一家全栈式智能网联解决方案提供商,在车载语音方面,能够获得最后胜利的企业定位就是要深耕整个车载语音市场。
三、语音智能也有自己的边界
“我们本身是做语音的,但是并不能自大的认为汽车加语音就能够让人机交互变得无所不能。”在张亚看来,语音智能也有自己的边界。
过去几年时间,语音识别成为功能日益复杂的汽车信息娱乐系统相结合的最安全的交互方式之一。但根据J.D. Power的数据,尽管汽车的语音识别系统的缺陷不断改善,但它已经成为车主对汽车新技术体验的最大抱怨之一。
张亚表示,现在行业里面有两个普遍现象,让他感到比较疑惑。
一方面是堆砌的低频功能,比如有些客户会提出来,能不能用语音来支持预定酒店,航班,或者查航班状态。作为车主、终端用户,这些服务一年里面能用到多少次?我们统称为堆砌低频功能,包括订西餐厅,买票等等。
还有化简为繁,违背初衷。比如说语音用在车控环节,车窗、雨刷,或者打开后备厢等等。在车内,通过按键操作就可以顺利完成的功能,未必一定需要用语音去做交互。
总结起来,整个行业在走向的方向,要么是纯粹用技术驱动思维、考虑车载人机交互,工程师认为这些事情我能干,我就干了。
二是忽略场景,直接把语音搬到车载场景当中。目前搭载在量产车上的语音交互系统存在不少用户差评,主要集中在识别准确度(方言),识别的速度,语音唤醒不灵敏,语音控制车辆功能较少,语音系统的升级更新速度慢等问题。
四、回归本质,回归到车
在张亚看来,问众智能的定位和立足之本还是要回归本质,回归到车。
一是,深耕在驾驶场景下的语音交互,有它的特殊性,比如把车窗打开的时候,有车外、车内噪音,车外风噪,胎噪,车内包括发动机的声音,如何在车载混杂环境下把噪音能够降低,并且在高噪状态下(85分贝)做到正常识别,顺利执行命令,需要工程优化。
这对车载语音的拾音和降噪能力提出了很高的要求,而这也正是车载语音当前比较难以攻克的问题。车载语音面临的技术难关远不止这些,比如,在拾音后要如何识别语义进行解析?包括对声纹、性别和场景的识别等等。
而问众智能在过去一年多时间里,就是一直在做这方面的技术与工程经验的积累,在张亚看来,这会是未来和竞争对手形成差异化的一个点。
二是,真正车载语音的核心指标,在实车环境下,强调唤醒,数据量、准确率,要考虑到无论是哪个指标都要在实车环境之下来测。
同时,要基于车内采集的大量语料,大量数据来训练模型。比如,在线ASR准确率还有响应时间,没有用户愿意等(响应)很长的时间,最后很重要的一环就是对于服务生态的连接。
此外,在车载语音交互上面,如何区别于像音箱这样的一些其他场景的智能语音应用。
在车载环境当中有一些是定制的,比如说司机一直处在和(语音)系统相对固定的距离,而且是长时间保持相对的位置。同时对于服务的唤醒,有些时候比较频繁,相当于音箱来讲。
这里面当然涉及到自然语音理解,多轮对话,自定义唤醒词,离线语音识别,这些都是最基础的语音交互体验。
同时,问众智能还在做一些其他技术研发,比如全场景打断,长时间的侦听,跨场景上下文交互,免唤醒热词或者句式。
这些都是在真正的降低用户交互成本。
五、做前装,非常不容易
经过这一年多时间的打磨之后,问众智能也看到了和传统互联网公司,或者技术公司之间的区别。
“从事车载市场并不容易,相比其他行业技术,质量,服务的要求都更为严格,而且要不断完善,经常会被OEM考核。”对此,张亚深有体会,比如说软件的质量,开发的周期,开发的复杂度要和各方沟通。
“我们从一个坑里爬出来再填另外一个坑,直到今天为止,很有信心的跟业界朋友说,我们已经成为一家真正能够懂得车的AI科技公司。”在张亚看来,这也是一件非常不容易的事情。
在语音公司争夺车厂前装市场订单的过程中,相关从业人员表示,车厂对于方案公司的服务达成率比较看重,也就是说,语音公司如果能够较快的响应车厂需求,更好的服务好车厂,那么在跟同行竞争的时候,会有一定的优势。
张亚表示,问众智能是一家拥有车载语音全栈技术的公司,从DSP模组,到HMI、TTS、NLU、DM、ASR、NLG、VAD等等,同时提供灵活、高效、标准化的解决方案。
经过这一年多时间与车厂项目的锤炼,问众智能对于语音SDS,DSP方案整合,适配到各个车载操作系统当中的量产经验,对于其他OEM潜在客户也是非常重要的。
全部0条评论
快来发表一下你的评论吧 !