语音合成技术将推向大众供普通用户使用

音视频及家电

729人已加入

描述

(文章来源:AiChinaTech)

近日,百度地图推出了定制化语音导航功能,简单说就是用户根据提示采集原声,十几分钟后你将获得属于自己定制化的语音导航音频包。所以说用户除了郭德纲、林志玲、罗振宇这一票人之外还有更多选择。其实我们在使用明星导航音频包时会发现,除了很多“左转”“红绿灯路口”这类常规交通词汇外,很多涉及地名的、地标的词是可以听的出是合成的。而现在“语音合成”技术推向普通用户,就有了这些AI定制化合成服务。

单从使用AI合成的相关App来看,不禁联想到那个“一夜而红”的ZAO,还有国外的Deepfake,AI脱衣软件DeepNude等等。而国内专注于人工智能领域的企业越来越多,例如:商汤科技、旷视科技这两艘“AI巨轮”的业务主要是对政府及企业的;而科大讯飞、大疆、华为、小米、优必选科技的部分硬件类业务是to C类的;极链科技是专注于视频领域的人工智能企业,业务面向品牌主及流量方,也就是to B类的。

对于广大 C端 用户来说,AI合成技术正在通过各种智能设备实现并应用。比如地图AR增强,定制化音频服务、定制化视频服务、专属智能客服等。

其实刚才提到过的曾经爆火的这些App应用,“ZAO”、“Deepfake”、“DeepNude”技术上有些共同之处,但是娱乐的点不同。“DeepNude”涉及色情内容,并上升到人身攻击最终被禁止。网友用“Deepfake”在网上大量恶搞政府首脑,比如特朗普的恶搞视频众多。

而离我们最近的“ZAO”,在有了前车之鉴后,看的出在尽可能规避可能产生的负面效果,视频素材内容由平台方把控。但不可避免的是在用户对照片进行授权所涉及的隐私问题,因为不单纯是上传照片即可,而是需要用户多角度的认证,有些“恐慌”确实不可避免,因为扫脸支付、扫脸登陆等功能已经被广泛应用,这是用户最直接的对“ZAO”开发者的质疑。随后不久背后的公司陌陌科技被有关部门谈话并要求整改,目前来看在ios的热度及下载量仍然稳定在前三名。

不再处于风口浪尖,“ZAO”进入了平稳期,而大家对其盈利模式以及产品定位仍有疑问,似乎并没看到一个清晰的变现方式。虽说当前“视频社交”火爆,但是仅凭陌陌的用户带动还是比较乏力的。App自身没有社交属性,只是单纯的内容产出,和其他的分发渠道联合显得很必要。而问题又来了,这些内容只适合小范围内私域传播,用户不愿意扩散是关键。没有爆炸传播的潜质,所以营销能力也被削弱。或许只是昙花一现,但是对于用户来说,拍照合成视频的趣味性还是非常强的,但关于变现场景仍需要一段较长的摸索期。

工具类软件更能被大家接受认可,微信中音频转文字功能用起来很方便,并且通过计算机的学习,准确度也在不断提高。而科大讯飞推出的「讯飞听见」是目前将音频转文字业务做的较为成熟的平台。业务细分为机器快转和中文人工精转两种服务,可直接收费变现。和百度地图的定制版语音导航类似,属于上传后的AI处理,非在线转化。

地图app,作为一个相对高频使用的工具类应用,除了在满足常规通行服务外,正在发现更多的To C服务场景。比如google地图推出的AR导航功能,已经开始测试应用,用于帮助用户以在线实景增强的方式判断方向及路线。华为也正在布局地图服务,在Cyberverse数据平台上发了Map Kit,而相关AR技术的应用是在景区、博物馆之类的场景做实景增强标注和讲解服务。在2017年高德地图就推出了景区语音导游服务,发展至今已经比较成熟。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分