搜狗与新华社联合发布的AI合成主播技术再次取得突破

电子工程师 2019-02-22 4104

电子说

1.4w人已加入

描述

去年 11 月的互联网大会期间，搜狗与新华社联合发布全球首个AI合成主播一经亮相，引起了人们对“AI+媒体”的广泛讨论。如今，搜狗 AI 合成主播不断更新迭代。

2 月 19 日，在新华社新媒体中心与搜狗公司战略合作签约仪式上，搜狗公司与新华社新媒体中心联合发布了站立式 AI 合成主播，这次新的 AI 合成主播从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”，标志着“搜狗分身”技术再次取得突破。

据了解，初代 AI 合成主播由“搜狗分身”技术打造，这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情，并且将三者自然匹配，创造出人类的 AI 分身，进而帮助人类提高信息表达和传递的效率。

那此次发布的站立式 AI 合成主播又开拓了哪些“技能”？据搜狗方面介绍，新版的 AI 合成主播采用了“搜狗分身”的 WaveRNN 波形建模技术，可以实现逼真的语音合成效果，让 AI 的声音更具有真实情感和表现力。而在图像生成方面，新版的 AI 合成主播实现了更加逼真的表情生成、自然的肢体动作以及嘴唇动作预测等能力，而且还让 AI 合成主播“动”了起来，这提升了合成主播的表现力。

什么是“搜狗分身”技术？它诞生于搜狗“自然交互+知识计算”的人工智能理念之下，能够利用搜狗的 AI 能力，从图像表情，声音语言习惯，逻辑思维等层面对 AI 进行拟人化训练，然后克隆制造人类的 AI 分身，进而帮助人类提高信息表达和传递的效率。

搜狗方面表示，随着“搜狗分身”技术能力的不断提高，AI 合成主播的定制周期也大为降低，合成效果和稳定性也有着显著提升。值得一提的是，此次发布会同时发布了首个 AI 合成女主播，这是“搜狗分身”技术持续复制不同类型、不同特点 AI 合成主播能力的一个体现。目前，仅靠少量用户真实音视频数据，搜狗即可快速定制出高逼真度的分身模型，帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。

搜狗 CEO 王小川介绍，作为 AI 合成主播的技术核心，“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域，通过提供个性化的行业解决方案，为不同职业赋能，提升整个社会的信息生产力。

据悉，目前首批入职新华社的一中一英两位 AI 合成主播，已生产 3400 余条新闻报道，累计时长达 10000 多分钟，参与了包括第五届世界互联网大会、首届进博会、2019 春运、春节等报道，成为中国人工智能与传媒业大胆融合并付诸规模化应用的典型案例。

打开APP阅读更多精彩内容