京东数科推出AI虚拟数字人 可应用于招募、客服等多场景

人工智能

636人已加入

描述

近日,AI主播亮相京东数科产业AI公开课,而这也是京东数科自主研发的AI虚拟数字人产品首次出现在公众面前。据介绍,京东数科融合了2D和3D技术,将传统方法与深度学习结合,仅需使用一段几分钟的人物视频数据,经过几小时训练就可以合成出写实风格的AI虚拟数字人。

据悉,为了顺利实现文字到语音的转化,京东数科自研了轻量级对抗语音合成技术,通过结合深度神经网络在多人数据上进行个性化建模,达到音色丰富、特色鲜明的语音合成效果,甚至可以模拟人的呼吸和停顿,听感酷似真人。高效轻量的对抗神经网络大幅提升了合成速度,合成1秒音频只需0.07秒,合成时延仅为业界水平的1/3,充分支持多场景实时语音合成。

在语音生成视频的阶段,为了使AI主播形象更加逼真,京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。为了在口型匹配方面达到完美效果,京东数科AI实验室利用大量语音数据,并特意设计了鲁棒的语音特征,使其可以被不同音色、语言和语速的合成语音所驱动,且都能保持准确、连贯的口型。

最终,京东数科开发出了高度还原真人形象的AI虚拟数字人,在AI算法的驱动下,只需输入文本内容,“小妮”就能根据语义实时进行主持,且表情、动作和语音表达非常自然逼真。

京东数科AI实验室首席科学家薄列峰表示:“AI主播小妮的推出,是京东数科在多模态AI技术领域一次成功的落地应用。除了在客服、招聘等领域的应用之外,我们还将服务内容创造者,通过AI虚拟数字人技术,把静态图文内容转化为由‘真人’讲解的短视频,满足用户对多样化呈现形式的需求,增强用户黏性和社区活跃度。”

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分