昆仑万维天工3.0大模型性能显著提升,天工SkyMusic音乐模型亮相

描述

  4月17日,昆仑万维公司公布了天工3.0大模型的优异性能,同时启动了天工SkyMusic音乐大模型的公益试用。

  天工3.0拥有4000亿参数,超越Grok-1的3140亿参数,成为全球最大的开源MoE大模型。该模型在语义理解、逻辑推理、通用性、泛化性、不确定性知识以及学习能力等方面均有显著提升,数学/推理/代码/文创能力提高超过30%。此外,天工3.0还新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等AI功能。

  天工SkyMusic音乐大模型也于同日开启公益试用。昆仑万维表示,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等方面明显优于竞争对手,综合性能超越Suno V3,成为音乐大模型中的最高水准。

  天工SkyMusic采用音乐音频领域类Sora模型架构,Large-scale Transformer负责谱曲,学习Music Patches的上下文依赖关系,实现音乐可控性;而Diffusion Transformer则负责演唱,通过LDM将Music Patches还原为高质量音频,支持生成80秒44100Hz采样率双声道立体声歌曲。

  据悉,天工SkyMusic具有以下特色:

  1. 高质量AI音乐:生成80秒44100Hz采样率双声道立体声AI歌曲

  2. 人声“以假乱真”:中文发音清晰无异响

  3. 歌词段落控制:歌曲能明确区分不同段落的情感变化

  4. 多种音乐风格:支持说唱/民谣/放克/古风/电子等

  5. 音乐智能表达:学习颤音、歌剧、吟唱、男女对唱等歌唱技巧

  6. 参考音乐生成:用户上传参考音乐,生成相似风格和唱腔的歌曲

  7. 方言歌曲生成:支持粤语、成都话、北京话等众多方言

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分