登录/注册

语音模型

更多

广和通发布自研端侧语音识别大模型FiboASR

7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别大模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及

2025-08-04 11:43:30

模型时代的新燃料:大规模拟真多风格语音合成数据集

以大模型技术为核心驱动力的人工智能变革浪潮中,语音交互领域正迎来广阔的成长空间,应用场景持续拓宽与延伸。 其中,数据作为驱动语音大

2025-04-30 16:17:25

可以在OpenVINO™工具套件的视觉处理单元上推断语音合成模型吗?

无法确定是否可以在 VPU 上推断语音合成模型

2025-03-06 08:29:26

SVPWM仿真模型资源下载

SVPWM仿真模型资源下载

资料下载 songxianyi888 2021-08-09 16:25:27

一种基于准循环神经网络的语音增强方法

在基于深度学习的语音增强模型中,长短时记忆网络能较好地解决序列语音增强问题,但该模型

资料下载 佚名 2021-04-29 15:45:28

基于预训练模型和长短期记忆网络的深度学习模型

作为模型的初始化词向量。但是,随机词向量存在不具备语乂和语法信息的缺点;预训练词向量存在¨一词-乂”的缺点,无法为模型提供具备上下文依赖的词向量。针对该问题,提岀了一种基于预训练

资料下载 佚名 2021-04-20 14:29:06

基于改进长短时记忆网络的儿童语音情感识别模型

为实现不同儿童情感需求状态下帧级语音特征的有效获取,建立一种基于改进长短时记忆(LSTM)网络的儿童语音情感识别模型。釆用帧级

资料下载 佚名 2021-04-01 11:36:26

基于语音、字形和语义的层次注意力神经网络模型

结合英文幽默语言学特征,提出基于语音、字形和语义的层次注意力神经网络模型( PFSHAN)进行幽默识别。在特征提取阶段,将幽默文本表示为音素、字符以及携带歧义性等级信息的语义形式,分别采用卷积

资料下载 佚名 2021-03-26 15:38:15

字节跳动豆包大模型已支持实时语音通话

字节跳动火山引擎今日隆重推出创新对话式AI实时交互解决方案,该方案以火山方舟大模型服务平台为核心,全面升级语音交互体验。该方案深度融合火山引擎RTC技术,实现了

2024-08-12 16:13:26

Transformer模型语音识别和语音生成中的应用优势

随着人工智能技术的飞速发展,语音识别和语音生成作为人机交互的重要组成部分,正逐渐渗透到我们生活的各个方面。而Transformer模型,自其诞生

2024-07-03 18:24:42

聆思CSK6视觉语音模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

本帖最后由 jf_40317719 于 2024-6-18 17:39 编辑 视觉语音大模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富

2024-06-18 17:33:19

基于深度学习的情感语音识别模型优化策略

基于深度学习的情感语音识别模型的优化策略,包括数据预处理、模型结构优化、损失函数改进、训练策略调整以及集成学习等方面的内容。

2023-11-09 16:34:14

Sensory Cloud利用NVIDIA Triton运行语音和视觉模型

企业可以使用混合模型改进唤醒词、语音转文本、设备安全等。

2022-07-10 09:37:05

阿里开源自研语音识别模型DFSMN使用技巧指南

重磅!阿里开源自研语音识别模型DFSMN,准确率高达9604%

2019-09-16 06:53:06
7天热门专题 换一换
相关标签