云打印机基于唯创知音语音播报+TTS(语音合成)+离在线识别技术的五大语音方案

描述

 

AUTUMN前言

当下打印机使用越来越广泛,品种也日益增多,从企业到商家到用户,不同的客户群体都有不同的需求。就拿语音播报来说,早先的打印机只做简单的文本打印功能,不带语音播报提示,后来逐步加上语音提示,如开机音效:欢迎使用xx品牌、提示语打印机缺纸等,及随着网络的发展,加入4G或WIFI的功能,通过TTS技术,进行实时文本播报。

本文则对打印机引入在线TTS+AI对话方案及唯创其他语音方案做了综合介绍。

AUTUMN方案介绍

以下将介绍唯创语音IC在打印机行业的方案运用:

01方案一

    普通语音播报系列打印机,WTN6/WT588F02B型号,语音提前放到芯片内置空间,指令控制播报提示。应用框图如下:

TTS

方案优势:

    性价比高,应用简单;可擦写版本,提供配套工具方便更新语音,快速调试

原理及技术特点:

    唯创标准一线/二线控制协议,支持音量、播放、停止、循环模式指令设置

 

02方案二

    普通语音播报系列打印机,WT2003H系列,支持挂载TF卡或者U盘播放,除提示音外,可存放更多音乐文件,支持MP3/WAV格式,支持USB连接电脑更换音频。应用框图如下:

TTS

方案优势:

    MP3音质效果,支持8-44.1KHz/8-320kbps音频码率播放,支持USB接口快速更换音频

原理及技术特点:

    唯创标准UART串口控制协议,支持挂载SPI Flash、TF卡、U盘播放,支持音量、播放暂停、循环模式、插播等指令设置

 

03方案三

    支持语音更新系列打印机,WT3000A,BLE透传更新本地音频及自定义音效,无需接线,配合手机app或微信小程序,无线更新音频到WT3000A外置存储中。APP SDK可打包外发,嵌入到用户APP中或开发微信小程序应用。应用框图如下:

TTS

方案优势:

· 解决多语种需求,设备本地无需预存多国音频,减少了本地储存成本,解决本地音频更换难,文本合成音频繁等问题

· 支持语种:全球 16 个语种,包括中文、英文、中英混合、法语、泰语、意大利语、韩语、日语、印尼语、德语、西班牙语、俄语、越南语、马来语、菲律宾语;同时还支持 6 个国内方言,即粤语、东北话、天津话、台湾话、四川话、湖南话

原理及技术特点:

· 音频格式:MP3,8-44KHz,8-320Kbps,上传后APP端都会压缩16KHz/18Kbps单声道MP3音频下发到本地;

· 传输速率:10KByte/秒左右;

· TTS合成:支持16 国语种 6 种国内方言,可配置选择,支持文本+背景音乐合成;支持语速、语调、音量等参数调节;

· APP录音:限制时长1分钟,录完点击设备写入,自动下发;

· 本地音频上传:数量无限制,取决于外置SPI Flash容量,最大可外挂128Mbit;

· APP开发:SDK可打包外发,可定制开发;

· 微信小程序开发:支持定制;

· 工具包:说明书、硬件资料、操作视频、测试工具。

 

04方案四

     支持离线文本合成播报打印机,针对带WIFI类打印机,打印时可根据打印状态,实时提示播报,语音内容无需再固化内置,WT3000T离线TTS系列配合客户MCU即可实现该功能。应用框图如下:

TTS

 

05方案五

    支持离在线文本合成播报打印机,针对带WIFI类打印机,或者不带WIFI打印机,配套WT3000A M系列模组,上面自带WIFI+语音芯片,可实现文本合成超拟人的音色,还支持自定义添加背景音乐及效果,可带来生动有趣、富有感染力的听觉体验。应用框图如下:

TTS

方案四和五对比优势:

参数对比

传统离线TTS

离在线TTS

语种中文、中英文支持16国语种,6种国内方言
音质音色相对偏机械点音色更丰富,支持超拟人音色
实时性MCU下发UART文本合成指令,离线速度相比在线更快点合成速度会存在1-2秒的延时,与WIFI网络稳定性及缓存有关
本地音频播放以WT3000T为例,除TTS合成文本播放外,A版本可内置30秒固定音播放,D版本可内置500秒固定音播放WT3000A本地本地音频播放,时长与挂载存储器容量有关,如32Mbit flash可内置16kbps的音频约34分钟
AI扩展不支持可引入AI对话,服务器部署产品知识库,在文本合成的基础上,增加产品的售前问答,趣味性对话等,更具个性化服务
开发调试工具配套样片/协议/Demo板,开发快提供服务器部署支持、手机app   demo、测试板、样片/IC控制协议
项目成本优势唯创离线版TTS,同级别效果,价格有优势WT3000A离在线TTS方案对比市面上在线TTS方案,价格更具吸引力,可扩展定制自定义功能

离在线TTS原理及技术特点:

· 主要组成为MCU+语音IC、WIFI芯片+服务器这几大核心部分,分为上下位机来做描述:

-上位机:主要由两部分组成,APP(配合Demo板操作演示)、服务器

· APP:一键蓝牙配网,文本合成下发,设置语种、音色、音调、音量;

· 服务器:文本音频合成下发、可接入AI大模型对话;

-下位机:主要由三部分组成,MCU、WT3000A+功放、WIFI芯片

· MCU:客户自有主控部分,驱动外设(实现本身产品的功能、交互)、通过UART接口下发文本信息(文本格式支持GB2312、UTF-8等格式)、控制本地音频播放、发起配网请求等;

· WT3000A+功放:与MCU/WIFI模组通讯、解码播放;

· WIFI芯片:联网、音频数据传输,当前传输采用MQTT协议,本司私有协议,建立订阅后,根据不同的主题,发布相关内容,详情请参考本司相关资料。

AUTUMN总结

    基于打印机方案,唯创可提供多种语音播报类方案,如简单语音播报、语音更新方案(USB/UART/蓝牙更新....)、离在线TTS方案等。如需要IC样品或Demo板测试体验,及更多技术交流,可联系本司业务人员,或官网留言,欢迎交流分享!

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分