AUTUMN前言
当下打印机使用越来越广泛,品种也日益增多,从企业到商家到用户,不同的客户群体都有不同的需求。就拿语音播报来说,早先的打印机只做简单的文本打印功能,不带语音播报提示,后来逐步加上语音提示,如开机音效:欢迎使用xx品牌、提示语打印机缺纸等,及随着网络的发展,加入4G或WIFI的功能,通过TTS技术,进行实时文本播报。
本文则对打印机引入在线TTS+AI对话方案及唯创其他语音方案做了综合介绍。
AUTUMN方案介绍
以下将介绍唯创语音IC在打印机行业的方案运用:
01方案一
普通语音播报系列打印机,WTN6/WT588F02B型号,语音提前放到芯片内置空间,指令控制播报提示。应用框图如下:
方案优势:
性价比高,应用简单;可擦写版本,提供配套工具方便更新语音,快速调试
原理及技术特点:
唯创标准一线/二线控制协议,支持音量、播放、停止、循环模式指令设置
02方案二
普通语音播报系列打印机,WT2003H系列,支持挂载TF卡或者U盘播放,除提示音外,可存放更多音乐文件,支持MP3/WAV格式,支持USB连接电脑更换音频。应用框图如下:
方案优势:
MP3音质效果,支持8-44.1KHz/8-320kbps音频码率播放,支持USB接口快速更换音频
原理及技术特点:
唯创标准UART串口控制协议,支持挂载SPI Flash、TF卡、U盘播放,支持音量、播放暂停、循环模式、插播等指令设置
03方案三
支持语音更新系列打印机,WT3000A,BLE透传更新本地音频及自定义音效,无需接线,配合手机app或微信小程序,无线更新音频到WT3000A外置存储中。APP SDK可打包外发,嵌入到用户APP中或开发微信小程序应用。应用框图如下:
方案优势:
· 解决多语种需求,设备本地无需预存多国音频,减少了本地储存成本,解决本地音频更换难,文本合成音频繁等问题
· 支持语种:全球 16 个语种,包括中文、英文、中英混合、法语、泰语、意大利语、韩语、日语、印尼语、德语、西班牙语、俄语、越南语、马来语、菲律宾语;同时还支持 6 个国内方言,即粤语、东北话、天津话、台湾话、四川话、湖南话
原理及技术特点:
· 音频格式:MP3,8-44KHz,8-320Kbps,上传后APP端都会压缩16KHz/18Kbps单声道MP3音频下发到本地;
· 传输速率:10KByte/秒左右;
· TTS合成:支持16 国语种 6 种国内方言,可配置选择,支持文本+背景音乐合成;支持语速、语调、音量等参数调节;
· APP录音:限制时长1分钟,录完点击设备写入,自动下发;
· 本地音频上传:数量无限制,取决于外置SPI Flash容量,最大可外挂128Mbit;
· APP开发:SDK可打包外发,可定制开发;
· 微信小程序开发:支持定制;
· 工具包:说明书、硬件资料、操作视频、测试工具。
04方案四
支持离线文本合成播报打印机,针对带WIFI类打印机,打印时可根据打印状态,实时提示播报,语音内容无需再固化内置,WT3000T离线TTS系列配合客户MCU即可实现该功能。应用框图如下:
05方案五
支持离在线文本合成播报打印机,针对带WIFI类打印机,或者不带WIFI打印机,配套WT3000A M系列模组,上面自带WIFI+语音芯片,可实现文本合成超拟人的音色,还支持自定义添加背景音乐及效果,可带来生动有趣、富有感染力的听觉体验。应用框图如下:
方案四和五对比优势:
参数对比 | 传统离线TTS | 离在线TTS |
语种 | 中文、中英文 | 支持16国语种,6种国内方言 |
音质 | 音色相对偏机械点 | 音色更丰富,支持超拟人音色 |
实时性 | MCU下发UART文本合成指令,离线速度相比在线更快点 | 合成速度会存在1-2秒的延时,与WIFI网络稳定性及缓存有关 |
本地音频播放 | 以WT3000T为例,除TTS合成文本播放外,A版本可内置30秒固定音播放,D版本可内置500秒固定音播放 | WT3000A本地本地音频播放,时长与挂载存储器容量有关,如32Mbit flash可内置16kbps的音频约34分钟 |
AI扩展 | 不支持 | 可引入AI对话,服务器部署产品知识库,在文本合成的基础上,增加产品的售前问答,趣味性对话等,更具个性化服务 |
开发调试工具 | 配套样片/协议/Demo板,开发快 | 提供服务器部署支持、手机app demo、测试板、样片/IC控制协议 |
项目成本优势 | 唯创离线版TTS,同级别效果,价格有优势 | WT3000A离在线TTS方案对比市面上在线TTS方案,价格更具吸引力,可扩展定制自定义功能 |
离在线TTS原理及技术特点:
· 主要组成为MCU+语音IC、WIFI芯片+服务器这几大核心部分,分为上下位机来做描述:
-上位机:主要由两部分组成,APP(配合Demo板操作演示)、服务器
· APP:一键蓝牙配网,文本合成下发,设置语种、音色、音调、音量;
· 服务器:文本音频合成下发、可接入AI大模型对话;
-下位机:主要由三部分组成,MCU、WT3000A+功放、WIFI芯片
· MCU:客户自有主控部分,驱动外设(实现本身产品的功能、交互)、通过UART接口下发文本信息(文本格式支持GB2312、UTF-8等格式)、控制本地音频播放、发起配网请求等;
· WT3000A+功放:与MCU/WIFI模组通讯、解码播放;
· WIFI芯片:联网、音频数据传输,当前传输采用MQTT协议,本司私有协议,建立订阅后,根据不同的主题,发布相关内容,详情请参考本司相关资料。
AUTUMN总结
基于打印机方案,唯创可提供多种语音播报类方案,如简单语音播报、语音更新方案(USB/UART/蓝牙更新....)、离在线TTS方案等。如需要IC样品或Demo板测试体验,及更多技术交流,可联系本司业务人员,或官网留言,欢迎交流分享!
全部0条评论
快来发表一下你的评论吧 !