思必驰2017年度盘点详细内容

描述

01技术篇

DUI平台,走向定制规模化之路

2017年9月,思必驰,在多年智能语音技术基础上,以Dialogue为核心,结合GUI和VUI,自主研发了全链路智能对话定制平台——DUI,为开发者提供高可用定制的人机对话技术服务,为智能终端开发者提供核心交互能力,协助传统设备实现智能升级。

DUI致力构建以场景服务为基础,以用户为中心的自由人机交互体验,支持自由调用图文、列表、音乐、内嵌网页等多种控件,提供从唤醒、语音识别、语义理解到对话管理、内容输出、TTS播报的全链路技术的超高度定制。DUI还拥有优秀的大数据平台和产品运营中心,帮助开发者快速优化产品;秒级在线热更新,用户体验更流畅。DUI平台将赋能智能终端、APP端、网页端、微信端等多种终端,让更多产品能够快速接入语音功能。

八大技术升级,打造更人性化的对话交互

1. 推出声纹识别方案

基于唤醒的声纹认证,提供更安全的身份保障和个性化体验。声纹识别包括说话人辨识(Speaker Identification,简称SI,一对N的关系)和说话人确认(Speaker Verification,简称 SV,一对一的关系)。思必驰声纹识别方案,基于单麦的纯软算法,集内准确率在95%以上,能够被应用于声纹开锁、语音支付、个性化推荐、安防认证等场景。

2. 推出双麦阵列方案

双波束动态噪声抑制和回声消除,支持平面180度远场拾音,有效提升语音交互体验。思必驰双麦阵列方案,可广泛应用于车载和家居场景下的中远场交互,在噪音环境中也有不错的唤醒和识别理解能力,是一个超高性价比的软硬一体化解决方案。

3. 语音唤醒升级

设备唤醒的高灵敏,容易触发更多的误唤醒。用户在聊天或者看电视的时候,就常常遇到旁边的智能音箱突然被唤醒,被“插话”,让用户不胜其烦。此前,大部分产品能达到2次/24小时的误唤醒率已经算是不错的水平。而思必驰最新的技术优化后,在维持超高唤醒率的同时,误唤醒相对降低60%,500h+实测,每48小时误唤醒仅一次。

4. 推出TTS快速定制方案

思必驰小数据快速定制TTS,在传统的HMM训练后得到源发音人的模型参数,将原始模型的mixture component聚类成若干类,利用MLLR和目标发音人的数据求取源发音人到目标发音人的转换模型。仅需提供5-10分钟音频素材,经过机器的模型训练,即可合成声音,让任意文本都可秒变成用户的声音。

5. 语音识别鲁棒性能力提高

噪声环境下的语音识别一直以来是一个难题。在面对真实环境下的多类别强噪声情况环境(比如车载噪声、家居远场回声等),识别性能有所受影响。思必驰VDCNN算法,在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率,在降噪处理上表现出不可取代的优势,在强干扰和强混响的真实环境中,识别率相对以往提高20%。

6. 上线语言模型定制功能

通用的模型无法满足开发者的多样化需求。在应用场景中,内容资源、语言模型与语义需要三者配合好。对于像“MC子龙”类的特定词汇,添加到词库或说法里,会作为语料用于训练识别语言模型和语义解析模型,通过思必驰 DUI平台释放的技术服务,即可准确识别。解码资源实施同步,最快秒级完成热更新,实现无感知的交互体验升级。

7. NLU能力升级

结合上下文的对话理解和对话管理技术提供了更加灵活的对话交互和更精细的场景划分,支持可随时打断、智能纠错的多轮对话和渐进式上下文理解。通过增强实体识别、实体关系抽取和大规模知识图谱应用,促进机器学习和知识库技术深度融合,使得意图识别能力显著提高10%。同时与第三方内容服务深度耦合,打造更实用的人机交互体验。

8. 对话能力升级

以任务型对话为核心,兼具闲聊、问答与命令对话,引入知识图谱,实体概念,维基百科等形式,打造基于GUI+VUI的多模交互,实现“语音+触控”的完美结合。思必驰DUI所集成的核心智能对话技术具有超高度可定制性,实现了从本地端设备到云端服务,从识别到合成,从语义领域到对话逻辑,从技术模块到内容资源的全方位定制支持。

AIOS智能车载技术方案

思必驰于2015年10月推出了AIOS for Car对话操作系统,2017年初,该方案升级至AIOS3.3版本,新增十一大功能:one-shot一把说、离线导航功能、偏好导航功能、导航中的快捷交互、随意打断/抢说、合成音切换、音乐中的快捷交互、听歌识曲、微信及微信地图接人、自定义唤醒词、路况及限行查询。目前,该方案已广泛应用于当前的车载后装市场,为用户的驾乘生活带来更流畅的交互体验。后期,AIOS将与DUI无缝融合,性能不变,体验升级。

针对远场交互的麦克风阵列方案

远场交互和鲁棒性是近两年的智能硬件刚需,尤其是在家居环境下的3~5米远场交互,和车载环境下的近场复杂噪音环境下。2017年,思必驰推出了多款麦克风阵列方案:

环形6麦方案:支持5米远场交互和360°全角度拾音,±10°声源定位,适用于智能音箱、家居中控等智能硬件产品。

线性4麦方案:支持5米远场交互和180°拾音,适用于智能电视、智能冰箱、智能空调等位置相对固定的智能硬件产品。

双麦方案:适用于家居和车载环境里的中远场交互,拥有极好的降噪处理能力,适合轻需求的智能音箱、智能后视镜等。

智能机器人/故事机技术方案

智能机器人/故事机市场无疑是今年的一大热点,在前端语音处理上,思必驰的麦克风阵列方案解决了远场环境下的痛点。思必驰凭借着强大的语音交互能力、领先的TTS播报、海量的聚类资源、强有力的AI内芯快速拓展了市场,同时,思必驰已积累数十个领域的自建资源库、并与众多第三方知名内容达成战略合作。自建资源的丰富累积,让机器人/ 故事机更聪明!
 

02市场合作篇

目前思必驰已与众多业界知名公司达成合作,包括阿里、腾讯、小米、富士康、联想、360、海尔、浙江大华等,在智能硬件泛物联网领域打造了多款行业爆品。数亿用户通过思必驰自然语言交互,实现与智能终端的互动交流。

2017年,思必驰在智能车载、智能家居、智能机器人/故事机领域的合作全面突破,收获颇丰。

智能车载:畅享自由驾驶

思必驰携手合作伙伴,打造了小米板牙70迈智能后视镜、车萝卜HUD、捷渡远界智能后视镜一二三代、掌讯车机(方案商)等多品类产品。截止目前,思必驰在智能车载后装市场占有率约达60%,稳居行业第一,智能后视镜领域达70%,智能HUD领域达80%。

智能家居:乐享智慧生活

在今年机器火爆的智能音箱市场,AISpeech Inside出货量行业第一,天猫精灵X1、小米小爱同学、联想智能音箱、小米互联网音箱等产品均采用了思必驰语音技术方案,其中天猫精灵双十一卖出100+万台,小米小爱同学开售23秒售罄,备受市场追捧。

除智能音箱外,思必驰携手合作伙伴打造了联想智能电视、诸葛小明智能台灯、小米蓝牙语音遥控器、海尔馨厨冰箱等多款多类目家居产品,让智能语音走进千家万户。

智能机器人/故事机:感受萌动心声

儿童机器人/故事机市场今年尤为火热,在这一领域,目前思必驰品牌覆盖率行业第一, 打造了夏普晓乐、水果兔故事机、火火兔平板、牛听听故事机、小萝卜儿童机器人、贝贝礼儿童故事机等多款产品,激活儿童故事机市场。这些产品的销量在行业内遥遥领先。

03团队篇

思必驰总部在苏州,并在深圳设立商务办事处,在北京设立研发院和市场部,在上海与上海交通大学设立了基础研究中心(联合实验室)。目前,思必驰团队400余人,其中近一半为研发工程师,大都来自国内外知名的高校和研究院所,如剑桥大学、香港科技大学、新加坡国立大学、以色列理工、清华、北大、上海交大、中科院及中科大等等,核心研发团队成员全部为本科及其以上学历,其中硕士比例约占60%,博士占比约为20%。同时,思必驰也汇聚了来自阿里、腾讯、百度、乐视、英特尔、华为、滴滴等行业巨头的资深专家。

2017年思必驰迎来了多位大咖的加盟。初敏博士,2017年9月加入思必驰,任思必驰副总裁,北京研发院院长,负责技术的新场景探索和业务落地。赵恒艺,2017年1月加入思必驰,任思必驰副总裁、DUI平台总经理,负责DUI平台项目整体运营和发展。此外,来自联想之星、PPTV、明道数据等多位行业大咖加入思必驰,携手前行,共探发展。

04荣誉篇

2017年在荣耀的聚光灯下,我们受到了极大的关注!

2017年4月,CCTV-2《经济半小时》以30分钟篇幅全方面报道了关于思必驰的产学研一体化发展之路(CCTV-2《经济半小时》:看思必驰的披荆斩棘之路)。

2017年9月,CCTV-1《机智过人》展现思必驰语音合成技术(CCTV-1《机智过人》小驰一展歌喉,这是你不知道的歌声合成!)。

2017年11月,CCTV-1《机智过人》展现思必驰声纹识别技术(声纹识别 |“小思”PK霍尊辨识小青衣,这是来自人工智能的暴击!)。

同时,思必驰入选了Gartner“2017东亚五大明星AI创业公司”,并再度被高盛评为“全球人工智能关键参与者”。2017年,思必驰斩获了大大小小近百项荣誉。 

05打造AI生态

未来,思必驰将继续加速在物联网领域的深入和拓展,整体布局,打造AI生态,赋能万物。

完善AI产业链布局

在整体生态方面,针对AI领域,思必驰于2016年成立驰星创投,得到了元禾资本、富士康、清华控股等LP的支持,旗下拥有两支基金,分别为2亿元天使基金和10亿元成长基金,专注投资人工智能和智能交互产业早期项目。思必驰对AI领域的关注并不仅局限在人工智能物联网上下游产业链,也关注传统行业,促进传统行业的快速转型,例如扩展到了教育、医疗等。思必驰产业基金已成功孵化并投资了车萝卜、慧声、先声教育、AITEK、SIGMOID、爱医声、RT-Thread等9家企业。

推进AI产业化进程

思必驰着力推进AI产业化的进程。2017年9月推出的DUI开放平台,将对话技术赋能给更多智能终端,推进语音技术的规模化应用。同期,阿里原iDST语音负责人初敏博士加入思必驰成立北京研发院,以针对企业的主动交互式智能服务为切入点,推动AI产业化的进程!

专注源头技术创新与发展

思必驰是AI技术型企业,思必驰坚信,技术型企业的真正比拼并不在万众瞩目的聚光灯下,技术软硬实力才是长久之策。未来,依托苏州研发总部、北京研发院、苏州人工智能研究院的基础性研究和应用性探索,思必驰将不断拓展智能语音的应用场景和领域,带动AI语音技术的推陈出新,赋能更多智能终端产品,推动传统行业转型,让语音近在咫尺,走进未来智能生活。

2018 我们,携手同行!

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分