AIoT下的多模态演变之路 垂直领域竞争激烈

电子说

1.3w人已加入

描述

2018年人工智能(AI)行业成为了最受关注的热点之一,不同场景的AI芯片层出不穷,成为了智能时代的“入场券”,大多数业者称“得芯者得天下”,将2018年定义为“芯片元年”。

语音垂直应用领域,“造芯”似已成为云知声、出门问问、Rokid 、思必驰、科大讯飞从算法出发“软硬兼施”一条必走之途,但也显得语音AI市场变得异常竞争激烈。

在此背景下,2018年5月,云知声推出首款物联网AI芯片——雨燕(Swift),通过“唯快不破”的发展思路,很快在语音识别风口中和科大讯飞比肩,并完成C轮1亿美元的融资跻身国内众多AI独角兽榜单中的一员。

而在2019年开年之际,云知声继续抢跑,于1月2日召开了“2019云知声多模态AI芯片战略发布会”,会上正式公布了其多模态AI技术,以及正在研发中的多款定位不同场景的AI芯片,包括实用性更广的超轻量级物联网语音芯片雨燕(Lite)、可面向智慧城市场景提供对语音和图像等多模态计算支持的海豚(Dolphin),以及面向智慧出行场景的车规级芯片雪豹(Leopard)。以上三款芯片计划于2019年启动量产。

AIoT下的多模态演变之路

云知声创始人兼CEO黄伟认为,5G与人工智能的结合将真正促使万物智联(AIoT)的落地与实现。可以预见的是,未来巨量的多维数据(如语音、图像、视频等)集中处理与边缘式分布计算的需求,势必将进一步挑战AI底层支持硬件——芯片的计算能力。

与此同时,AI应用对于端云互动有着强需求。强大的云会让端能力更强,而强大的端则可提升数据处理的实时性和有效性,进而增强云的能力。二者需要紧密结合,这要求对芯片设计和云端架构进行统一考量。传统的通用方案架构由于在高实时性、高智能化场景中的算力有限,且无法平衡好成本、功耗、安全性等诸多现实需求,因此具备多维度AI数据集中处理能力的多模态AI芯片将成必由之路。

为实现多模态AI芯片的战略落地,目前云知声已在加速技术布局,并在机器视觉方面取得飞速进展。其中,面向机器视觉的轻量级图像信号处理器已可实现在不依赖外部内存的情况下,在30 fps的速率下实时对传感器的图片进行预处理,以进一步提高后续机器视觉处理模块的处理速度和效果。借助基于人脸信息分析的多模态技术,已可实现人脸/物体识别、表情分析、标签化、唇动状态跟踪等功能,可为产品交互和用户体验提供更多的可玩性和灵活性。

此外,云知声发布多模态人工智能核心IP——DeepNet2.0,可兼容LSTM/CNN/RNN/TDNN等多种推理网络,支持可重构计算与Winograd处理,最高可配置算力达4T。目前云知声DeepNet2.0已在FPGA上得到验证,将在2019年落地的全新多模态AI芯片海豚(Dolphin)上落地。

直面思必驰、科大讯飞垂直领域竞争

语音识别与语义分析,这是人们比较能理解的人工智能应用领域。虽然在这条起跑线上,云知声后来追上,但不难发现,与其业务重合度较高的莫过于思必驰和科大讯飞两家公司。

梳理之下可以看出,在产品线竞争上,云知声围绕智能家居、智能车载、机器人、智慧医疗和智慧教育等的五大领域四面受敌。

云知声产品线中的智能家居方案、智能车载方案和机器人方案,直面与思必驰构成业务重叠,竞争态势强烈。据思必驰CMO龙梦竹曾介绍,思必驰车载语音在智能车载后装市场占据约60%的份额,在智能后视镜领域约为70%,HUD领域已高达80%。

在智慧医疗与智慧教育领域里,科大讯飞仍是摆在眼前的不小阻力。除了双方均大力布局将语音转成结构化电子病历系统与智能口语评测外,科大讯飞还在医学影像辅助诊断和基于认知计算的辅助诊疗系统方面有所布局,并且根据科大讯飞2017年财报表示,其智慧教育产品已经覆盖全国15000余所学校,深度用户超过1500万,占总主营业务收入的25.54%。

因此,对于云知声而言,面对行业里既有科大讯飞这样的“老大”,又有不断加码人工智能投入的BAT等巨头,由应用场景来定义AI芯片的研发与产品形态无疑是其独立发展的最佳路径。

以语音病历系统为例。医生在说话时,能轻松地与电脑、iPad、移动查房设备等建立联系;说话的内容会被转录成文字并显示在医院专门的HIS、PACS、CIS等系统中。但是在医疗这个专业性非常强的领域,常规语音识别系统并不能完美胜任。

为此,云知声针对医院不同科室的业务进行了梳理,整理了超过30GB的医疗文本资料,并对这些资料进行分类、检索等处理,使得定制语音模型覆盖各个科室常用病症、药品名称、操作步骤等关键信息,使语音识别准确率超过95%。同时,针对医生的口音问题,云知声提出了无监督自适应技术,提高对医生口语的识别率。

所以,在这一轮人工智能风潮的到来,最重要的是芯片定位。云知声的做法是,针对细分客户的需求做极致化服务,从算法公司的角度出发做芯片,软硬结合打造出一个好用的芯片,欲成为语音交互佼佼者,同时希望推出语音AI芯片打造生态,从而实现价值的提升。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分