电子说
黄伟中,科大博士,上海交大生命科学技术学院博士后,毕业后任职摩托罗拉中国研究中心资深研究员,期间开发出了世界第一款手机声纹认证系统。后出任盛大创新院核心高管,并创建了语音分院。2013年底加入国内人工智能引领企业云知声任职首席执行官,负责云知声发展战略和运营管理战略规划。自1999年起参与项目研究至今已获得涉及医疗、管理信息系统、自然科学、语音、游戏等多个领域的产品成就,例如在2002到2004年间参与美国国家标准技术署说话人识别评测(NIST SRE)项目获SRE主任务第一名,并获得当年最高的“金星奖”,也是现如今唯一一位能够在NIST评测中连续两年做keynote speaker的华人。获MIT TR35 2007年度提名,2009年获上海市十佳科技创业领军人才。
当你还无法察觉的时候,很多改变人类的新技术已经在无声无息中蜕变、成长,诞生于上世纪50年代的人工智能就扮演着这样的角色。
“互联网女皇”玛丽·米克尔在报告中大篇章的描述了语音识别交互带来的改变,人工智能成为科技发展的重头戏已经毋庸置疑,物联网场景下的应用需求在不断扩大,智能语音技术在智能家居、智能汽车、教育等领域的应用逐步深入,带动着智能语音产业规模的持续快速增长。
黄伟表示,PC互联网时代,联网设备主要是PC,移动互联网时代,联网设备主要是手机或平板。而到IOT时代,一切设备都可能联网,IOT联网最大的特点是没有屏幕,不像手机平板那样以触碰为主,第二,设备离人比较远,这时候我们就希望用一种完全自然的,像人和人对话的方式来控制它们,所以,语音识别就成了解决这一痛点的最佳方案。
2012年成立云知声的时候,我们的具体方向仍然未定。当时看到了移动设备的飞速发展,我们认为可能未来在智能设备上,声音会成为一种重要的交互方式。
当时的数据库非常的小。于是我们便一边做数据搜集,一边升级我们的算法。云知声2012年6月成立,3个月后我们发布了基于传统统计模型的第一代引擎。
我们的第一代引擎,将准确率提升到了85%。当时业界的领军者科大讯飞(55.330, -1.79,-3.13%)的准确率是80%。
2个月后我们的深度学习引擎上线,准确率提升到了91%。基于这个引擎,我们开发了微信上第一款语音输入插件。插件上线第一周,激活用户数超过5万。
我们开发了一个开放的平台,任何人、任何组织只要在我们的平台上注册,就可以免费使用我们的SDK(软件开发工具包)。在你的APP里接入我的SDK,就可以免费调用我们的服务。
2013年底,我们的这个平台上,接入的企业客户数量达到接近一万家。我们靠着这些用提供的数据,不断的进行数据迭代和算法优化,我们的准确率提升到了94%。如今,这个平台上的企业客户数达到了三万家。
云知声成立之初的2年,主要精力都用在对技术模式的探索上。到了2014年,我们逐渐意识到,再好的技术,只有当它变成对用户有价值的产品时,它才有商业价值。于是我们开始考虑商业化的路应该怎么走。
2014年时,我们开始规划云之声未来的定位,定位是产品模式和业务模式的基础。我们发现留给创业者的空间不多了,APP的红利期已过,流量掌握在BAT手中。做与科大讯飞雷同的业务,我们没有科大讯飞身后强大的政府支持,很难在竞争中胜出。
最终,我们决定做物联网(LOT)。物联网在当时是一个新兴业务,当时BAT没有涉及,科大讯飞也没有相关的布局。再加上行业内没有已经成功的壁垒,我们由此切入再适合不过。
此外,移动互联网总有触及天花板的一天。 当移动互联网触及天花板的时候,一定会有新的机会出现。我们认为物联网可能就是这个机会。
做物联网一定会面临新的挑战,表象上的模式不同,基础的模式也会不同。首先便是终端的变化,终端变得更加多元化,家里的冰箱、空调、洗衣机等,都将是智能化的。
因此,做物联网一定要与硬件结合,甚至要与芯片结合。而很多设备是不插电的,这就要求同时做到低能耗。这种模式的转变,需要许多底层的基础变革来支撑。
所以2014年,为了做物联网,云知声完成了两个重要的举措。首先是引入高通成为云知声的战略投资方。再加上内部架构的调整,成立了LOT事业部,占云知声总人数的一半以上。
具体来说,我们还确定了新的产品形态。我们根据用户场景倒推,未来用户的形态应该是,比如,在客厅的沙发上,自然的与空调对话,而不需要凑上去和它交流。
场景设定好之后,倒推需要什么样的产品,里面需要哪些技术。我们第一个落地的客户是乐视,乐视的第三代TV,也是国内第一款做远距离自然语音交互的TV,2015年5月份开始在市场上销售。
现在我们的产品已经被国内几乎所有的大厂接受,像格力、美的、海尔、海信、TCL等都是我们的客户。而且,到目前为止,我们是国内唯一能做到这个的厂商。
除了硬件方面的探索,另外我们希望选择一些垂直行业进行落地,最终我们选择了医疗行业。
之所以选择医疗行业,首先,医疗是一个很大的市场。并且,目前平均每个医生每天整理病例要花掉3.5到4个小时。我们开发了一套系统,医生可以利用麦克风输入病例。北京的协和医院引进我们的系统后,平均每个医生每天整理病例的时间从超过3小时,降低到了1个小时。
另外,在和协和医院院长聊天的过程中,他告诉我,其实有80%的误诊是模板拷贝造成的。每个人的体质不同,病症不同,模板无法准确的记录病人的情况。利用我们的系统,医生可以因人而异的进行病理录入。
未来我们希望将这个产品集中精力和资源,把医疗行业做深、做透。目前我们的产品已经进入了包括北京协和医院在内的几十家医院。而国内仅三甲医院就有1500家,中医诊所四万多家,还有更多的非三甲医院。我们可以看到,未来这个市场是非常庞大的。
另外,我们可以将这个产品复制到任何需要文字录入的行业,比如,司法领域可以,传媒领域也可以。
目前云知声的精力主要用在三个方面,一是,核心技术的储备与研发;二是,业务的成长,过去2年的商务探索,我们的产品形态和业务模式都相对比较清晰了,未来要做的是尽快的扩张;三是,加强公司治理。
作为一家专注于物联网人工智能服务的公司,自2012年6月成立以来,云知声利用机器学习平台,在语音技术、知识计算、大数据分析等领域建立了领先的核心技术体系。而在应用层面,已形成「云端芯」生态闭环。
云知声曾连续两年入选福布斯中国最快科技成长公司50强企业,同时也是中国AI行业成长最快的创业公司之一。
今年3月,云知声推出的专门针对智能家居的AIOS@Home(人工智能操作系统)。
此次,雷锋网新智造采访了云知声创始人黄伟,跟他聊了聊过去一年云知声的发展、现状、公司今年的目标以及他对人工智能行业前景的看法。
创业维艰,尤其对处在萌芽阶段的AI行业更是如此。云知声创始人黄伟称创业五年来每一年都如履薄冰,每一天都过得非常煎熬。
因为作为一家公司的CEO每天都要考虑很多事情、作出决定,每一个重大决定都有可能关乎公司未来发展方向。这不是原来他在大公司单纯的作技术leader时只是负责一些工作安排所能比较的,现在他更多要考虑公司出路、人事和柴米油盐等方方面面的事情,复杂程度不可同日而语。
在听起来很「高大上」的AI行业,实际的发展却困难重重。AI行业的产品难以落地,造成的结果是大多数AI公司都处于亏损状态。作为一家AI创业公司,如果没有其他业务反哺,就很难在像Google和Amazon这些巨头们的夹缝之中存活下来。
而这些公司要想获取生存空间,就需要把有限的资源投入到公司正确的战略方向上,把技术做得更加商业化并持续产出。要做到这些并不容易,「到目前为止,我也不认为这个问题得到了很好的解决」,黄伟说。
即便如此,黄伟向雷锋网新智造表示2016年他的收获还是很大,过去一年云知声的发展让他信心十足。
“我们从技术的迭代到产品模式的探索,再到商业模式的探索,去年我们算是初步走通了,至少我们把技术变成了产品,而且把这个产品形成了主营业务,这个是比较大的收获。当然,过程是煎熬的,AI技术现在还是不成熟的,把不成熟的技术变成可商业化的产品,这是个比较大的挑战。产品比较新,客户对这个是没有统一标准的,你要不断满足他会对你提出的无休止诉求。今天你看到商业落地的背后,其实是经过无数纠结和不断地打磨后的结果,我们对落地是非常有信心的。”
「创业的过程中重要的是坚持」,在信心这一点上,团队的凝聚力和战斗力也给了他很大支持。只要战略方向明确,他相信坚持下去才会有所收获。
在具体的业绩方面,黄伟表示对去年云知声的业绩比较满意。
但过程中会有一些困难,一方面是云知声在硬件上的考虑不足,他们在供应链和成本等方面遭遇了一些障碍。
另一方面,产品标准主要由客户主导,这个标准要远远高于同行业其他公司,而严格的产品测试也拉长了生产周期。
除了产品标准高,云知声在技术上的优势也领先于整个行业。尤其在智能家居领域的技术指标上,和其他公司对比,黄伟称云知声的优势「几乎是碾压式的」。
“事实上,云知声在AI领域的落地,不只是战略上的提前布局,更是用行业领先的技术去撬动这个市场。”
据黄伟透露,云知声今年的营收预计会突破9位数。在融资方面,今年会启动新一轮融资。云知声独立IPO也会很快提上议程,他希望能在两三年内上市。
黄伟也透露了云知声今年的业绩目标,他表示所有的目标都是可预期的,其中大部分都在执行去年已有的订单。
雷锋网新智造了解到,在教育评测领域云知声之前大约每天1亿次的调用量,而整个平台的调用量每天2亿多次,这在国内排在前三位;智能车载领域,云知声覆盖到了600多万台终端,占据整个后装市场接近70%的份额;在医疗服务方面,目前已跟全国30多家医院签约;而在智能家居上,云知声也在众多AI公司中遥遥领先。
“今年云知声计划在智能家居达到100万台的出货量,教育评测平台调用量上达到3~4亿次,医疗领域会新增100家医院进行合作,智能车载会覆盖到1000万台终端。”
黄伟告诉雷锋网新智造,虽然云知声业务在不断扩张,但公司目前暂时不会扩展到其他领域,而是依靠品牌优势先在已有项目上进行深度挖掘,从而扩大市场占有率。在人员配备方面,公司目前200人左右,但他表示并不会贸然大规模招揽人才,人员会适度扩张10%左右。
在2012年黄伟决定创业伊始,当时APP创业正如火如荼,但云知声的定位就是IOT(物联网)的AI服务商,从而一直坚持到如今AI的浪潮袭来。
黄伟认为,在现在看来很有远见的坚持是在当时理性而清楚地考虑后形成的结果。在当时不被投资人看好的情况下,毅然决定做toB,因为他清楚地认识到这一波AI创业潮里有工业技术背景的并不多,而他在大学毕业后就加入了摩托罗拉等公司,他们在技术和市场上有一定了解和积累。
在2006年深度学习鼻祖Hinton教授提出这个概念之后,微软在2011年间将它应用到语音识别领域,当时黄伟的师兄俞栋在意大利佛罗伦萨交流时曾告诉他这是趋势,这给了他一些启发。
而在2012年12月28日云知声的深度学习引擎上线后,它也随即成为了国内深度学习的引领者。
“我们看到AI的前景并不是瞎蒙的,而是我们的技术背景和对这种趋势的敏感。”
谈到AI未来的发展,黄伟悲观和乐观兼而有之。悲观的一点是,「在AI行业有江湖骗子在欺骗大家」,黄伟对此直言不讳。他认为人们尝试用深度学习解释一些东西,但大脑并不是这样的,「人会举一反三,可以自学习,但机器不会。」
黄伟还称真正的AI不是深度学习或者绝对不止是深度学习,强人工智能还离我们比较远,但也不排除在我们有生之年实现的可能,因为它的突破不光是算法上的突破,还包括计算能力和知识结构上的突破。
另一方面,黄伟的乐观在于对AI行业里面一些良心企业的信心,他认为这些公司会取得技术突破,从而带动和加快AI的发展进程。在技术的迭代上,他的态度较为理性。
“跟机器人谈恋爱这是很难实现的,但让机器像助理一样解决问题,这在三年之内很容易实现。估高(AI)预期的目标我是比较悲观的,但很多可执行的方向我认为比我们想象的可能都要快。”
全部0条评论
快来发表一下你的评论吧 !