时间退回到8年前。
2010年,微软推出一款搭载Xbox游戏机的Kinect体感控制器,它能让游戏迷们用身体、手势、声音来操控游戏。由于体感交互这一概念在当时足够新鲜,Kinect上市两个月就卖出了800万台,并拿下“吉尼斯世界记录中销售速度最快的消费电子设备”的头衔。
Kinect的面世,也是李骊创业的起点。他现在是3D机器视觉和3D MR(混合现实)解决方案公司华捷艾米的董事长,创业前曾先后在联想和中兴工作。
3D视觉即三维立体视觉,大部分人对这一概念的理解起自苹果Face ID。它能提供精确的人脸(活体)识别,也能精准捕捉人的动作和情绪。刷脸支付和AR Emoji表情是3D视觉目前在消费电子终端上的典型应用。MR即混合现实,它强调虚拟物体在现实世界中以实体形式出现,目前在医疗领域应用较多,比如通过佩戴MR眼镜来观摩手术、完成医学教学等。
“Kinect让我感觉电影007里的东西变成现实了。当时特别兴奋,觉得体感交互是个机会,所以当即就决定和几个朋友一起创业。”李骊告诉36氪。
团队最初的阵地在深圳华强北。李骊一开始想做一个类似Kinect的产品,但后来发现项目所需的技术门槛太高,于是决定到北京寻找资源。当时,团队需要的底层技术人才都聚集在北京的各大科研院所里,拉他们“入伙”并不难。李骊回忆称,公司早期的大部分技术人员来自火控雷达、导航等专业,他们不像计算机系的老师有很多项目要做。再加上体感交互技术在当时的环境下极具挑战性,大部分老师愿意无偿接受这个挑战。与此同时,华捷艾米也开始与国内一线相关院校展开合作,如清华、北理工、中科院等,技术团队很快组建完成。
最初,李骊的项目得到了国家基础基金、学校和科研院所和教授们的多方支持。但这样持续了3年后,瓶颈出现了。“2013年的时候,我们实际上有过动摇的念头,技术突破受阻。” 李骊对36氪回忆道。
“直到2014年下半年,经过长期的努力和坚持,团队才终于拿出了一款类似Kinect的纯Demo级的设备。尽管离实用还有一定距离,但也算给了团队希望和动力。华捷艾米的骨架识别算法当时可以说已经达到了国际领先水平,与苹果花3.6亿美金收购的专门做骨架识别的Primsense主流技术指标并无差别。”李骊介绍道。
经过一系列技术和算法的打磨,华捷艾米当时的研发水平已经很成熟,包括到现在,华捷艾米是全国唯一一家拥有3D智能SLAM和3D骨架技术的团队。从2014年拿到投资人的第一笔钱到今年3月完成近5亿元B轮融资,四年间华捷艾米的员工规模扩充到300多人,业务范围也从体感交互拓展到3D视觉和MR(混合现实)。据李骊介绍,一个科技公司,技术与产品落地应用的人员比例至少是1:3,华捷艾米的团队目前还是以纯技术为主,未来会加大在商业化落地的人员投入。
熬过起伏的早期创业阶段后,华捷艾米现在想做一些“更大的事情”。在李骊的规划中,华捷艾米将在明年1月量产一款3D MR芯片及3D模组,为手机、智能安防、新零售、智能家居等不同行业提供一整套解决方案,目前,IMI3000的AI芯片及模组已经成功应用于微信3D人脸支付终端、门禁产品终端,在各大商超落地应用。李骊还告诉36氪,华捷艾米已经开始着手开发混合现实相关的社交软件,一旦落地,它将会比抖音更好玩。
以下是李骊在第五届世界互联网大会上接受36氪采访的内容,经36氪编辑整理。
36氪:华捷艾米目前商业化的主要方向是什么?
李骊:我们主要为新零售、智能安防、活体识别、体育、创意制作、教育等行业提供3D视觉解决方案。
36氪:按照华捷艾米的发展节奏,有哪些可量化的发展目标?
李骊:从明年开始,我们会向市场提供一个标准化的MR模块,它可以放在各个终端里面去,相当于让所有东西具备了眼睛。
我们正在推生态共建的商业模式。首先是核心技术算法,以及将于明年年初问世的MR芯片其功能定义跟微软的HPU2.0差不多,另外还有3D光学模组。我们以这三块东西为基础,对外提供软硬一体的技术解决方案,服务于开发游戏、教育、电商和医疗等应用的厂家,他们来进行更新一层的产品开发。除了这套开发工具,我们之后还会有一个应用商店,现在正跟腾讯联合做一些社交的东西,会比抖音更有意思。
36氪:什么样的社交软件?
李骊:这个软件和抖音不同。比如昨天的你和今天的你怎么合成在一起?你和家人怎么通过社交软件聚合在一起?通过我们这个软件将两条同步拍摄的视频拼合在一起,通过实时构建背景,可以是白雪皑皑的北地,也可以是葱葱郁郁的南国,根据我们自己的意愿随意更换,实现两个不同空间和不同地域的人在同一时间去对话沟通。
再比如,我们看到朋友圈在晒炫酷的街舞,通过我们的这个软件,你也可以成为朋友圈里的街舞大咖。我们通过识别舞者的人体行为,然后叠加上自己的模型,你就可以成为那个跳街舞的人了。我们还可以通过复制舞者的行为动作,在同一场景叠加上我们自己的模型,你俩就可以一起尬舞了。无限的想象空间都是该社交软件的内容来源。我们从今年4月份开始做社交方面的工具开发。我相信这个东西将来会成为爆款。
36氪:MR芯片的量产对商业落地场景意味着什么?
李骊:它相当于是一个通用芯片,可以用到安防、医疗、教育、娱乐等不同方向。我们现在的芯片算力有限,不能支撑MR的技术算法运算。要实现MR的效果,光靠硬件的CPU带不动,放在手机里面,手机死机,放在大屏里面,大屏也带不动。所以,等到明年1月MR芯片问世,结合我们软硬一体的技术方案,全行业都可以打通了。
36氪:能具体谈谈这款芯片的应用场景吗?
李骊:它的主要应用场景包括新零售、消费电子、智能家居、智能物流、安防等。新零售的话,比如用3D视觉来识别顾客身份,分析顾客行为,让他们能够虚拟试衣,通过3D刷脸支付。消费电子和智能家居方面,这款芯片可以应用到MR手机、MR眼镜、智能投影仪、智能电视等智能硬件中。智能物流上,利用3D视觉,可直接通过移动设备的相机,测量画面中的货物体积等。
36氪:MR会是中国消费电子市场的一个新风口吗?
李骊:应该叫升级的一个关键点。MR是智能终端的一个基本部分,会像现在的 WiFi 那么普遍。它一定会成为标配,这也反映出整个市场有多大。智能手机向MR的更新,有两个很大的变化:一是这一次是从最底层开始革新,每一个代码都要革新,很彻底;二是上一次的更新有高通给我们提供芯片和解决方案,所以苹果2007年做出iPhone后,中国跟的很快。但是这一次没有,国外厂商已经不再提供方案了,需要靠我们中国自己的前沿科技企业奋起。
36氪:对于中国手机厂商目前在3D视觉应用上的困境,您有什么新的观察?
李骊:实际上最大的难题,我觉得还是国内厂家的敏感度和紧迫感不够。总有一种想法是苹果出来什么东西,我半年或者一年就能跟上。以前做指纹,中国花八个月跟上了;出双摄,中国六个月跟上了。但是这一次MR芯片的更新是很彻底的,真不是那么容易能跟上。
还有一个难题就是应用部分。比如苹果做芯片有3000多个人,可能技术人员有七八百,做产品的有一千多人,还有一千多人就在做应用。应用这一块,需要全行业一起干,不是一家的事情。如果没有应用,一切技术都是零,这就是所谓的生态链。还有一个就是标准的问题,这也是我们很恐慌的问题。
36氪:是针对什么的标准?有解决方案了吗?
李骊:MR设备需要做到互联互通,你在家里玩,我在家里也能玩,咱们可以隔空玩。这里面就会涉及到传输、解码、接口标准的问题。微软和苹果实力非常强,它自己就可以成为事实上的标准。那对我们来说就存在跟着他走还是不跟他走的问题。我跟着他走会面临侵犯知识产权的风险,我不跟他走会担心应用开发商们不用我的东西。我们目前正在跟国家,还有一些厂家一块合作,一起推动确定MR行业的标准。
36氪:您预计MR何时会大规模普及到普通用户群体中?
李骊:苹果现在推的东西也不是MR,只是装了3D视觉而已。但我认为MR会在明年的某一时刻爆发,或许在上半年。
一方面,苹果和微软这两个具有强大带动力的企业已经准备好了。苹果的一系列硬件产品,包括电视、机顶盒、游戏机、智能音箱等,向MR升级的样品都有了。我们从供应链得到的消息是,苹果已经在大规模采购MR相关硬件。另一方面,MR本身符合用户的使用价值,它会带来更多新奇有趣的玩法,起码从娱乐上完全不同,购物上也是崭新的体验。
36氪:您此次参与第五届世界互联网大会“数字经济”论坛,怎么看数字经济时代创新型独角兽的发展?
李骊:首先,国家的扶持和政策引导是创新型独角兽生存发展的沃土。前不久国家就人工智能发展现状和趋势举行了第九次集体学习,也突显出对人工智能的重视。未来一定是人工智能的未来。另外,技术是独角兽成长的第一驱动力。很多技术一直受困于国外垄断,国内创新型独角兽要想发展壮大,必须强化技术内核,在政策利好的背景下,占领风口引领潮流。
全部0条评论
快来发表一下你的评论吧 !