电子发烧友网报道(文/李弯弯)由于比2D更精准、更安全,3D视觉逐渐在一些行业中得到应用,不过新技术在成长初期,都会有技术不够成熟、成本过高的问题,那么3D如何跨越规模应用的鸿沟,的卢深视创始人兼CEO户磊日前在第四届全球人工智能创业者大会上做了精彩分享。
的卢深视2015年8月成立,专注于三维机器视觉和人工智能领域,是国内唯一打通“真三维全栈技术、并实现国家级项目落地应用的公司。的卢在高精度深度感知成像、三维实时高精度重建、三维跟踪识别及感知等技术方向上,都处于业界领先水平。
户磊表示,从技术赛道来看,的卢深视以人为对象,实现3D机器视觉智能架构,比如将人的身份、行为轨迹精准数字化。最初从3D人脸切入,比如表情捕捉,通过人脸高精度重建、精准识别,现在开始做人体重建,包括动作、手势识别以及人体特征体系,后面会进一步做人体动作特征,拓展到更多推理和大数据应用。
3D和2D的区别,除了通常讲的数据、算法外,还有3D相机传感器。3D最终是数据、算法、相机传感器通过各种各样的模块形态,或解决方案形成规模应用。那么3D视觉规模应用存在哪些问题?
数据方面,2D图像数据在现实生活中比较普遍,户磊介绍道,“以人脸识别为例,我们比较容易通过公开数据或社交网络搜索图像,标注实现还不错的人脸识别算法研究数据集,但3D数据现在比较稀少,需要从源头开始积累。同时,好的3D数据没有公开标准。”
图形算法方面,2D图像是规则的矩阵,比较容易用神经网络的方式处理,而3D数据是不规则数据,3D和2D在网络结构和算法设计上会有所不同。
相机传感器方面,现在近距离、高精度已经比较成熟,并且已经走向应用,而远距离、高精度,包括复杂光照下的抗光性等方面,还有很多问题需要解决。
虽然如此,现在随着各种各样应用的深入,3D其实开始逐步走向规模应用,以人脸识别为例,人脸识别技术本身的应用就非常普遍,不管从管理、服务、体验来看,身份认证都是各行业开展业务时需要用到的重要环节。只不过最初大家普遍通过图像方式进行人脸识别,比如照片。
人脸身份认证技术,还需要一个更完善的人脸识别身份认证方案。在户磊看来,一个完善的身份认证方案需要有几个元素:一是有很好的威信;二是有很好的体验;三是有很强的安全性,主要是指有防攻击、防伪的能力;四是要快,并且在各种环境下,比如各种光照下都可以准确识别。
在前期的应用中,人脸识别也逐渐呈现出对唯一性、安全性有更高的要求,因此就有了3D技术的应用,3D技术的优势在目前的一些应用案例中,有很好的体现。
比如金融刷脸支付,因为刷脸支付直接和钱相关,如果要解决在支付过程中,不被照片、平面的一些物体攻击,就需要引入3D相机,从数据的源头上百分之百杜绝低成本的攻击方式。
再比如在一些大场景支付中的应用,轨交刷脸进站,户磊表示,“这可能就是千万级用户的应用,每天都有千万级的人流量,在千万级用户下做精准识别,就需要有更多特征和更准确的识别率。”
3D应用要涉及到3D数据、3D的库以及3D前端设备,3D设备必然会带来成本的增加,但是随着规模化应用,3D应用也会逐步走向平民化。事实上,通过应用普及和规模化量产,以及产业的努力、技术迭代和更新,现在3D相机在成本上已经和很多传感器成本非常接近了。
户磊认为,除了产业链的发展,应用能够规模化以外,3D在技术上还有很多需要探究的地方。在他看来,技术升级带来成本下降和规模应用带来成本下降一定是交织状态,两者不断交织往前推进,最终跨越规模应用的鸿沟。
从技术本身来看,的卢是创新基因与市场需求结合的团队,户磊介绍道,“的卢提供光电和算法一体设计的整体解决方案,从市场需求出发,通过科学家团队和高校紧密合作,把所有系统研发分成实现领先性的技术规划和支撑产品的技术规划,并通过新技术预研,到产品原型验证,再到产品研发的突破式迭代,最终实现可规模量产的产品。”
这一套体系由一个三维视觉工程化平台支撑,包括光学验证、仿真平台,算法验证、仿真和测试平台,机械和电气验证、仿真和测试平台。
户磊认为,光学和算法一体化设计非常重要,算法和光学一定要做交互设计。
光学部分,包括设计仿真平台,有散射仿真,随机点针仿真、光学表面设计和激光器件仿真设计,还包括原型验证平台和可靠性验证平台。
算法部分,包括结构光系统验证平台、双目系统验证平台、深度数据质量评测平台和复杂光照模拟系统等,还包括100万标准3D人像数据库,千万标准3D人像数据库、十万标准3D人体数据库,活体检测验证系统等。
机械、电气部分相对来说会更常见一些,包括要做大规模的百万级、千万级量产所必需的一些基本验证和仿真测试的工具。
所有这些构成了一个完备的工程化能力。
在产业链的定位上,的卢是三维视觉感知系统整体解决方案提供商,提供从3D相机成像系统设计、3D算法、以及这两个融合在一起形成的完整3D感知技术模组,和在一些行业中,根据行业属性,提供3D终端产品。
在提升易用性和性价比方面,的卢还自研结构光深度恢复算法,有完整的FPGA、ARM、GPU平台方案,了解算法需求;有自研的散斑增强算法,提升模组的环境适应性;有自研的光学系统补偿算法,可以对温漂、装配误差进行补偿,保证一致性和良率。
的卢的相机目前已经广泛应用于刷脸支付、地铁轨交刷脸过闸、以及现在医保身份认证等很多场景中。
高精度结构光RGBD相机,可用于刷脸支付终端、银行ATM、无人机货柜、地铁刷脸闸机、AR/VR、物品体积测量等场景,该款产品体积小巧易于集成,同时内置低功耗AI加速芯片,可支持Face ID、活体检测。
在刷脸支付方面,的卢与金融头部企业合作共同推进刷脸支付建设。
另外的卢还面向其他智能家居场景推出了3D Face ID智能模组,可应用于家庭智能门锁、只能保险柜、酒店公寓智能锁、智能门禁等场景中。该模组集成了3D结构光深度恢复算法、人脸识别算法等,不需要任何主控,直接对接硬件和软件接口即可。
该产品使门锁可以长期低功耗工作,实现在电池供电的情况下,至少9个月不需要充电,户磊认为,我们已经真正具备了可以成熟应用的能力,现在正在和一些互联网巨头合作智能门锁项目,预计今年年底或者明年就可以在市场上大规模普及。
整体而言,在户磊看来,3D要跨越规模应用鸿沟,需要具备几大特质:技术成熟、安全升级、体验升级、成本极致。
户磊认为,在技术成熟方面,技术方案一定要能够满足真正的应用需求,或者远高于应用需求,其在应用场景中要比较容易落地;在安全升级方面,目前随着应用的普及,越来越多的应用被发现容易受到攻击,而3D的安全性则比2D更高;在体验升级方面,即需要考虑在更大角度的情况下,复杂光线、完全黑暗等的情况下,是否可以达到一致的识别体验;在成本方面,一个好的方案同时一定也要做到成本的极致,它的成本一定不能给用户或者场景带来更多负担。
全部0条评论
快来发表一下你的评论吧 !