大华基于AI的场景流估计算法和光流估计算法刷新全球最好成绩

枫雪路 2021-01-22 1216

安全设备/系统

153人已加入

描述

大华股份基于AI的场景流估计算法和光流估计算法再次取得突破性成果，各项指标再次刷新了KITTI Sceneflow、KITTI Flow两项竞赛的全球最好成绩：场景流和光流的3像素错误率指标分别为5.06%、3.79%，指标均创历史新高，持续保持领先水平。

大华股份AI取得KITTI Sceneflow排行榜第一

大华股份AI取得KITTI Flow排行榜第一

场景流算法可同时估计场景中物体的三维位置与三维运动矢量，光流是场景流映射到二维图像坐标系的投影，应用价值广泛。为提升场景流估计精度，大华AI团队优化了一系列算法模块。首先，基于yolact++网络进行实例分割，从场景中分割出行人、车辆、自行车等前景目标，然后基于最新架构的GANet计算初始视差图，得到更精细的视差图，在使用RAFT网络得到精细光流图，最后通过多阈值融合等策略，进一步优化场景流估计结果。

在测评中，场景流和光流算法的效果和计算结果如下：

▲输入图像

▲T0时刻视差图

▲经光流映射后的T1时刻视差图

▲T1时刻到T0时刻的光流图

▲场景流误差图

该项技术已在大华双目摄像机、全景摄像机等设备中得到应用，提升多目摄像机的目标深度数据计算、目标行为分析等算法性能；同时，该技术也成功应用于AR融合领域，实现单个及多个摄像机图像的AR语义融合应用，极大提升了行业解决方案的用户体验。

双目摄像机行为检测应用场景

▲双目图像图

▲视差图

▲光流图（目标三维运动矢量）

AR语义融合应用场景

▲真实图像

▲AR语义融合，增强目标类别、位置、运动矢量等信息

近年来，在算法商业化落地方面，大华积极应用主导个性化AI方案敏捷交付，构建人工智能端到端研发的全链路能力，实现AI从基础能力到算法研发到产业化应用落地，构建了围绕视图智能、3D智能、多维智能、控制智能等核心算法体系，实现了在各业务领域的人工智能算法、产品与解决方案的全面覆盖，赋能百行百业。

大华面向用户需要开放全栈能力，赋能行业生态，并在实战中持续积累人工智能核心技术，针对全场景理解、小规模数据、泛化能力、多任务学习和AutoML等人工智能的技术挑战，开展实践探索，并已取得实战应用成果。

未来，大华股份将继续推动AI技术与各行业场景的深度融合，充分发挥科技创新对百行百业可持续发展的支撑引领作用，推动AI等新一代技术的普及与落地，赋能百行百业数字转型升级。

责任编辑：gt

打开APP阅读更多精彩内容