电子说
与专业测绘车相比,众包更新的优势和劣势有哪些?激光和视觉两大主流众包方案的区别是什么?基于端、管、云构建的数据生态系统各有什么作用?众包更新技术存在的技术瓶颈有哪些?中海庭常务副总经理罗跃军给你答案。
中海庭常务副总经理罗跃军主讲,主题为《众包模式下的高精地图测绘技术》。本文为罗跃军的主讲实录。下面一起了解下罗跃军的主讲提纲:
1、高精地图的未来发展趋势
2、众包测绘的理论及实施现状
3、众包更新关键技术与实现路径
4、众包模式下所面临的难题与突破
在浏览正文之前,可以带着以下4个问题:
-与专业测绘车相比,众包更新的优势和劣势有哪些?
-激光和视觉两大主流众包方案的区别是什么?
-基于端、管、云构建的数据生态系统各有什么作用?
-众包更新技术存在的技术瓶颈有哪些?
主讲实录
罗跃军:大家好,我是中海庭的罗跃军。第一次用这种方式跟大家交流,如果有讲得不好的地方,大家多多包涵。
今天跟大家交流的是众包模式下高新技术的测绘技术。主要围绕四个方面来阐述,第一:高精地图的技术发展趋势;第二:众包更新的理论基础和实施现状;第三:众包更新的关键技术和实施路径;第四:存在的一些问题。
首先我们来看一下自动驾驶。在自动驾驶时代最核心的观点是要实现零碰撞的理想交通社会,车辆可以安全移动、环保节能,同时人类可以舒适愉快地移动,这里包含了三个维度:安全、环境和舒适。为了实现这个理想的交通社会,从上世纪90年代开始,汽车企业不断发展,包括倒车雷达、360度环视、车道维持以及自动巡航等功能,最终的技术形态就是自动驾驶。
对于自动驾驶的实践,在业内比较公认有价值的实践路径,就是SAE的分级定义:从辅助驾驶到部分自动驾驶再到高度自动驾驶以及完全自动驾驶。业界广泛预判2020年将是一个重要的时间节点,在这个时间节点会实现部分自动驾驶的量产,同时高度自动驾驶开始进入市场,这是一条主线,但是在局部上可能还会实现分场景的实施,比如场景优先的高级自动驾驶功能。贯穿自动驾驶实践的技术核心是感知、认知和控制,不同级别的自动驾驶,对这三个核心技术的需求是不一样的。
围绕着自动驾驶,可以看到自动驾驶对时空的感知需求催生了高精地图的问世。高精地图一般具有以下四个特点。
第一,它提供了先验的知识,它的感知范围比现有的传感器感知范围要远很多。视觉和激光最多能达200米,但更远的地方以及视距范围外的情况,传感器是无法获得的,而地图具有无限远的数据感知。
第二,地图可消除传感器的一些误差。有些传感器会判断错,虽然现在这种情况越来越少了,但还存在。当传感器无法识别像金属这些状况时,通过地图可以解决,同时地图可以告知该地区误差范围可能是多大,通过一系列AI算法,可消除传感器的一些误差。
第三,地图不受恶劣天气的影响,在雨雪天气的情况下,几乎任何传感器都失效。但只要有位置信息和地图,完全不可视的环境中,也能完成一些自动驾驶功能。
第四,地图能够表达传感器无法获得的部分知识,通过数据积累、挖掘获得部分驾驶经验的载体,可集成在地图中作为一种相应的知识传达给每一个自动驾驶终端,补充其他传感器的一些功能。
前面讲了自动驾驶和地图,相信业内朋友都很清楚,这里再多谈一下地图的发展趋势,地图的产生必须经历从现实世界到采集加工处理、数据发布多种表达形式、用户使用,再到数据发生变化,最后回到现实世界,形成地图的在现实世界的一个闭环。随着软硬件的不断发展,在地图的各个环节中,地图的采集、加工、存储、表达和应用这几个环节都不断会有技术引进和更新。
技术不断的变化可以使每个环节不断演变,进而导致新地图发生变化。在采集端,从最开始人眼获取数据,通过各种采集终端、采集设备、传感器系统来获取数据,同时从基础测绘和遥感技术变成社会化大众化采集;在加工环节,从开始纯人工处理,到AI做多元自动化的处理;在数据存储和表达上,从开始纸质载体到各种多媒体载体,从二维到三维,从静态到实时动态,从图纸记录到本地数据库,再到云端,技术在不断演变。在应用端,除了基本的导航、自动驾驶的决策规划,还会扩展到智慧城市的更多其他应用。
上面讲了地图发展趋势,高精度地图发展趋势会从专业测绘向众包更新发展。上图有几个的采集方式,最上面是专业测绘车,这是我们几个图商按照功能制作,它的成本和精度都很高,但是可以做到这种专业测绘车的很少,它通过自主采集半自动化以及全自动化生产的方式获得了高精度的矢量地图,矢量地图包括车道级拓朴、车道边线、道路区间以及ADAS数据信息,它能够满足车道级的导航功能的自动驾驶,精度和可信度高,问题是成本非常高。
在这些专业的测绘车采集高新技术基础上,我们认为可以出现一种Low Cost采集车,它的成本和精度比较低,它的数量可以多一些,它会通过采集一些精度稍低的数据,通过人工验收、数据的差分融合等技术手段来不断地更新高精度的矢量地图。最下面是众包车,成本最低,精度也很低,我相信未来自动驾驶车很多会采用同样的设备来去做自动驾驶,优势在于数量非常大。
通过数量大弥补单个数据质量精度低的问题,可通过大数据分析获得动态交通情报。对地图比较了解的人会知道,高精地图实际上分静态地图、动态地图,很多动态信息是来自于众包车辆的数据获取,包括拥堵、交通事故、天气等,还可通过多视几何、摄影测量、深度强化学习以及云雾计算等方式生成语义地图和特征地图,另外也通过大量数据共享、挖掘、分析和融合来提升精度和可信度。
众包车辆生成的数据,除了生成动态的信息能够更新一部分高清地图外,还生成了一些感知地图,用于自动驾驶辅助定位。
简单小结众包更新的创新和优势,首先众包更新是实现实时更新的低成本和可量产化的方案,具有一些非常显著的优势,中国大概600多万公里的道路数据,如果按照专业测绘的方式采集,将是个天文数字,因此如果有一个基础的高精度地图网,通过众包的方式来更新地图获得城市细道路数据,它将是低成本可量产的方案。
第二,在商业模式上也有新的吸引力,数据的使用者同时也是数据的提供者,在未来商业模式上可能会发生一些变化,随着区块链技术的发展,可能会看到新的商业模式出现。在技术上,它的难度在于精度和可信度都比较低,但是随着大数据技术的发展以及AI技术的突破,这些技术门槛会逐步降低,同时精度和可信度将逐步提高。
第二部分讲一下众包更新的理论基础。实际上,众包的概念很早就已提出,讲三种形态,第一是UGC,用户原创内容,这个概念来自于互联网,用户就是网络内容浏览者,也是网络内容的创造者,也得到了非常广泛的应用,比如维基百科、豆瓣、知乎以及抖音,每个人都可以上传和分享自己的作品,都可以作为自媒体在网上活跃起来。
第二是刘经南院士提出的泛在测绘的概念,传统测绘是利用测量的仪器测定地球表面形态的地理要素以及地表人工设施形状、大小以及空间位置等属性。根据观测到的数据,通过地图制图方法,向地面的自然形态人工设计绘制成地图,而泛在测绘是在任何地点、任何时间为认知环境和人而使用和创造地图的活动,可以理解为所见即所测绘,使用即测绘。
第三个是群智感知,是将普通用户的移动设备作为基本感知单元,通过通讯的方式形成群智感知网络,从而实现感知任务分发和感知数据收集,完成大规模复杂的社会感知任务。
接下来我们讲众包更新的数据来源和分类,可以分为四大类。第一是轨迹数据,众包、自动驾驶或其他的辅助安全驾驶有相通的功能,首先定位必须是一个高精度的定位来源,一般来自于GNSS+惯导的位置感知数据以及通过SLAM或相关技术把视觉定位、高精度定位、激光雷达定位、毫米波雷达定位等定位方式进行融合得到一个融合定位的高精度轨迹数据。但在轨迹数据中,单一的轨迹信息价值非常低,必须形成规模效应。我们要形成的产品主要是拓扑网和拓扑网的更新,同时还包括一些动态的交通信息。
第二是图像数据,图像数据包含的信息量是非常大的,大部分是非结构化的数据。实际上,这些非结构化数据要处理成结构化数据,是要通过标定和AI算法把图像数据变成矢量化数据。
第三是雷达数据,雷达包括激光雷达、毫米波雷达、一些超声波雷达。激光雷达的精度非常高的,成本也非常高,这是最大的缺点。而毫米波雷达也能够覆盖所有应用,在一些场景重构方面,对数据精度的提升很有价值。通常,激光雷达精度是足够的,如果使用毫米波雷达,需要跟图像数据等其他的数据进行融合才能得到比较好且能使用的数据。
第四是CAN数据,包含车内各个零部件在毫秒级层面上输出的数据,这些数据的挖掘对做无人驾驶的决策算法有非常好的作用。
围绕刚才的众包数据分类,目前国内外出现了不同方案的众包公司,这些初创企业都做得非常不错,主要有两大方案,第一是以视觉为主,比如有Mobileeye、IvI5以及国内的宽带科技等企业。以IvI5为例,左上角是IvI5的制图样例,制作视频APP应用,向目标锁定到Uber等平台的司机用户上,使用者可以将手机固定在汽车仪表盘上方,下载该应用并在驾驶室的启动,会开始录制视频,同时收集加速度GPS数据,驾驶员每驾驶十英里大概可得到几美分报酬,这些数据最终将帮助IvI5团队创建高精地图。
另一种方案是以雷达为主,比如DeepMap和Civil Map等公司,主要是将激光雷达获取的点云数据利用AI识别道路特征,把道路边线、车道线以及一些看板的特征识别出来,建立起地图更新或直接构建感知图层。由于激光雷达价格远高视觉传感器,所以它在数据规模上是不及以视觉为主的传感器的规模,但它精度更高,因此这两种方案各有利弊。目前如果能把这两个方案融合在一起进行取长补短,可能会是比较好的方案。
这张表展示了对激光和视觉两大主流众包方案的比较。激光为主的方案有成本高、精度高的特点,核心传感器是不同线数的激光雷达,众包数据源包括激光点云数据或者一些数据照片等数据,核心处理算法包括三维建模、计算机视觉等方面,输出成果有三维模型、车道模型和地面相关要素。在以视觉为主的方案中,成本低,精度也相对低,核心传感器有全景相机、单目相机、双目相机等,甚至手机相机和行驶记录仪都有可能作为它的输入,它的众包数据源是照片、视频、轨迹数据,核心算法包括多视几何、深度学习、多元语义分割等,输出成果具有高精度的拓扑关系及能识别出的交通标志牌。
实际上,众包是未来地图更新的必经之路,所以在各个领域都有不同的厂商在发力。从技术路径上讲,有激光和视觉两大方向。第一,有很多整车厂以及OEM厂商已经开始在做;第二,互联网巨头如Google、百度、阿里已经在关注并开始发力;第三,很多出行和物流服务商也在做,Uber、滴滴、京东等;第四,典型的图商,如here、四维、百度、高德,包括我们在内及新型初创公司,大量的新初创的技术,都贡献不少,包括civilmap、deepmap、lvl5等等。
我们来看一下众包更新的关键技术和实现路径。我们认为基于端、管、云构建的数据生态系统,终端主要是传感器、本地的计算能力以及高精度定位。通讯主要是管,负责数据传输和信息安全;云端需要有AI大数据处理、地图生成和构建。高精地图的众包主要是分为两个部分:智能感知终端,即端的感知能力,还有高精度地图云,在云端做高精度的融合和更新处理。
在终端层面上会有哪些工作呢?这幅图主要展示了汽车所能应用的绝大部分传感器,激光雷达、差分GPS、惯性导航、一些其他的传感器,包括路侧单元传感器、身体生理传感器(如检测疲劳驾驶)及温度、湿度、风向传感器等,这些传感器能完整地获取人体以及车辆的自身状态,不仅可以挖掘自车状态的数据,也能用于自动驾驶,还是未来动态地图众包更新的一个来源。比如通过测量车辆雨刮的使用状况以及频率,能够间接了解该区域天气情况。在终端方面,我们的主要任务首先是高精度的融合定位,如果我们需要轨迹数据,那么我们希望这个轨迹数据至少是分米级的定位精度,通过差分GPS和惯导能够获得一些位置,再通过融合定位的方式,去生成精准的轨迹。
传感器除了获取轨迹数据和相关的车辆数据之外,算力也非常重要。它要将传感器所获得的数据进行计算或识别成我们通过众包云端能够使用的一些语义地图,传感器实时产生的数据量非常大,在现在的通讯状况下,把这些数据传给云端,通讯压力很大,同时大量的数据在云端将会被浪费。因此终端需要一定的计算能力进行初步的数据对齐和处理,例如感知特征识别和地图要素矢量化,这些处理需要同步传感器的时间以及合理的调度和优化资源。目前世界上比较好的终端开发平台是NVIDIA的Jetson TX2,搭载代号Parker的Tegra处理器、6核CPU架构、256核Pascal架构GPU核心,整体模块功耗低于7.5W。
终端最开始核心是定位,还需要感知识别,它首先需要图像数据的感知,最好的方法是利用AI深度学习的处理方法,实质就是将非结构化图像数据转化为结构化数据,包括识别的特征、物体的种类、位置和姿态等等。非结构化数据,比如行车记录仪的视频数据,包括数据采集、数据压缩和数据存储;而最终的结构化数据,包括了初步识别的结果,如交通标志的识别结果、车道线等。
对于转化的过程,都是深度学习来做的。我们所需要样本的训练过程以及针对性的样本模型,相信大家都比较熟悉这些工作了,我就不展开讲了。
这里也简单地说明一下,在做深度学习时,首先需要标注,需要一些标注的数据来进行最后的推理和使用。这些标注的工作是由大量的人工和半自动化的方式来实现的,有的可以利用开源的数据集来训练,也有模型能够自动地生成部分的数据,包括人工的筛选用来表示对错的一些标识。这些工作在业内也有专门的公司会帮我们来做。
同时,标注的类型我们可以分为物体级别标定、物体属性标定以及物体像素级别的标定,可以根据实际的需要来进行选择。
接下来我们看一下管端,众包数据不可能都在终端完成,因此它需要把数据传到云端,在管端主要是通讯,通讯方面我们可以看几个数据,首先是原始感知数据,如果要把原始数据全部传到云端,在高速公路经过SLAM或其他特征提取后大概是50兆/公里,如果要将非常完整的激光点云往上传,一公里大概都需要一个G的数据,而整个全国高速估计得要TB级了,因此云端是不需要这么庞大的数据的,我们只需要将矢量化的数据往上传,矢量化的数据在高速公路基本上每公里可以做到10KB的数据量。
在管端,除了通讯,还需要关注数据传输的协议。目前主要流行的协议是ADASIS协议,同时还需要关注它的信息安全,未来的5G和V2X的发展也会给通讯带来革命性的变化。
上图的下面有两幅小图,可以看到车跟车之间的通讯、车和路以及车和人之间的交互的数据,这些都会成为我们未来新众包数据的来源,可以用于实时交通信息的数据获取。
接下来我们要看看云端要。在云端,主要利用AI机器学习以及大数据处理等技术,从海量众包数据中获得有效的信息,为高精度地图的生成和构建做准备。对不同类型的众包数据,处理方法会不一样。对轨迹数据我们要遵从经典的数据挖掘的方法,包括数据清洗、配准、挖掘等过程。挖掘的算法也有很多,在左边我们也写了很多算法,大家可以去了解一下,包括相似定义算法、以时间聚焦的轨迹聚类。
在进行机器学习和大数据清洗处理之后,就可以进行构建地图了。上图是地图生成和构建的基本流程。我们将得到识别出的道路边线的形状以及地物类的位置属性,这是我们的输入,但是这并不是我们所说的高精度地图,我们还要进行专业化的地图生成和构建,其中包括点线融合、形状点一次构建、拓扑构建,在这个基础上,再进行形状点二次构建,增强它的几何形状,使二阶更加光滑,并计算出它的坡度曲率,然后再构建出车道的模型以及静态标志融合等多个步骤。
其中拓扑构建指的是道路和车道间的连通性关系。车道模型构建中需要根据形状的信息生成高精度的坡度、曲率和ADAS数据。
接下来我们谈一下众包测绘存在的一些问题。主要是以下几点:
第一是传感器数据来源和标准;
第二个是众包测图与更新的行政许可,也就是政策门槛;
第三是众包数据的质量和精度。
首先,传感器数据融合还存在着很多问题,传感器的种类很多,性能的差异非常大,传感器的数据格式不统一,多传感器数据融合技术仍存在着一些技术壁垒。而在技术壁垒方面,可以有以下几个问题。
第一,还没有建立起统一的融合理论和有效广义融合模型及算法;
第二,对数据融合的具体方法,目前的研究还在初步阶段,虽然有一些比较好的成果,但我觉得它还有很大的发展空间;
第三,还没有很好地解决融合系统的容错性和鲁棒性的问题,虽然大数据融合包括深度学习是概率性的问题,但是我们还无法量化它的鲁棒性。
第四,关联的二义性是数据融合的主要障碍以及数据融合系统中的设计也还存在着很多实际的问题。
第五,在上传协议方面,目前会针对已有的车联网车辆数据上传协议,主要用于车辆间动态信息的交互,需要针对众包制图方面扩展协议内容。
虽然here在国际上也有一个Sensoris是相关的协议,但是这并不是一个统一的标准,国内也在做一些标准化工作,在标准化组织方面,我们几个图商在国家的指导下,将会形成一些标准化的工作。
另外一个问题是政策问题。实际上,众包数据的搜集是有一些政策的。虽然没有明确的行政许可,但是根据测绘法对策行为的定义:企业性质的大范围带GPS和不带GPS的地理数据搜集都属于测绘行为,数据需要由甲级导航电子地图资质的图商来收集处理。
可以看到,通过定义,对众包数据的搜集有着极大的限制。导航或自动驾驶汽车搜集车端带GPS数据都属于测绘行为,如果GPS数据需要加工成图,需要有资质的企业来进行数据的搜集和加工;如果GPS数据用于对接监管平台,需要通过有资质的图商对数据进行管理和监管。对于不带GPS的数据,比如影像、视频等,如果是大范围的、企业性质的采集也属于测绘行为,因此这并不是所有的人、图商或者车厂能够采集的领域。
还有更加严格的政策监管,包括基础地图生产、地图数据存储、地图更新、地图出版销售等等各个环节都需要有资质的限制。通过资质可以看到,对众包更新会有很大的限制,但是这对未来的自动驾驶以及众包更新来说是一个大的趋势,国家将自动驾驶作为一个战略发展方向,我相信在未来的政策限制方面,国家会有一定的考虑的。
最后来看众包更新存在的一些技术上的瓶颈,主要在于众包的制图能力,它是不是真的能够达到我们所期待的众包更新。第一,数据质量与覆盖范围终端设备数量是密切相关的,我们要想获得众包更新的数据,前提是有大量的、可以完全跑的相关众包车辆。从采集端来看,为了保证精度,每条车道上最好能够有一定的覆盖,一般情况下10遍左右,当然有更多是最好的,因此在众包地图中,它一定要有足够大的用户量,这可能就会出现鸡生蛋和蛋生鸡的过程。
在数据内容上,我们需要一个完整的车道系统网络,不光只是一个车道边线和中心线,还需要得到它的拓扑关系,包括虚拟连接线;众包数据在精度属性上还有点欠缺,在右下角的图上,我们可以看到有些地方的虚实线有断裂、有些地物的标识不精准以及路口内虚拟连接线有交叉等等,这些问题都会导致在精度方面的问题。
虽然未来我们会获得一些精度和属性上有点欠缺的数据,但我们希望能够像之前说的,以专业的采集数据为基准,与众包数据通过在精度方面的融合以及贝叶斯过滤算法等等技术去提高精度。随着技术的发展,精度也会逐步提高,在未来,通过这种方式肯定能够满足我们数据更新需求。
以上就是跟大家分享的内容,大家有什么相关的问题,我们可以一起来讨论。谢谢大家。
全部0条评论
快来发表一下你的评论吧 !