高德发布全球首个3D原生城市世界模型ABot-Earth0.5

描述

近日,阿里巴巴集团旗下高德正式发布 全球首个3D原生城市世界模型ABot-Earth0.5 ,同步宣布已建成覆盖190多个国家和地区的3D地图——这是目前全球覆盖面积最广的3D地图。

这不是又一个"能生成3D场景"的Demo,而是一套从底层技术路线到产业落地全部打通的系统。高德把它比作从"手工作坊"到"自动化工厂"的跨越,背后的核心改变在于:它是 完全基于3D数据训练的原生模型 ,而非从2D图像蒸馏出3D结构的折中方案。

过去所有3D城市建模,走的都是"先拍2D、再拟合3D"的路线——航拍采集、点云处理、机器拼接、人工精修,每一步都需要专业设备和大量人力。完成1平方公里通常要数小时到数天,成本高昂且无法规模化。行业里一直想跳过这个瓶颈,但"从2D蒸馏3D"的路径天然存在精度损失和一致性问题。

ABot-Earth0.5走了一条完全不同的路:直接以3D数据训练模型,让模型建立对三维空间的原生理解,端到端一次性生成3DGS格式的城市场景。

这条路理论上优势明显,但落地极难。原始3DGS数据难以被大模型直接高效训练,公里级原生3D场景的连续生成更是巨大挑战。高德在三个环节实现了系统性突破:

训练环节:首创面向3DGS点云的压缩-生成框架。 能够将包含数百万基元的高质量真实世界3DGS场景编码到紧凑的隐空间,并从中生成全新场景,有效解决了3DGS无序性等问题,让模型能直接"阅读"大体量3D数据。同时依托高德自有三维数据训练,确保生成内容与真实环境的几何和空间一致性。

推理环节:提出滑窗推理(Sliding-Window Inference)机制。 通过在重叠区域进行智能融合,将分块生成的场景一致拼接,实现公里级广域连续构建,保证了空间连续性——这是此前原生3D方案最难攻克的问题之一。

生成环节:跨域自适应模块+多层次细节解码器(LOD)。 跨域自适应模块弥合了卫星影像与三维训练数据之间的分辨率域差异;多层次细节解码器让生成结果自带远近景深,无需后处理即可适配不同视距的流畅漫游。

用户只需输入一张卫星图像或一段文字描述,系统在一块消费级GPU上、10分钟内即可生成公里级3D城市场景。输出的是可编辑的3DGS格式素材,能直接导入Unity、Unreal Engine等主流引擎进行交互开发。

这意味着高精度3D城市生成从"重资产"变成了"轻工具"。以前只有大公司烧得起的3D地图,现在一张消费级显卡就能跑。

ABot-Earth0.5不是停留在论文阶段的技术,高德已经在多个产业方向推进落地。

具身智能:机器人训练场景分钟级构建。 ABot-Earth0.5将训练场景构建时间从数天压缩到分钟级,填补了开放环境训练数据的空白。高德此前推出的城市级仿真训练场,底层即由ABot-Earth0.5驱动,已支撑全球首款开放环境全自主机器人——高德途途在城市环境中的仿真训练。这对具身智能行业意义重大:机器人最缺的就是海量、多样、低成本的真实场景训练数据,ABot-Earth0.5直接把这个瓶颈打穿了。

低空经济:让无图区域有图可依。 凭借卫星影像即可快速生成对应区域3D地形的能力,ABot-Earth0.5能覆盖传统测绘在复杂地形和特种区域的盲区。低空飞行器需要精确的3D地形数据来规划航线、避障,过去很多区域根本没有高精度3D地图,现在一张卫星图就能生成。

影视与游戏:AI直出替代手工建模。 城市3D场景生成从建模师手动制作变为AI直出,创作者可以把精力集中在创意本身。这对游戏开放世界、影视虚拟拍摄等场景的降本增效是实质性的。

应急救援:分钟级还原灾祸现场。 分钟级3D制图能力可快速还原灾祸现场三维环境,为指挥调度提供科学依据,为救援力量部署抢时间。

ABot-Earth0.5真正的价值不在于"能生成3D城市"——能做这件事的模型越来越多。它的核心壁垒在于3D原生训练路线+公里级连续生成+可直接用于生产的3DGS输出这套完整闭环。当其他方案还在从2D图像费力拟合3D结构时,高德已经让模型直接"理解"三维空间,并且把生成效率拉到了传统方式的千倍、成本压到了百分之一。这不是渐进式改进,而是3D地图生产方式的范式切换。目前已开放内测,可前往abot-earth.amap.com申请体验。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分