×

自动驾驶入门(十一)之深度估计

消耗积分:0 | 格式:pdf | 大小:0.16 MB | 2023-06-07

龙献益

分享资料个

在自动驾驶感知算法中,有一个重要的分支是单目视觉检测,在检测目标是单目相机最困难的地方在于恢复目标物的深度信 息,无论使用小孔成像还是逆透视变换等方法都无法做到任意场景的鲁棒,并且在远距离也有较好的深度回复能力。 神经网络给我们提供了一种全新的解决思路,使用cnn直接回归出目标在相机坐标系下的深度信息,这种做法可在一定程度上 达到激光雷达的效果,令人兴奋!如果使用多个不同焦距的相机进行拼接,完全有可能实现纯视觉感知。 BTS网络是目前市面上相对优秀的单目深度估计网络,他的主要引入了局部平面假设来回复深度图的分辨率,一般市面上都会 使用encoder+decoder的结构去完成深度估计,但是在encoder过程中由于stride和pooling会使得feature的分辨率逐层减小,虽然可 以通过多尺度网络,反卷积网络,SPP模块来解决,但是这些解决办法在恢复分辨率的时的做法其实都比较狂野,效果一般。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !