计算机视觉是一个复杂且具有挑战性的领域,深度学习的进一步发展为该领域提供了许多丰富的解决方案。计算机视觉和深度学习常应用于自动驾驶、人脸和图像识别等领域的技术研发和升级,为各行业带来了以数据为支撑的未来新思考。
复旦大学大数据学院 Zhang Vision Group 成立于 2020 年,研究方向为计算机视觉和深度学习,其目标是通过神经网络的数学模型理解物体、场景和运动的最通用表示,赋能下一代人工智能(AI)。目前,该课题组正致力于开展计算机视觉驱动的自动驾驶研究,其采用了 NVIDIA 认证的服务器,搭配最新的 NVIDIA RTX 6000 Ada 架构 GPU,为实验提供了兼具可靠性、可扩展性、高性能的运行平台,提升了计算机视觉模型的训练速度和模型性能。
数据和模型体量加大
GPU 显存与计算性能压力
自动驾驶开发涵盖多个方面,不仅包含车辆自身相关的行驶功能,还需要“训练”自动驾驶汽车如同人类驾驶员一般“观察”道路环境、“识别”突发状况并及时做出相应操作以保证行驶的安全性。在此过程中,开发人员逐渐引入计算机视觉和深度学习,以提升车辆定位、道路识别、障碍物检测和障碍物跟踪等方面的准确性。
Zhang Vision Group 在研究计算机视觉驱动的自动驾驶过程中发现,随着研究范围的拓宽和研究内容的深入,需要处理的相关数据集越来越大、模型的复杂度越来越高,对现有 GPU 显存和计算性能提出了更高的要求。
NVIDIA 强大的 GPU 性能
助力提升模型处理速度
计算机视觉和深度学习的应用过程中,需要处理大量复杂的数据并通过数据来训练相关的自动驾驶模型,对硬件需求如 GPU 和高性能计算机等带来了性能压力。当前,Zhang Vision Group 课题组采用了 8 卡 NVIDIA RTX 6000 Ada 架构 GPU 来进行模型训练和推理,借助 NVIDIA RTX 6000 强大的计算性能,加速了实验模型训练的速度,减少模型训练的时间,整体性能可提升约 30%。
基于 NVIDIA Ada Lovelace GPU 架构的 NVIDIA RTX 6000 ,为新工作站带来了惊人的功率效率和性能。其搭载了 142 个第三代 RT Core、568 个第四代 Tensor Core 和 18176 个最新一代 CUDA 核以及 48GB 高性能显存,在光线追踪、AI、图形和计算性能上比上一代产品提高了 2 倍,为该课题组的模型计算和数据处理提供了有力的 GPU 支持。
Zhang Vision Group 课题组基于 NVIDIA 产品辅助,深入计算机视觉行业应用研究
自动驾驶需要系统能够感知环境,识别道路、车辆、行人等物体,使用基于神经渲染技术的仿真系统能提升整个自动驾驶的智力水平。Zhang Vision Group 课题组基于 NVIDIA RTX 6000 强大性能的支持,提出了 S-NeRF(Stree-view Neural Radiance Fields)方法。该方法能够同时考虑大规模背景场景和前景移动车辆,以便自动驾驶汽车能够从街景中学习更好的神经表示方式。
该课题组在大规模驾驶数据集(例如 nuScenes 和 Waymo)上进行的全面实验表明,基于目前的方法,结合由 NVIDIA Ada Lovelace 架构提供支持的 NVIDIA RTX 6000 的强大性能,可以通过减少街景合成中约 7%~40% 的均方误差和移动车辆渲染的峰值信噪比(PSNR),带来约 45% 的增益效果。
点击“阅读原文”,了解更多 NVIDIA RTX 6000 有关信息。
扫描海报二维码,即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!
原文标题:复旦大学课题组利用 NVIDIA RTX GPU,深入计算机视觉的自动驾驶应用研究
文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
全部0条评论
快来发表一下你的评论吧 !