双目视觉的原理和应用

I3963697382 2023-06-19 2381

人工智能

636人已加入

描述

双目视觉(binocular vision)指利用双眼的视觉信息来获得更丰富和准确的视觉感知。这种视觉方式使我们能够感知距离、深度和方向等信息，从而更好地适应周围环境。在双目视觉的研究领域，有许多词汇，为了更好地理解双目视觉的原理和应用，下面是一些必备的词汇:

视差（Disparity）：视差是指同一物体在两个图像中投影点之间的水平距离，它与物体到相机的距离成反比，因此可以用来估计物体的深度。视差图（Disparity Map）是指存储立体校正后单视图所有像素视差值的二维图像。

双目视觉

基线（Baseline）：直线B为基线，它是连接两个相机光心的直线。

双目视觉

焦距：相机镜头到成像平面的距离，也就是相机的视角大小。焦距越大，相机能够看到的物体越清晰，但是也会导致视野范围变小。

双目视觉

相机标定 (Camera calibration)：确定相机内外参数的过程，用于将图像上的像素坐标转换为实际物理坐标。

双目视觉

立体校正（Stereo Rectification）：立体校正是一项关键的预处理步骤，它通过变换两个图像平面，使得它们共面并且与基线平行，从而将左右图像的极线对齐，并且使对应的像素在同一行上。这样，在进行立体匹配时，我们只需要在一条水平扫描线上搜索对应像素，而无需在整个图像上进行搜索。这极大地降低了计算复杂度，并提高了匹配的效率。

双目视觉

三角化 (Triangulation)：通过测量两个视角之间的几何关系来计算三维场景中点的位置的过程。

双目视觉

立体匹配（Stereo Matching）：立体匹配是指寻找两个图像中相同物体或场景的对应点，从而计算出它们之间的视差。立体匹配的方法有很多，可以分为基于块匹配的算法、基于特征匹配的算法、基于能量优化的算法和基于深度学习的算法等。常用的基于块匹配的方法如以SAD、SSD、NCC为代表，基于特征匹配的方法如SURF、SIFT、ORB等。

双目视觉

视差图（Disparity Map）：视差是指同一物体在两个图像中投影点之间的水平距离，它与物体到相机的距离成反比，因此可以用来估计物体的深度。视差图是指存储立体校正后单视图所有像素视差值的二维图像。

深度图（Depth Map）：深度图是指存储场景中每个像素点到相机的距离（深度）值的二维图像。深度图可以通过视差图和相机参数来计算，也可以通过其他方法如结构光、激光雷达或深度学习等来获取。

双目视觉

点云 (Point cloud)：由许多三维坐标点组成的数据集，点云可以用于三维重建和场景分析。

双目视觉

编辑：黄飞

打开APP阅读更多精彩内容