OpenCV上八种不同的目标追踪算法

zhKF_jqr_AI 2018-08-05 32702

电子说

1.3w人已加入

描述

编者按：目标跟踪作为机器学习的一个重要分支，加之其在日常生活、军事行动中的广泛应用，很多国内外学者都对此颇有研究。本文将讨论OpenCV上八种不同的目标追踪算法。

虽然我们熟知的的质心追踪器表现得很好，但它需要我们在输入的视频上的每一帧运行一个目标探测器。对大多数环境来说，在每帧上进行检测非常耗费计算力。

所以，我们想应用一种一次性的目标检测方法，然后在之后的帧上都能进行目标追踪，使这一任务更加快速、更高效。

这里的问题是：OpenCV能帮我们达到这种目标追踪的目的吗？

答案是肯定的。

OpenCV目标追踪

首先，我们会大致介绍八种建立在OpenCV上的目标检测算法。之后我会讲解如何利用这些算法进行实时目标追踪。最后，我们会比较各个OpenCV目标追踪的效果，总结各种方法能够适应的环境。

八种OpenCV目标追踪安装

无人机拍摄的视频，用MedianFlow进行目标追踪

你可能会惊讶OpenCV竟然有八种不同的目标追踪工具，他们都可以运用到计算机视觉领域中。

这八种工具包括：

BOOSTING Tracker：和Haar cascades（AdaBoost）背后所用的机器学习算法相同，但是距其诞生已有十多年了。这一追踪器速度较慢，并且表现不好，但是作为元老还是有必要提及的。（最低支持OpenCV 3.0.0）

MIL Tracker：比上一个追踪器更精确，但是失败率比较高。（最低支持OpenCV 3.0.0）

KCF Tracker：比BOOSTING和MIL都快，但是在有遮挡的情况下表现不佳。（最低支持OpenCV 3.1.0）

CSRT Tracker：比KCF稍精确，但速度不如后者。（最低支持OpenCV 3.4.2）

MedianFlow Tracker：在报错方面表现得很好，但是对于快速跳动或快速移动的物体，模型会失效。（最低支持OpenCV 3.0.0）

TLD Tracker：我不确定是不是OpenCV和TLD有什么不兼容的问题，但是TLD的误报非常多，所以不推荐。（最低支持OpenCV 3.0.0）

MOSSE Tracker：速度真心快，但是不如CSRT和KCF的准确率那么高，如果追求速度选它准没错。（最低支持OpenCV 3.4.1）

GOTURN Tracker：这是OpenCV中唯一一深度学习为基础的目标检测器。它需要额外的模型才能运行，本文不详细讲解。（最低支持OpenCV 3.2.0）

我个人的建议：

如果追求高准确度，又能忍受慢一些的速度，那么就用CSRT

如果对准确度的要求不苛刻，想追求速度，那么就选KCF

纯粹想节省时间就用MOSSE

从OpenCV 3开始，目标检测器得到了快速发展，下表总结了不同版本的OpenCV中可食用的追踪器：

OpenCV

开始动手

想要用OpenCV进行目标追踪，首先打开一个新文件，将它命名为opencv_object_tracker.py，然后插入以下代码：

OpenCV

我们开始输入必须的安装包，确保你已经安装了OpenCV（我推荐3.4以上的版本），其次你要安装imutils：

OpenCV

输入安装包后，我们开始分析命令行参数：

OpenCV

我们的命令行参数包括：

--video：到达输入视频文件的替代路线。如果该参数失效，那么脚本将会使用你的网络摄像头。

--tracker：假设默认追踪器设置的是kcf，一整列可能的追踪器代码表示下一个代码块或下方的部分。

让我们处理追踪器的不同类别：

OpenCV

图2中我们提到，并不是所有追踪器都使用OpenCV 3以上的版本。在3.3版本上，同样发生了安装上的变化，在3.3之前，追踪器必须用cv2. Tracker_create创造，并且要在追踪器的名字上用大写字符串标注（22和23行）。

对于3.3以上的版本，每个追踪器可以用各自的函数创造，如cv2. TrackerKCF_create。词典OPENCV_OBJECT_TRACKERS包含了7种OpenCV的目标追踪器（30—38行）。它将目标追踪器的命令行参数字符串映射到实际的OpenCV追踪器函数上。

其中42行里的tracker目的是根据追踪器命令行参数以及从OPENCV_OBJECT_TRACKERS得来的相关重要信息。

注意：这里我没有将GOTURN加入到追踪器设置中因为它还需要额外的模型文件。

我们还对initBB进行初始化（46行），当我们用鼠标选中目标物体时，该变量会显示目标物体的边界框坐标。

接下来，让我们对视频流和FPS进行初始化：

OpenCV

49—52行是访问网络摄像头的步骤，这里我们设定一个一秒钟的暂停时间，好让摄像头传感器进行“热身”。

接着--video命令行参数会出现，所以我们可以从视频文件中对视频流进行初始化（55—56行）。

下面是从视频流中进行帧数迭代循环的步骤：

OpenCV

在65和66行中我们提取一个frame，同时在69和70行处理视频文件中没有帧数的情况。

为了让我们的算法处理帧数的速度更快，我们用resize将输入的视频帧调整为50像素（74行），这里处理的数据越少，速度就会越快。

之后，我们提取视频帧的宽度和高度，之后我们会用到高度（75行）。

目标物体选定之后，我们就可以用以下代码进行处理：

OpenCV

如果目标物体已经被选定，我们需要不断更新目标物体的位置，为了做到这一点，我们在80行使用update方法，它会定位目标物体的新位置并且返回一个success和box值。

如果顺利的话，我们可以在frame中得到更新后的边界框位置。注意，追踪器可能会跟丢目标物并且报错，所以success可能不会一直是True。接着更新FPS估计器。

接着，让我们展示一下frame，以及用鼠标选取目标物体：

OpenCV

我们将展示frame，并且继续迭代循环，键入其他指令才会停止。

当键入“s”后，我们用cv2.selectROI“选择”一个目标ROI。这一函数可以让你在视频暂停的时候手动选择一个ROI：

用户必须画出边界框后按回车或空格键来确定所选区域。如果你需要重新选择，就按“ESCAPE”键。

同样，我们还能用真实的目标探测器来进行手动选择。

最后，如果视频有更多的帧，或者出现了“quit”的情况，如何退出这一循环：

OpenCV

最后一个模块展示了我们如何停止循环，这时所有的指标都输出并且窗口关闭。

目标追踪结果

提示：为了确保你跟上本文的进度，并且用到了文章中的OpenCV方法，请先确保你在“下载资料”中下载了代码和视频。

之后，打开一个终端并执行以下命令：

OpenCV

如果你下载了本教程的源代码和视频，那么--video的可用参数在以下文件中：

american_pharoah.mp4

dashcam_boston.mp4

drone.mp4

nascar_01.mp4

nascar_02.mp4

race.mp4

……

--tracker中的参数在：

csrt

kcf

boosting

mil

tld

medianflow

mosse

你也可以用计算机的摄像头：

OpenCV

下面的实例会展示OpenCV的追踪器如何在较长一段时间中进行追踪，以及与短时间片段进行对比：

总结

这篇文章讲解了如何用OpenCV进行目标物体追踪。具体来说，我们回顾了库里的八种算法：

CSRF

KCF

Boosting

MIL

TLD

MedianFlow

MOSSE

GOTURN

我们可以将OpenCV的这八种追踪器用于不同的任务，包括短跑比赛、赛马、赛车、无人机追踪等高速视频上。

打开APP阅读更多精彩内容