如何使用Vitis-AI加速YOLOX模型实现视频中的目标检测

电子发烧友论坛 2023-10-16 1158

描述

本文将介绍如何使用Vitis-AI加速YOLOX模型实现视频中的目标检测，并对相关源码进行解读。由于演示的示例程序源码是Vitis-AI开源项目提供的，本文演示之前会介绍所需要的准备工作。演示之后会对关键源码进行解析。

一、Vitis AI Library简介

上一篇帖子中，我们了解了Vitis统一软件平台和Vitis AI，并体验了Vitis AI Runtime的Resnet50图像分类示例程序。本篇文章我们将会介绍Vitis AI Library，并体验基于Vitis AI Library的YOLOX视频目标检测示例程序。

Vitis AI User Guide中的一张图可以很好的理解Vitis AI Library和Vitis AI Runtime的关系：

简单来说，Vitis AI Library是在Vitis AI Runtime之上构建出来的。

二、YOLOX视频目标检测示例体验

参考此前的帖子：【KV260视觉入门套件试用体验】部署DPU镜像并运行Vitis AI图像分类示例程序

首先需要部署DPU镜像，DPU镜像系统启动过程中会加载DPU IP到FPGA侧，并且系统本身已经集成了Vitis AI所需的各种库文件。

2.1 准备测试所需视频文件

赛灵思官方文档里面提供了测试视频资源

在开发板上下载、解压的命令为：

# 跳转到HOME目录
cd ~


# 下载 tar.gz 文件
TGZ=[vitis_ai_library_r3.0.0_video.tar.gz](https://china.xilinx.com/bin/public/openDownload?filename=vitis_ai_library_r3.0.0_video.tar.gz)
wget -O $TGZ "[https://china.xilinx.com/bin/public/openDownload?filename=](https://china.xilinx.com/bin/public/openDownload?filename=vitis_ai_library_r3.0.0_video.tar.gz)$TGZ"


# 解压 tar.gz 文件
DIR=[vitis_ai_library_r3.0.0_video](https://china.xilinx.com/bin/public/openDownload?filename=vitis_ai_library_r3.0.0_video.tar.gz)
mkdir $DIR
tar -C $DIR -xvf $TGZ

（左右移动查看全部内容）

2.2 准备KV260套件和DPU镜像SD卡

和上一篇帖子一样，使用Vitis-AI之前需要先准备好KV260套件和写入DPU镜像的SD卡，具体可以参考上一篇帖子中的第二章“部署DPU镜像到KV260”：【KV260视觉入门套件试用体验】部署DPU镜像并运行Vitis AI图像分类示例程序

2.3 编译YOLOX视频目标检测示例程序

KV260使用DPU镜像的SD卡启动后，跳转到Vitis-AI/目录下，可以看到如下文件及目录：

其中，蓝色的为目录，绿色的为可执行文件，白色的为没有执行权限的文件。

执行build.sh脚本，可以重新编译文件（可以尝试将可执行文件删除掉再重新执行build.sh脚本）。

该脚本文件内的代码为：

重新编译后，可以看到时间戳全部更新了：

2.4 运行YOLOX视频目标检测示例程序

接下来，运行YOLOX视频目标检测程序——test_video_yolox，命令为：

VIDEO_PATH=~/vitis_ai_library_r3.0.0_video/apps/seg_and_pose_detect/seg_960_540.avi
MODEL_NAME=yolox_nano_pt
./test_video_yolovx $MODEL_NAME $VIDEO_PATH

（左右移动查看全部内容）

可以看到，画面中的目标被框起来了。

三、YOLOX视频目标检测原理解析

YOLOX视频目标检测示例程序源码非常简短（test_video_yolovx.cpp文件）：