Vivado HLS在Zedboard中的Sobel滤波算法实现步骤教程

灰化肥发挥 2018-07-14 4316

电子说

1.4w人已加入

描述

总体设计思路

Vivado

sobel 算法理论基础

索贝尔算子（Sobel operator）主要用作边缘检测，在技术上，它是一离散性差分算子，用来运算图像亮度函数的灰度之近似值。在图像的任何一点使用此算子，将会产生对应的灰度矢量或是其法矢量。

Vivado

该算子包含两组3x3的矩阵，分别为横向及纵向，将之与图像作平面卷积，即可分别得出横向及纵向的亮度差分近似值。如果以A代表原始图像，Gx及Gy分别代表经横向及纵向边缘检测的图像灰度值，其公式如下：

Gx = （-1）*f（x-1， y-1） + 0*f（x，y-1） + 1*f（x+1，y-1）

+（-2）*f（x-1，y） + 0*f（x，y）+2*f（x+1，y）

+（-1）*f（x-1，y+1） + 0*f（x，y+1） + 1*f（x+1，y+1）

= ［f（x+1，y-1）+2*f（x+1，y）+f（x+1，y+1）］-［f（x-1，y-1）+2*f（x-1，y）+f（x-1，y+1）］

Gy =1* f（x-1， y-1） + 2*f（x，y-1）+ 1*f（x+1，y-1）

+0*f（x-1，y） 0*f（x，y） + 0*f（x+1，y）

+（-1）*f（x-1，y+1） + （-2）*f（x，y+1） + （-1）*f（x+1， y+1）

= ［f（x-1，y-1） + 2f（x，y-1） + f（x+1，y-1）］-［f（x-1， y+1） + 2*f（x，y+1）+f（x+1，y+1）］

其中f（a，b），表示图像（a，b）点的灰度值；

图像的每一个像素的横向及纵向灰度值通过以下公式结合，来计算该点灰度的大小：

通常，为了提高效率使用不开平方的近似值：

如果梯度G大于某一阀值则认为该点（x，y）为边缘点。

然后可用以下公式计算梯度方向：

Sobel算子根据像素点上下、左右邻点灰度加权差，在边缘处达到极值这一现象检测边缘。对噪声具有平滑作用，提供较为精确的边缘方向信息，边缘定位精度不够高。当对精度要求不是很高时，是一种较为常用的边缘检测方法。

流程

HLS算法验证与实现

算法验证包括算法C/C++实现，综合编译仿真，实现导出pcore用于-------》XLINX EDK

EDK硬件工程搭建

EDK中主要搭建zedboard硬件平台，实现VDMA（用AXI-Stream），HDMI，DDR等等，生成system.bit，用于连同uboot、fsbl生成zedboard bootload （BOOT.BIN）。

参考：

zedboard启动过程分析：

zedboard 构建嵌入式linux ：

LINUX 系统移植

准备一张》8G的SD卡，分区为FAT32+EXT4（其中EXT4为文件系统》4GB，FAT分区为内核设备树 bootloader）可以采用gparted分区工具完成，apt-get install gparted

系统移植包括内核镜像的编译，bootloader的移植，设备树的编译，文件系统的移植

具体移植步骤参见：

内核镜像地址：git clone

uboot源码：git clone git://git.xiinx.com/u-boot-xarm.git点击打开链接点击打开链接点击打开链接

设备树在内核中可以找到，将设备树，内核镜像，BOOT.BIN拷贝到SD卡中FAT分区中

文件系统：直接拷贝到SD卡中EXT4分区中

LINUX VDMA驱动应用程序编写与实现

编写驱动程序是为了我们能在PS中对VDMA进行管理和控制。前提是在底层中我们已经做好了所有相关的硬件设计等等。

移植OPENCV库：用于对比FPGA算法处理速度比较，有两种方法移植OPENCV库，

1：apt-get install libopencv-dev python-opencv（用于python中）

2：下载源码编译

源码地址：

编译步骤参考：基于opencv网络摄像头在ubuntu下的视频获取

结果展示

FPGA硬件实现Sobel效果 OPENCV软件实现Sobel

Vivado

处理时间显示

结果分析

上图处理时间中 640*480的视频

1：opencv处理一帧的时间0.148554s 大约为7帧每秒

2：fpga硬件实现一帧总时间（算法时间+VDMA拷贝时间）

3：fpga硬件实现一帧的算法时间，不包含拷贝DMA时间

在cortex A9 700MHZ 速度中，FPGA实现的算法速度比OPENCV软件实现速度快50-100倍，FPGA一秒钟可以处理500帧图像，OPENCV只能处理10张不到

但是缺点是，视频拷贝花费了太多的时间。所以我个人认为FPGA处理图像不在算法实现有多复杂与困难，因为FPGA的并行率理论上是无穷的，但是视频流的输入输出的速度直接决定了处理速度。暂时没想到好的方法解决。

打开APP阅读更多精彩内容