×

如何使用HLS加速FPGA上的FIR滤波器

消耗积分:2 | 格式:zip | 大小:0.00 MB | 2023-06-14

分享资料个

描述

介绍

借助Vitis 高层次综合 (HLS) ,FPGA 的一般开发时间可以大大缩短。

在此项目中,将展示如何使用 HLS 加速 FPGA 上的 FIR 滤波器。

在之前关于使用 HLS 运行简单神经网络的博客文章中,展示了使用 Pynq 的 KV260 的设置过程。

所有数据和预建硬件都在随附的GitHub 存储库中

基础知识

在数字信号处理中,有限脉冲响应 (FIR) 滤波器对任何给定的有限输入信号都有有限响应。FIR 滤波器由抽头延迟线构成,用于将输入信号延迟给定数量的抽头 ( N )。z^{-1} 是Z 变换的延迟运算符

poYBAGSBnt6AbhiKAAFxUaY5Mak299.png
 

滤波器系数可以排列在脉冲响应向量中。

poYBAGSBnuKAOrroAAAo98CyIU4885.png
 

输出信号可以用

pYYBAGSBnuaAAfTYAABZnkpnvqo781.png
 

或短

poYBAGSBnumADe_9AABCctg1fDQ522.png
 

这与输入信号与脉冲响应的卷积相同

poYBAGSBnuyAKmN9AAAvtzdsnmQ478.png
 

对于滤波器设计,使用了关于使用 python 进行低通 FIR 滤波器设计的 Scipy Cookbook

过滤器设计有具有以下特性的凯撒窗:

  • 10 Hz 的截止频率 ( f_c )
  • 5 Hz 的过渡宽度 ( Δf )
  • 60 dB 的阻带纹波 (A_stop)
pYYBAGSBnu-ADkKKAAGtrbvj93c981.png
带 Kaiser 窗口的过滤器设计。自己的演讲,灵感来自标题={信号处理导论},出版商={Prentice Hall},作者={Orfanidis, Sophocles J.},年份={1998}
 

该食谱已针对该项目进行了改编fir.py

系数:

pYYBAGSBnvKABpHlAACgeNwSAks685.png
 

频率响应:

poYBAGSBnvWAQos_AADezx7_oDY188.png
 

过滤后的信号:

poYBAGSBnviAfb-EAADF1hdDvrI719.png
最后的图显示了原始信号(细蓝线)、滤波信号(通过适当的相位延迟移动以与原始信号对齐;细红线)和滤波信号的“好”部分(粗绿线) . “好的部分”是信号中不受初始条件影响的部分。
 

在食谱中,scipy 函数scipy.signal.lfilter()用于过滤信号。一个纯的和非优化的 python(使用 NumPy)实现看起来像:

pYYBAGSBnvuAL_WwAACbfvCDy7k725.png
 

高级合成

对于 HLS 部分,我们使用 74 抽头滤波器过滤长度为 1024 的信号。在没有并行性的情况下,我们需要大约 75k 个周期来过滤信号。

HLS中的 C++ 代码fir.cpp看起来与 Python 代码非常相似。通过一些代码提升技术(将i = 0时的代码放在for 循环之外),HLS 可以流水线化最外层的循环。如果流水线循环包含更多循环,它们将自动展开。

Python 脚本fir.py将计算出的抽头系数写入 C++ 头文件。出于调试目的,测试信号和预期响应也写入fir.h头文件中。

pYYBAGSBnv-AUL-BAAGd-ZneEC4895.png
 

在综合后报告中,我们看到相当大的开销,因为即使循环是流水线,它也需要 1345 个周期来过滤长度为 1024 的信号。这是由于昂贵的浮点运算。

poYBAGSBnwSAQP3IAAJmxfbIuis979.png
 

为避免浮点运算,可以使用Vitis HLS 的定点包。为了不在 Python 中使用定点(为了与 Pynq 通信),函数的输入和输出仍然是 float。输入和输出必须进行相应的类型转换。在这个项目中,使用了 32 位的字宽和 1 位的整数宽度。

 

poYBAGSBnweAcYW3AAD8PcQajLw049.png
 

正如报告中所见,开销几乎消失,1058 个周期确实接近了 1024 个周期的最佳延迟。

pYYBAGSBnwqAFMwDAAJYQnwPcTU871.png
 

Vitis HLS 和 Vivado

与上一篇博文一样,使用 Vitis HLS 和 Vivado 生成硬件。时钟频率使用100MHz,之后可以在Pynq中超频。

Pynq

Pynq 代码 ( fir.ipynb) 与之前的博文非常相似。系统可超频至 250 MHz

pYYBAGSBnw2AB2sxAAFRkaPCUZY207.png
 

对于普通的 Python 实现,已经实现了 3160 倍的巨大性能提升。为了与scipy (lib) 的 lfilter()进行比较,可以实现 6.7 倍的性能提升。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !