使用Tensil、TF-Lite和PYNQ在Ultra96板上运行YOLO v4 Tiny

消耗积分:0 | 格式:zip | 大小:0.00 MB | 2023-06-25

王伟

分享资料个

描述

介绍

本教程将使用Avnet Ultra96 V2开发板和Tensil 开源推理加速器来展示如何在 FPGA 上运行YOLO v4 Tiny——最先进的目标检测机器学习模型。本教程参考之前的Ultra96教程有关生成 Tensil RTL 和让Xilinx Vivado合成比特流的分步说明。

如果您遇到问题或发现错误，您可以在我们的Discord上提问或发送电子邮件至support@tensil.ai。

概述

在开始之前，让我们鸟瞰一下我们想要完成的任务。我们将按照以下步骤操作：

生成和合成 Tensil RTL
为 Tensil 编译 YOLO v4 Tiny 模型
准备 PYNQ 和 TF-Lite
使用 PYNQ 执行

1.生成和合成Tensil RTL

第一步，我们将使用 Tensil 工具生成 RTL 代码，然后使用 Xilinx Vivado 为 Ultra96 板合成比特流。由于此过程与其他 Ultra96 教程相同，因此我们建议您参考 ResNet20 教程中的第 1 至第 4 节。

或者，您可以跳过此步骤并下载现成的比特流。为此，我们在后续部分中包含说明。

2. 为 Tensil 编译 YOLO v4 Tiny 模型

现在，我们需要将 ML 模型编译为由 TCU 硬件直接执行的 TCU 指令组成的 Tensil 二进制文件。YOLO v4 Tiny 模型包含在 192 和 416 两种分辨率中，位于和的 Tensil 泊坞窗图像/demo/models/yolov4_tiny_192.onnx中/demo/models/yolov4_tiny_416.onnx。更高的分辨率将使用更多的计算来检测更小的对象，因此每秒的帧数更少。请注意，下面我们将使用 192 分辨率，但只需将其替换为 416 也可以。

正如我们在介绍中提到的，我们将使用 TF-Lite 框架来运行 YOLO v4 Tiny 的后处理。具体来说，此后处理包括 Tensil 硬件不支持的操作Sigmoid。Exp（我们计划使用基于泰勒展开的表查找来实现它们。）这意味着对于 Tensil，我们需要编译以最后一个卷积层结尾的模型。在这些层之下，我们需要编译 TF-Lite 模型。要识别 Tensil 编译器的输出节点，请查看Netron 中的模型。

最后两个卷积操作的输出名为model/conv2d_17/BiasAdd:0和model/conv2d_20/BiasAdd:0。

如果你一路走来，那么恭喜你！通过尝试自己的模型和架构，您已准备好将事情提升到一个新的水平。加入我们的Discord打个招呼并提出问题，或发送电子邮件至support@tensil.ai。

下载并关注上传者

开通VIP，低至0.08元下载/次

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

储能电源市场分析
2024-04-22 18次下载

下载
传感芯片选型指南
2024-04-17 17次下载

下载
储能电源市场分析报告
2024-04-23 9次下载

下载
2023年光伏行业发展回顾报告
2024-04-30 9次下载

下载
山特TG400UPS工作原理与维修
2024-04-29 7次下载

下载
汽车类高电流无刷直流 (BLDC) 电机驱动器原理图介绍
2024-04-25 6次下载

下载

使用Tensil、TF-Lite和PYNQ在Ultra96板上运行YOLO v4 Tiny

描述

介绍

概述

1.生成和合成Tensil RTL

2. 为 Tensil 编译 YOLO v4 Tiny 模型

Ultra96硬件用户指南

Ultra96 SDR第一部分：简单的射频频谱图Web应用程序

Ultra96 CSI-2视频输出到Raspberry Pi摄像头输入

Ultra96上的实时摄像头馈送网页

使用PYNQ的Ultra96面部识别锁栓

Ultra96-V2上的头部姿势估计

在Ultra96 V2平台上用Python实现人脸检测和人脸跟踪

在KV260上运行Yolov4 tiny

使用Tensil和PYNQ在PYNQ Z1 FPGA板上运行机器学习

用于Ultra96的夹层板96AnalogXperience

Ultra96 FPGA上的Live NYC Subway Monitor应用程序

关于Ultra96的Xilinx DDS编译器IP教程

与Ultra96联网端口转发

Ultra96 V2上基于标记的增强现实

使用Ultra96 PYNQ测定织物GSM

Ultra96皮肤癌AI构建

初次尝试Tengine 适配 Ncnn FP32 模型

1.32H防反插推拉式TF卡座TF-020原理图

全塑简易TF卡座TF-017原理图

8+1PIN TF自弹式TF-016-P3原理图

1.5H/1.8H TF翻盖式TF-014=H16原理图

TF卡座内焊自弹常闭式TF-011原理图

YOLO v4在jetson nano的安装及测试

TF卡座封装原理图

基于YOLO改进的轻量级交通标识检测模型

嵌入式设备的YOLO网络剪枝算法

2018.2 Ultra96：从 Matchbox 桌面关断 PetaLinux BSP，无法关断电路板

一起玩Ultra96之GPIO操作

如何使用Zynq SoC硬件加速实现改进TINY YOLO实时车辆检测的算法

RTX51 Tiny中有哪些问题容易混淆

基于YOLO技术的植物检测与计数

ROS中的TF该如何使用

目标检测算法YOLO的发展史和原理

如何为自己的ZYNQ板卡创建Pynq镜像

如何使用PYNQ和Zigbee创建一个简单的家庭自动化系统

基于YOLO-V5的网络结构及实现行人社交距离风险提示

从 Matchbox桌面关断PetaLinux BSP无法关断电路板

目标检测—YOLO的重要性！

探究DSP-PYNQ新增对ZCU111和Ultra96的支持！

Deep SORT和YOLO v4

PYNQ团队发布了全新的RFSoC-PYNQ开源框架

基于PYNQ-Z2开发板的PYNQ开源项目

PYNQ案例（二）：ZYNQ与PYNQ的区别与联系

PYNQ案例（一）：ZYNQ的PL与PS开发

PYNQ项目——Pynq开发板启动实验

FPGA加速N粒子重力并行模拟实现和仿真案例

PYNQ对树莓派接口的操作案例分析

如何使用PYNQ Overlay 发布工具PyPI

基于DPU-PYNQ来实现石头剪刀布的手势识别

采用Vitis技术的Ultra96 (v1)：DPU集成与MIPI平台教程

米尔PYNQ开发板来了

基于 ARM 的 Ultra96 开发板Ultra96 现已上市

Ultra96开发板产品描述

安富利再次发布新的Ultra96-V2 为AI和IOT提供动力

PYNQ中MicroBlaze程序文件的加载过程

PQ Labs MagicAI让CPU玩得转人工智能

[原创] Avnet ZynqUltraScale+ MPSoC系列开发方案Ultra96

基于Arm技术的16nm MPSoC开发套件Ultra96

e络盟供应Ultra96™开发板为AI 设计提速

YOLO的核心思想及YOLO的实现细节

下载排行榜

储能电源市场分析

传感芯片选型指南

储能电源市场分析报告

2023年光伏行业发展回顾报告

山特TG400UPS工作原理与维修

汽车类高电流无刷直流 (BLDC) 电机驱动器原理图介绍