电子说
计算机视觉在不同领域解决已成为解决实际问题的常用方法,如智慧农牧管理。这类场景并不需要每秒处理许多帧,此时树莓派这类单板主机就派上了用场。
尽管已有诸多针对"Mobile/Edge"等设备的轻量化网络,但这些设备往往面向智能手机切具有高性能处理,而树莓派这类主机的CPU非常低端。
有鉴于此,本文提出了一种CNN-ViT混合网络SBCFormer在低端CPU上取得了最优精度-速度均衡。 SBCFormer首次在树莓派4B上以1fps处理取得80.0%精度 。
在网络结构方面,不同于已有4阶段设计方法,考虑到树莓派的低端CPU特性,在stem部分直接将分辨率降低到1/8。
在Module设计方面,它设计了一种兼顾全局与局部信息建模的SBCFormer Block,其Attention部分与PVT有些类似,看下图还是挺容易看懂的。
作者构建了四个不同大小的SBCFormer,分别为XS、S、B以及L,相关超参配置见下表。
作者所设计SBCFormer与其他轻量型网络在GPU、CPU以及ARM-CPU上的性能精度对比见下表,可以看到 :SBCFormer首次以1fps在ARM-CPU上取得了80.0%精度 !同等速度下精度大幅优于其他方案!
全部0条评论
快来发表一下你的评论吧 !