如何通过张量的降维来降低卷积计算量（CP分解）

YCqV_FPGA_EETre 2019-11-28 8217

电子说

1.4w人已加入

描述

引言

在CNN网络中卷积运算占据了最大的计算量，压缩卷积参数可以获得显著的硬件加速器的性能提升。在即将介绍的这篇论文中，作者就是通过张量的降维来降低卷积计算量的。作者通过CP分解将一个4D张量分解成多个低维度的张量，并且最后通过微调参数来提升网络精度。

1 原理

CNN卷积参数可以看做一个4D的张量。其中两个维度是对应一幅feature map的两个空间方向。一个方向对应输入feature map，另外一个维度为输出feature map方向。一个全卷积运算是对应每个输入feature map卷积求和，如图所示。通过CP分解，一个全卷积运算变成了连续多步一维卷积运算。图中S维度是多个输入feature map堆叠成的，dxd是feature map的空间维度。卷积核在feature map两个空间维度进行划窗运动，图中一个绿色方块内的结果求和得到一幅输出feature map中的一个像素点。T是多幅输出feature map堆叠成的。

那么这样的分解如何来保证和全卷积结果的不变呢？其实是要保证kernel不变就行了。然后再通过一些数学变化将全卷积变为连续多步卷积。已知一个二维矩阵可以进行如下分解：

硬件加速器