SVD的数据压缩原理

lviY_AI_shequ 2019-04-02 6166

电子说

1.2w人已加入

描述

前言

奇异值分解（SVD）在降维，数据压缩，推荐系统等有广泛的应用，任何矩阵都可以进行奇异值分解，本文通过正交变换不改变基向量间的夹角循序渐进的推导SVD算法，以及用协方差含义去理解行降维和列降维，最后介绍了SVD的数据压缩原理。

1. 正交变换

正交变换公式：

SVD

上式表示：X是Y的正交变换，其中U是正交矩阵，X和Y为列向量。

下面用一个例子说明正交变换的含义：

假设有两个单位列向量a和b，两向量的夹角为θ，如下图：

SVD

现对向量a，b进行正交变换：

SVD

SVD ， SVD 的模：

SVD

由上式可知 SVD 和 SVD 的模都为1。

SVD 和 SVD 的内积：

SVD

由上式可知，正交变换前后的内积相等。

SVD 和 SVD 的夹角 SVD ：

SVD

比较（2）式和（3）式得：正交变换前后的夹角相等，即： SVD

因此，正交变换的性质可用下图来表示：

SVD

正交变换的两个重要性质：

1）正交变换不改变向量的模。

2）正交变换不改变向量的夹角。

如果向量 SVD 和 SVD 是基向量，那么正交变换的结果如下图：

SVD

上图可以得到重要结论：基向量正交变换后的结果仍是基向量。基向量是表示向量最简洁的方法，向量在基向量的投影就是所在基向量的坐标，我们通过这种思想去理解特征值分解和推导SVD分解。

2. 特征值分解的含义

对称方阵A的特征值分解为：

SVD

其中U是正交矩阵， SVD 是对角矩阵。

为了可视化特征值分解，假设A是2×2的对称矩阵， SVD ， SVD 。（2.1）式展开为：

SVD

用图形表示为：

SVD

由上图可知，矩阵A没有旋转特征向量，它只是对特征向量进行了拉伸或缩短（取决于特征值的大小），因此，对称矩阵对其特征向量（基向量）的变换仍然是基向量（单位化）。

特征向量和特征值的几何意义：若向量经过矩阵变换后保持方向不变，只是进行长度上的伸缩，那么该向量是矩阵的特征向量，伸缩倍数是特征值。

3. SVD分解推导

我们考虑了当基向量是对称矩阵的特征向量时，矩阵变换后仍是基向量，但是，我们在实际项目中遇到的大都是行和列不相等的矩阵，如统计每个学生的科目乘积，行数为学生个数，列数为科目数，这种形成的矩阵很难是方阵，因此SVD分解是更普遍的矩阵分解方法。

先回顾一下正交变换的思想：基向量正交变换后的结果仍是基向量。

我们用正交变换的思想来推导SVD分解：

假设A是M*N的矩阵，秩为K，Rank(A)=k。

存在一组正交基V：

SVD

矩阵对其变换后仍是正交基，记为U：

SVD

由正交基定义，得：

SVD

上式展开：

SVD

SVD

SVD

∴ （3.2）式得：

SVD

即假设成立。

图形表示如下：

SVD

正交向量的模：

SVD

单位化正交向量，得：

SVD

结论：当基向量是 SVD 。

用矩阵的形式表示（3.3）式：

SVD

SVD

SVD

V是N*K矩阵，U是M*K矩阵， SVD 是M*K的矩阵，需要扩展成方阵形式：

将正交基 SVD 扩展 SVD 空间的正交基，即U是M*M方阵。

将正交基 SVD 扩展成 SVD 空间的正交基，其中 SVD 是矩阵A的零空间，即：

SVD

对应的特征值 SVD =0， SVD 是M*N对角矩阵,V是N*N方阵

因此（3.4）式写成向量形式为：

SVD

得：

SVD

SVD

SVD

（3.5）式写成向量形式：

SVD

令：

SVD

SVD

则：

A = XY

因为X和Y分别是列满秩和行满秩，所以上式是A的满秩分解。

（3.5）式的奇异矩阵 SVD 的值 SVD 是 SVD 特征值的平方根，下面推导奇异值分解的U和V：

SVD

即V是 SVD 的特征向量构成的矩阵，称为右奇异矩阵。

SVD

即U是 SVD 的特征向量构成的矩阵，称为左奇异矩阵。

小结：矩阵A的奇异值分解：

SVD

其中U是 SVD 的特征向量构成的矩阵，V是 SVD 的特征向量构成的矩阵，奇异值矩阵 SVD 的值是 SVD 特征值的平方根。

3. 奇异值分解的例子

本节用一个简单的例子来说明矩阵是如何进行奇异值分解的。矩阵A定义为：

SVD

SVD

SVD

SVD

SVD

SVD

SVD

SVD

SVD

SVD

4. 行降维和列降维

本节通过协方差的角度去理解行降维和列降维，首先探讨下协方差的含义：

单个变量用方差描述，无偏方差公式：

SVD

SVD

两个变量用协方差描述，协方差公式：

SVD

多个变量（如三个变量）之间的关系可以用协方差矩阵描述：

SVD

相关系数公式：

SVD

由上式可知，协方差是描述变量间的相关关系程度：

1）协方差cov(x,y) > 0时，变量x与y正相关；

2）协方差cov(x,y)<0时，变量x与y负相关；

3）协方差cov(x,y)=0时，变量x与y不相关；

变量与协方差关系的定性分析图：

SVD

现在开始讨论 SVD 和 SVD 的含义：

假设数据集是n维的，共有m个数据，每一行表示一例数据，即：

SVD

SVD 表示第i个样本， SVD SVD 表示第i个样本的第j维特征。

SVD

SVD

由上式可知， SVD 是描述各特征间相关关系的矩阵，所以 SVD 的正交基V是以数据集的特征空间进行展开的。

数据集A在特征空间展开为：

SVD

由上一篇文章可知，特征值表示了 SVD 在相应特征向量的信息分量。特征值越大，包含矩阵 SVD 的信息分量亦越大。

若我们选择前r个特征值来表示原始数据集，数据集A在特征空间展开为：

SVD

（4.2）式对列进行了降维，即右奇异矩阵V可以用于列数的压缩，与PCA降维算法一致。

行降维：

SVD

SVD

由上式可知： SVD 是描述样本数据间相关关系的矩阵，因此，左奇异矩阵U是以样本空间进行展开，原理与列降维一致，这里不详细介绍了。

若我们选择前r个特征值来表示原始数据集，数据集A在样本空间展开为：

SVD

因此，上式实现了行降维，即左奇异矩阵可以用于行数的压缩。

5. 数据压缩

本节介绍两种数据压缩方法：满秩分解和近似分解

矩阵A的秩为k，A的满秩分解：

SVD

满秩分解图形如下：

SVD

由上图可知，存储X和Y的矩阵比存储A矩阵占用的空间小，因此满秩分解起到了数据压缩作用。

若对数据再次进行压缩，需要用到矩阵的近似分解。

矩阵A的奇异值分解：

SVD

若我们选择前r个特征值近似矩阵A，得：

SVD

如下图：

SVD

我们用灰色部分的三个小矩阵近似表示矩阵A，存储空间大大的降低了。

6. SVD总结

任何矩阵都能进行SVD分解，SVD可以用于行降维和列降维，SVD在数据压缩、推荐系统和语义分析有广泛的应用，SVD与PCA的缺点一样，分解出的矩阵解释性不强。

打开APP阅读更多精彩内容

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

相关推荐
矩阵
向量
SVD

全部0条评论

快来发表一下你的评论吧 !

×

20

完善资料，
赚取积分