这个概念其实很重要,它几乎是你以后理解 PCA(主成分分析)、低秩分解、矩阵压缩、很多机器学习方法时都会反复遇到的东西。
你先抓住一句最直观的话:
奇异值(singular values)就是一个矩阵对不同方向“拉伸/压缩”的强弱。
奇异值矩阵就是把这些“拉伸倍率”整齐地排在对角线上的那个矩阵。
如果你把一个矩阵 $(A)$ 想成一个“空间变形器”,它会把一个向量变成另一个向量。
那它做的事情,大体可以拆成三步:
中间那一步“分别拉长或压短”的倍率,就是奇异值。
而记录这些倍率的对角矩阵,就是奇异值矩阵。
假设你在二维平面里画一个单位圆。
把这个圆里的每个点都乘上矩阵 (A) 之后,原来的圆通常会变成一个椭圆。
这个椭圆有两个最重要的半轴:
所以你可以把奇异值理解成:
“矩阵 (A) 在某些最特殊方向上,究竟把长度放大了多少倍。”