这个概念其实很重要,它几乎是你以后理解 PCA(主成分分析)、低秩分解、矩阵压缩、很多机器学习方法时都会反复遇到的东西。

你先抓住一句最直观的话:

奇异值(singular values)就是一个矩阵对不同方向“拉伸/压缩”的强弱。

奇异值矩阵就是把这些“拉伸倍率”整齐地排在对角线上的那个矩阵。

如果你把一个矩阵 $(A)$ 想成一个“空间变形器”,它会把一个向量变成另一个向量。

那它做的事情,大体可以拆成三步:

  1. 先把坐标系转一下;
  2. 再沿着几个特殊方向分别拉长或压短;
  3. 最后再转一次。

中间那一步“分别拉长或压短”的倍率,就是奇异值。

而记录这些倍率的对角矩阵,就是奇异值矩阵。


先用大白话理解

假设你在二维平面里画一个单位圆。

把这个圆里的每个点都乘上矩阵 (A) 之后,原来的圆通常会变成一个椭圆。

这个椭圆有两个最重要的半轴:

所以你可以把奇异值理解成:

“矩阵 (A) 在某些最特殊方向上,究竟把长度放大了多少倍。”