中文一般叫矩阵正态分布,也常写成 Matrix-variate GaussianMatrix Normal Distribution

你可以先把它理解成一句很朴素的话:

“不是把一个随机对象看成一长条向量,而是直接把它看成一个随机矩阵。”

比如你有一个随机矩阵 $X\in\mathbb{R}^{n\times p}$,它不是固定的,每次采样都会变。那我们就想描述:

  1. 它平均长什么样;
  2. 它在“行方向”怎么一起波动;
  3. 它在“列方向”怎么一起波动。

这就是 matrix-variate Gaussian 干的事。


1. 先讲直觉:它和普通高斯分布是什么关系?

你已经熟悉普通高斯分布的话,可以先回忆两种情况:

标量高斯

一个数 x 服从高斯分布: $x\sim \mathcal N(\mu,\sigma^2)$ 意思是它围绕均值 $\mu$ 摆动,摆动强度由方差 $\sigma^2$ 描述。

向量高斯

一个向量 $x\in\mathbb R^d$ 服从多元高斯分布: $x\sim \mathcal N(\mu,\Sigma)$ 这里:

它不仅告诉你每个分量怎么波动,还告诉你不同分量之间怎么相关。

向量/多元 高斯正态分布