矩阵正态分布: MVG变分高斯

中文一般叫矩阵正态分布，也常写成 Matrix-variate Gaussian 或 Matrix Normal Distribution。

你可以先把它理解成一句很朴素的话：

“不是把一个随机对象看成一长条向量，而是直接把它看成一个随机矩阵。”

比如你有一个随机矩阵 $X\in\mathbb{R}^{n\times p}$，它不是固定的，每次采样都会变。那我们就想描述：

这就是 matrix-variate Gaussian 干的事。

1. 先讲直觉：它和普通高斯分布是什么关系？

你已经熟悉普通高斯分布的话，可以先回忆两种情况：

一个数 x 服从高斯分布： $x\sim \mathcal N(\mu,\sigma^2)$ 意思是它围绕均值 $\mu$ 摆动，摆动强度由方差 $\sigma^2$ 描述。

一个向量 $x\in\mathbb R^d$ 服从多元高斯分布： $x\sim \mathcal N(\mu,\Sigma)$ 这里：

它不仅告诉你每个分量怎么波动，还告诉你不同分量之间怎么相关。