向量高斯,通常就是多元高斯分布(multivariate Gaussian distribution),也常叫多元正态分布(multivariate normal distribution)。
你可以先把它理解成:
一维高斯分布描述的是一个随机数大概会落在哪。 向量高斯描述的是一组随机数拼成的向量大概会落在哪。
比如:
也就是说,它不是研究“一个数有多大”,而是研究“一串数一起出现时,大概长什么样”。
假设你测一个学生的两个量:
那每次观测,都不是一个数,而是一个二维向量:
$\mathbf{x}=\begin{bmatrix}\text{身高}\\\text{体重}\end{bmatrix}$
如果这些样本整体看起来像“中间最密、越往外越稀”,而且还允许“身高高的人往往体重也更高”这种相关性,那它就很适合用向量高斯来描述。
所以你可以把向量高斯理解成:
“高维空间里的钟形分布”。
一维时,图像是钟形曲线;
二维时,像一个山包;
更高维时,就是高维空间里“中心密、外围稀”的概率分布。