粗略理解
你可以先把它理解成:
两个量是不是会一起“往同一个方向动”。
比如:
- 你学习时间多的时候,考试分数往往也更高,那这两个量大概率是“同向变化”,协方差通常是正的。
- 天气越冷,空调制冷耗电可能越少,这两个量可能一个增大另一个减小,协方差通常是负的。
- 如果两个量的变化看不出明显一起动的规律,协方差就可能接近 0。
更直觉一点看:
- 正协方差:一个比平均值大时,另一个也常比平均值大。
- 负协方差:一个比平均值大时,另一个反而常比平均值小。
- 协方差接近 0:线性关系不明显。
它的一个常见公式是:
$\mathrm{Cov}(X,Y)=\mathbb{E}[(X-\mathbb{E}X)(Y-\mathbb{E}Y)]$
这里每一部分的意思是:
- X, Y:两个随机变量
- $\mathbb{E}X$:X 的平均值
- $(X-\mathbb{E}X)$:X 偏离自己平均值多少
- $(Y-\mathbb{E}Y)$:Y 偏离自己平均值多少
- 两者相乘后再取平均:就得到“它们偏离平均值时是否常常同向”的总体程度
你可以记一个很有用的特殊情况: