4.5 方差与标准差¶
小率拿来两组零花钱记录。两组的平均数差不多,可第一组每天都很稳定,第二组有时很多、有时很少。只看期望,完全看不出这种差别。
平均数一样,风险也一样吗
如果两个随机变量期望相同,但一个总在中心附近,另一个经常跑到很远的位置,它们的稳定程度完全不同。
4.5.1 先看离平均值多远¶
期望告诉我中心在哪,可我还是不知道它会不会乱跳。
那就量每个结果离中心多远。方差就是这些距离的平均账。
如果只看偏差 \(X-E[X]\),正负会互相抵消。所以我们先平方,再平均:
\[
Var(X)=E\left[(X-E[X])^2\right]
\]
标准差(Standard Deviation)是方差的平方根:
\[
\sigma_X=\sqrt{Var(X)}
\]
标准差和原变量单位相同,因此更适合口头解释。
4.5.2 分布的胖瘦¶
所以方差越大,不一定中心变了,而是离中心更散。
对。期望看中心,方差看波动。
4.5.3 方差的速算公式¶
方差也可以写成更方便计算的形式:
\[
Var(X)=E[X^2]-(E[X])^2
\]
这条公式的意思是:先算平方后的平均,再减掉平均值的平方。
Bernoulli 的方差
若 \(X\sim Bernoulli(p)\),则 \(X^2=X\),所以 \(E[X^2]=E[X]=p\)。
\[
Var(X)=p-p^2=p(1-p)
\]
4.5.4 平移不改变方差,缩放会放大方差¶
若把每个值都加上常数 \(b\),只是整体平移,离中心的距离不变:
\[
Var(X+b)=Var(X)
\]
若把每个值乘以 \(a\),偏差也会乘以 \(a\),平方后方差乘以 \(a^2\):
\[
Var(aX+b)=a^2Var(X)
\]
乘以 2,方差变 4 倍?
对,因为方差看的是平方距离。
4.5.5 两个变量相加时要小心¶
如果 \(X\) 和 \(Y\) 独立:
\[
Var(X+Y)=Var(X)+Var(Y)
\]
但如果它们不独立,还要加上协方差项:
\[
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
\]
这句话会在 4.7 里变得非常重要。
方差不像期望那么自由
期望相加不要求独立;方差相加通常要检查是否独立,或者是否存在协方差。
4.5.6 Chebyshev:至少有多少在附近¶
Chebyshev 不等式给了一个很保守但通用的保证:
\[
P(|X-\mu|\ge k\sigma)\le \frac{1}{k^2}
\]
也就是说,离均值超过 \(k\) 个标准差的概率不会超过 \(1/k^2\)。
什么时候用
当你不知道分布形状,只知道均值和方差时,Chebyshev 不等式还能给出一个最低限度的范围判断。
4.5.7 用 Python 算波动¶
import numpy as np
daily_a = np.array([18, 20, 21, 19, 22])
daily_b = np.array([5, 35, 12, 28, 20])
for name, data in [("稳定组", daily_a), ("波动组", daily_b)]:
print(name)
print(f"平均 = {data.mean():.1f}")
print(f"方差 = {data.var(ddof=0):.1f}")
print(f"标准差 = {data.std(ddof=0):.1f}")
现在我能说清楚了:平均差不多,不代表波动差不多。
这句话就是方差的入口。
小率的笔记本
- 期望看中心,方差看离中心的平方距离。
- 标准差是方差开根号,单位更容易解释。
- 平移不改变方差,缩放会让方差乘以缩放倍数的平方。
- 两个变量相加时,方差是否能直接相加要看独立性或协方差。
- Chebyshev 不等式给出不依赖分布形状的保守范围。

