跳转至

4.4   期望

小率参加校园义卖抽奖:有的奖券得 0 元,有的得 5 元,有的得 20 元。单次抽奖当然不稳定,但如果抽很多很多次,每次平均能拿多少钱?这就是期望要回答的问题。

图 4.4.0 期望是长期平均和概率重心

图 4.4.0   期望不是保证下一次会得到的值,而是长期重复后的平均重心。
奖金 \(x\) 概率 \(P(X=x)\)
0 元 0.50
5 元 0.35
20 元 0.15

4.4.1   长期平均怎么算出来

如果我只抽一次,肯定不是 4.75 元这种小数吧?
对。期望不是单次预测,它是长期平均。

把每个奖金乘上它出现的概率,再加起来:

\[ 0\times0.50+5\times0.35+20\times0.15=4.75 \]

这表示如果同样规则重复很多次,平均每次奖金会靠近 4.75 元。

4.4.2   期望是概率分布的重心

图 4.4.1 期望是概率分布的重心

图 4.4.1   概率越大的取值越“重”,期望就是整组概率砖块的平衡点。
所以概率越大的值,对重心影响越大。
没错。期望就是加权平均,只是权重来自概率。

离散随机变量的期望定义为:

\[ E[X]=\sum_x xP(X=x) \]

连续随机变量的期望把求和换成积分:

\[ E[X]=\int_{-\infty}^{\infty}x f(x)\,dx \]

4.4.3   函数的期望

有时我们不关心 \(X\) 本身,而关心 \(g(X)\)。例如抽到奖金以后还要交手续费,或者收益变成收益率。

离散情形:

\[ E[g(X)]=\sum_x g(x)P(X=x) \]

连续情形:

\[ E[g(X)]=\int_{-\infty}^{\infty} g(x)f(x)\,dx \]

不要把函数直接套到期望上

一般来说,\(E[g(X)]\ne g(E[X])\)。先变换再平均,和先平均再变换,通常不是一回事。

4.4.4   期望的线性性

期望最常用、也最稳的一条性质是线性性:

\[ E[aX+b]=aE[X]+b \]

两个随机变量相加时:

\[ E[X+Y]=E[X]+E[Y] \]

这条性质不要求 \(X\)\(Y\) 独立。

不独立也能相加?
期望可以。方差就没这么轻松,下一节会看到相关性会影响波动。

4.4.5   大数定律:平均会靠近哪里

大数定律(Law of Large Numbers)说:在条件合适时,重复次数越来越多,样本平均会越来越靠近期望。

\[ \bar{X}_n=\frac{X_1+\cdots+X_n}{n}\longrightarrow E[X] \]

你知道吗

赌场、保险和抽样调查都离不开这个思想:单次结果很不稳定,但大量重复后的平均会变得可预测。

4.4.6   用模拟看长期平均

import numpy as np

rng = np.random.default_rng(42)
prizes = np.array([0, 5, 20])
probs = np.array([0.50, 0.35, 0.15])

draws = rng.choice(prizes, size=10000, p=probs)
print(f"理论期望 = {np.sum(prizes * probs):.2f}")
print(f"模拟平均 = {draws.mean():.2f}")
模拟平均不一定刚好等于理论期望,但会在附近晃。
对,这就是随机性和长期规律同时存在。

小率的笔记本

  • 期望是长期平均,也是概率分布的重心。
  • 离散期望是“取值 × 概率”再求和。
  • 连续期望把求和换成积分。
  • 期望有线性性,\(E[X+Y]=E[X]+E[Y]\) 不要求独立。
  • 大数定律解释了为什么长期平均会靠近期望。