跳转至

3.8   小结

学完这一章,小率终于发现:概率不是“把不确定的事情说得很神秘”,而是把不确定性拆成可以检查的几个问题。

要不要带伞,先看事件和概率刻度;玩骰子桌游,先列样本空间;天气和跑步记录里,看到“且”就数同时发生;抽扑克牌,看到“已知”就换分母;水果摊的坏果率,要按来源拆开再加回去;咖啡店抽奖,判断独立要看条件概率有没有改变;最后再回到天气和跑步,用贝叶斯定理反推来源。

这些故事看起来不同,但背后的动作很一致:先把“可能发生什么”说清楚,再把“我们知道了什么”说清楚,最后再计算。


3.8.1   一页速查表

概念 公式 使用提示
概率边界 \(0\le P(A)\le 1\) 概率不能小于 0,也不能大于 1
必然事件 \(P(\Omega)=1\) 样本空间一定发生
补集 \(P(A^c)=1-P(A)\) 求“不发生”或“至少一次”时常用
容斥 \(P(A\cup B)=P(A)+P(B)-P(A\cap B)\) “或”包含重叠,重叠要减一次
联合概率 \(P(A\cap B)\)\(P(A,B)\) 两件事同时发生
条件概率 \(P(A\mid B)=P(A\cap B)/P(B)\) 已知 \(B\) 后,只在 \(B\) 里看 \(A\)
乘法公式 \(P(A\cap B)=P(B)P(A\mid B)\) 沿概率树一路相乘
全概率公式 \(P(A)=\sum_i P(B_i)P(A\mid B_i)\) 按来源拆开,再加回总概率
贝叶斯定理 \(P(B_i\mid A)=\frac{P(B_i)P(A\mid B_i)}{\sum_jP(B_j)P(A\mid B_j)}\) 看到结果后,反推来源
独立 \(P(A\cap B)=P(A)P(B)\) 知道一个事件,不改变另一个事件概率

3.8.2   核心知识地图

图 3.8.1 概率基础核心知识地图

这张图可以按一条线读:

  1. 先确定样本空间 \(\Omega\)
  2. 再把问题翻译成事件 \(A,B\)
  3. 如果出现“或”“不”,就用集合运算。
  4. 如果出现“且”“同时”,先想到联合概率 \(P(A\cap B)\)
  5. 如果出现“已知”,就用条件概率。
  6. 如果结果来自多个来源,就用全概率。
  7. 如果想直接相乘,先检查独立性。
  8. 如果看到结果后反推来源,就用贝叶斯。

3.8.3   做概率题时先问这五句话

  1. 所有可能结果是什么?
    如果连样本空间都没写清楚,后面的概率很可能是在空中算。

  2. 题目问的是哪个事件?
    “至少一个”“恰好一个”“全部都是”“不发生”是不同事件。

  3. 有没有条件?
    看到“已知”“在……中”“如果已经发生”,就检查分母是不是变了。

  4. 是求结果,还是看到结果后反推原因?
    前者常用全概率,后者常用贝叶斯。

  5. 两个事件能不能直接相乘?
    只有独立时,\(P(A\cap B)=P(A)P(B)\) 才能直接用。

概率题最难的好像不是算,而是把题目翻译对。
对。翻译对了,公式往往自己就出现了。

3.8.4   概率题决策树

题目问什么?
├─ 求 “A 或 B”?
│  ├─ A、B 互斥 → 直接相加
│  └─ A、B 有重叠 → 用容斥公式
├─ 求 “A 且 B”?
│  ├─ 独立 → P(A)P(B)
│  └─ 不独立或有顺序变化 → P(A)P(B|A)
├─ 出现 “已知 / 在……中 / 如果已经发生”?
│  └─ 用条件概率,先缩小样本空间
├─ 有多个来源、多个袋子、多个水果类别?
│  └─ 用全概率,按来源拆开再相加
└─ 看到结果后反推原因?
   └─ 用贝叶斯定理,别忘了所有可能来源

3.8.5   复盘问题:跑步以后,为什么不能直接说下雨概率是 20%?

小率的复盘问题

过去 100 天里,下雨天占 20%,下雨时小率跑步的概率也是 20%。如果已经知道小率今天跑步了,为什么今天下雨的概率不是 20%,而是 \(4/61\)

均哥的回答

因为问题方向换了。\(P(\text{跑步}\mid\text{下雨})=4/20=0.20\),问的是“下雨时跑步”;而 \(P(\text{下雨}\mid\text{跑步})=4/61\),问的是“已经跑步后反推下雨”。后者的分母是全部跑步的 61 天,不只是下雨的 20 天。

这个问题是本章最值得反复回看的例子。它把联合概率、条件概率、全概率和贝叶斯定理都串起来了:

  • 联合概率告诉我们“下雨且跑步”是 4 天。
  • 条件概率提醒我们方向不能反。
  • 全概率告诉我们跑步来自“下雨、刮风、晴天”三条路。
  • 贝叶斯定理把这些路径合在一起,更新“跑步后天气来源”的判断。

3.8.6   术语对照表 Glossary

中文 English 符号
随机试验 Random Experiment -
样本空间 Sample Space \(\Omega\)
事件 Event \(A,B\)
并集 Union \(A\cup B\)
交集 Intersection \(A\cap B\)
补集 Complement \(A^c\)
联合概率 Joint Probability \(P(A\cap B)\)
条件概率 Conditional Probability \(P(A\mid B)\)
全概率公式 Law of Total Probability \(\sum_i P(B_i)P(A\mid B_i)\)
贝叶斯定理 Bayes' Theorem \(P(B_i\mid A)\)
独立 Independence \(P(A\cap B)=P(A)P(B)\)

3.8.7   练一练

练习 3.1 · 天气预报

天气预报说“傍晚降雨概率 70%”。请说明这个数字不应该被理解成哪两种常见错误。

参考答案

不应简单理解为“今天 70% 的时间会下雨”,也不应简单理解为“70% 的地区会下雨”。更稳妥的理解是:在当前证据和模型判断下,傍晚降雨事件发生的可能性较高。

练习 3.2 · 两枚骰子

同时掷两枚骰子,求“点数和大于 8”的概率。

参考答案

有利结果 10 个,总结果 36 个,所以概率为 \(10/36=5/18\)

练习 3.3 · 扑克牌条件方向

一副 52 张扑克牌中,“已知是红牌,问是不是 K”和“已知是 K,问是不是红牌”是否等价?为什么?

参考答案

不等价。前者是 \(P(K\mid 红牌)=2/26=1/13\),后者是 \(P(红牌\mid K)=2/4=1/2\)。两个问题的分母不同。

练习 3.4 · 天气和跑步的联合概率

过去 100 天里,下雨 20 天,其中下雨且跑步 4 天。请写出“下雨且跑步”的联合概率,并说明分母是谁。

参考答案

\(P(\text{下雨且跑步})=4/100=0.04\)。分母是全部 100 天,而不是下雨的 20 天。

练习 3.5 · 水果摊全概率

水果摊有西瓜 50 个、香蕉 30 个、橙子 20 个;坏果数分别是 10、3、4。随机拿一个水果,拿到坏果的概率是多少?

参考答案

\(0.50\times(10/50)+0.30\times(3/30)+0.20\times(4/20)=0.17\),即 17%。

练习 3.6 · 硬币和珠袋

固定珠袋中红珠比例为 0.4。先抛公平硬币,再从这个固定珠袋中抽珠。硬币正面事件和抽到红珠事件是否独立?

参考答案

独立。因为硬币结果不会改变珠袋,\(P(红珠\mid 正面)=P(红珠)=0.4\)

练习 3.7 · 互斥不是独立

一次只抽一颗珠子。事件 \(R\) 表示抽到红珠,事件 \(L\) 表示抽到蓝珠。若红珠和蓝珠都可能被抽到,\(R\)\(L\) 是否独立?

参考答案

不独立。它们互斥,知道抽到蓝珠后,抽到红珠的概率变成 0;这改变了原来的 \(P(R)\)

小率的笔记本

  • 先写样本空间,再写事件。
  • 看见“或”,检查是否重叠;看见“且”,先想到联合概率。
  • 看见“已知”,优先想到条件概率。
  • 看见“多个来源”,优先想到全概率。
  • 看见“结果反推原因”,优先想到贝叶斯。
  • 独立不是“看起来没关系”,而是条件概率不改变。