3.1 什么是概率¶
周六上午,小率背着包准备出门打球。门口阳光很好,手机却弹出天气提醒:傍晚降雨概率 70%。
他站在鞋柜旁犹豫。带伞吧,背包会变重;不带吧,万一回家路上下雨,球鞋就要一路踩水。小率看着窗外的蓝天,嘀咕道:“现在明明不像要下雨,70% 到底是在说什么?”
均哥没有直接替他做决定。他把手机天气、窗外云层和门口的雨伞放在同一个问题里看:“概率不是在保证某件事一定发生,而是在帮你衡量:面对不确定,值不值得提前准备。”
这一节先不急着背公式。我们先把概率当成生活里的判断工具:事情还没有发生,但我们已经掌握了一些线索;概率就是把这些线索压缩成一个可以讨论、可以比较、可以行动的数字。
3.1.1 70% 不是承诺,而是可能性刻度¶
小率最困惑的是这句话:
今天傍晚降雨概率 70%。
它不表示“今天 70% 的时间都在下雨”,也不表示“这座城市 70% 的地方一定下雨”。更稳妥的理解是:在当前的云层、水汽、气压、历史相似天气和预报模型判断下,“傍晚会下雨”这个事件有较高机会发生。
概率(Probability)是 0 到 1 之间的数,用来描述事件发生的可能性:
- 0:不可能发生。
- 1:一定发生。
- 0.5:像公平硬币正反面一样,两边机会相当。
- 0.7:发生的机会更高,但仍然不是保证。
如果一个天气系统经常给出“70% 降雨概率”,那么我们希望在大量类似预报中,最后真的下雨的比例大致接近 70%。这叫“校准”直觉:概率不是看一次准不准,而是看很多次同类判断是否说话算数。
你知道吗
天气预报不是靠一个人凭感觉猜。它会结合气象观测、数值模型、历史相似天气和预报员修正。我们在手机上看到的一个百分数,背后是一整套把不确定性压缩成数字的过程。
3.1.2 概率真正帮你做的是决策¶
带不带伞,并不只取决于“会不会下雨”。它还取决于两件事:
- 不带伞但下雨,代价有多大。
- 带伞但没下雨,麻烦有多大。
这就是为什么同样是 70%,不同人会做不同决定。小率要背着球拍和水杯,觉得雨伞有点占地方;均哥晚上还要带电脑回家,就更不愿意冒淋雨的风险。
70% 到底该怎么用
如果带伞的麻烦很小,而淋雨的代价很大,哪怕降雨概率只有 40%,也可能值得带伞。反过来,如果只是下楼取快递,70% 也未必非要带伞。
我们可以把决策写成一个很朴素的比较:
| 选择 | 如果下雨 | 如果不下雨 |
|---|---|---|
| 带伞 | 没淋湿,只是多背一把伞 | 多背一把伞 |
| 不带伞 | 可能淋湿、耽误回家 | 轻松出门 |
这也是统计学很实用的地方。我们不一定能消灭不确定性,但可以把“不知道”变成“有多可能”,再把“有多可能”放进真实选择里。
3.1.3 概率有三种常见读法¶
同一个“概率”数字,在不同场景里会有不同来源。均哥在纸上画了三种入口:
| 视角 | 适合什么场景 | 一句话理解 |
|---|---|---|
| 古典概率 Classical Probability | 骰子、扑克牌、抽签等结果对称的问题 | 所有结果等可能,直接数一数 |
| 频率概率 Frequentist Probability | 能重复很多次的实验或记录 | 看长期重复中比例会稳定到哪里 |
| 主观概率 Bayesian Probability | 天气、诊断、预测等会随证据更新的问题 | 根据已有信息表达当前相信程度 |
小率发现,三种读法并不矛盾。掷骰子时,我们常从“每面等可能”出发;抛硬币很多次时,我们观察正面频率是否稳定;天气预报和体检筛查里,我们会随着新证据更新判断。
为了避免混乱,读一个概率时先问三句:
- 这个概率来自对称规则,还是来自长期记录?
- 这个概率是在描述未来一次结果,还是描述很多次里的比例?
- 如果出现新信息,这个概率要不要更新?
3.1.4 频率会晃,但会围着概率走¶
均哥拿出一枚硬币:“如果只抛 10 次,正面可能是 3 次,也可能是 7 次。你不能因为这 10 次就断言硬币不公平。”
次数少时,频率很容易晃。次数多起来,公平硬币的累计正面比例通常会慢慢靠近 0.5。
import numpy as np
rng = np.random.default_rng(31)
tosses = rng.integers(0, 2, size=600) # 1 表示正面,0 表示反面
running_frequency = np.cumsum(tosses) / np.arange(1, len(tosses) + 1)
print("前 10 次后的累计正面频率:")
print(np.round(running_frequency[:10], 2))
print(f"600 次后的累计正面频率:{running_frequency[-1]:.3f}")
这段代码模拟了 600 次抛硬币。前几次的比例可能很跳,最后的累计比例通常会更接近 0.5。这就是概率里非常重要的直觉:单次结果不容易预言,长期比例可以描述。
3.1.5 概率必须守住三条底线¶
概率可以处理不确定性,但它不是随便写百分数。只要叫概率,就要守住三条底线。
第一,概率不能小于 0,也不能大于 1:
第二,样本空间里的全部可能合在一起,概率是 1:
第三,如果两个事件不可能同时发生,就可以直接相加:
回到带伞故事,如果我们只关心“傍晚下雨”和“傍晚不下雨”,这两个事件互不重叠,而且合起来就是全部可能。若下雨概率是 0.7,那么不下雨概率就是:
需要注意
“下雨”和“刮风”可能同时发生,不能直接把两者概率相加当成“下雨或刮风”的概率。只有两个事件互不重叠时,直接相加才安全。
小率的笔记本
- 概率是在不确定中表达可能性的刻度,不是单次预言书。
- 70% 不是承诺,而是“在相似条件下长期大约七成会发生”的判断。
- 做决定时,概率要和代价一起看。
- 频率是观察到的比例;概率是长期机制或当前证据下的可能性。
- 写概率前,要先问事件是什么、全部可能是什么、有没有额外信息。


