10.7 小结¶

这一章从一枚硬币开始，逐步走到后验推断、共轭先验、MCMC 和两大学派比较。贝叶斯统计最重要的不是某个神秘公式，而是一种顺序清楚的思维：先表达已有看法，再让数据更新它，最后带着不确定性做判断。

10.7.1 全章主线¶

贝叶斯公式：

\[ P(\theta\mid D)=\frac{P(D\mid\theta)P(\theta)}{P(D)} \]

最常用的口头版：

\[ \text{后验}\propto\text{似然}\times\text{先验} \]

Beta-Binomial 更新：

\[ \text{Beta}(a,b)+k\text{ 次成功}+(n-k)\text{ 次失败} =\text{Beta}(a+k,b+n-k) \]

后验预测：

\[ P(\tilde{x}\mid D)=\int P(\tilde{x}\mid\theta)P(\theta\mid D)d\theta \]

决策路线

能共轭就先用共轭闭式解；不能共轭但维度不高，可以考虑 MCMC；数据很大、模型很深时，可以考虑变分推断或近似方法。真正重要的是先把问题、先验和数据来源说清楚。

做一个贝叶斯分析时，小率会按这个顺序检查：

小率的笔记本

贝叶斯统计把旧信息、新数据和不确定性放在同一个框架里。它最实用的地方，是能直接回答“现在我有多相信”“这个方案更好概率多大”“下一批数据可能怎样”。但这种直观表达要付出代价：先验、模型和计算诊断都必须透明。

练习 10.1

医生知道某病发病率为 1%，检测灵敏度 99%，特异度 99%。一个人检测阳性后，患病概率是多少？

参考答案

分子是 0.99 * 0.01。分母是 0.99 * 0.01 + 0.01 * 0.99。结果为 0.5。低基线率下，假阳性会显著影响后验概率。

练习 10.2

Beta(2,2) 先验，观察到 30 次中 18 次成功，后验是什么？

参考答案

后验是 Beta(20,14)，因为成功次数加到第一个参数，失败次数加到第二个参数。

练习 10.3

为什么不能把频率派 95% 置信区间解释成“参数有 95% 概率落在这里”？

参考答案

在频率派框架下，参数是固定常数，随机的是区间构造过程。贝叶斯信用区间才可以直接用后验概率解释。

练习 10.4

MCMC 中一条链看起来有样本，为什么还要做诊断？

参考答案

因为链可能尚未收敛、样本自相关很高，或卡在局部区域。需要检查轨迹图、有效样本量、多链一致性等。