跳转至

6.8   小结

小率把这一章的纸条摊开:点估计、估计量性质、MLE、置信区间、t 分布、Wilson、Bootstrap。看起来很多,其实主线很简单:

从样本出发,猜总体参数;再把“猜得有多不确定”讲清楚。

第 6 章主线

点估计回答“给我一个数”;估计量性质回答“这个公式好不好”;MLE 回答“哪个参数最像数据”;置信区间回答“这个数大概会晃到哪里”;Bootstrap 回答“公式不好推时怎么办”。


6.8.1   一页速查表

图 6.8.1 参数估计核心知识地图

先看问题类型

估均值、估比例、估方差、估复杂统计量,走的区间方法不同。不要看到“95% CI”就机械套同一个公式。


6.8.2   核心知识地图

这张图可以按两条线读:

  • 估一个数:点估计先给出 \(\hat\theta\),矩估计用样本特征匹配总体特征,MLE 选择让数据最像的参数。
  • 评价这个数:估计量要看无偏、方差、MSE 和一致性。一个估计量不一定处处最好,要看你更怕系统性偏差,还是更怕波动太大。
  • 给不确定性范围:均值常用 t 区间,比例优先 Wilson,公式难推时可以考虑 Bootstrap。

章末速查的使用方式

先确定“我要估计什么参数”,再确定“样本量和假设是否支撑公式”,最后才选择区间方法。顺序反过来,很容易为了套公式而套公式。


6.8.3   公式速查

场景 常用方法 公式骨架
总体均值,\(\sigma\) 已知 z 区间 \(\bar x \pm z_{\alpha/2}\sigma/\sqrt n\)
总体均值,\(\sigma\) 未知 t 区间 \(\bar x \pm t_{\alpha/2,n-1}s/\sqrt n\)
总体比例 Wilson 优先 反解 score 不等式
方差 \(\chi^2\) 区间 \((n-1)s^2/\sigma^2\)
中位数、相关系数等 Bootstrap 重抽样分位数

点估计常见结果:

参数 常用估计
均值 \(\mu\) \(\bar X\)
比例 \(p\) \(\hat p=X/n\)
泊松率 \(\lambda\) \(\bar X\)
指数率 \(\lambda\) \(1/\bar X\)
正态方差 \(\sigma^2\) 的 MLE \(\frac{1}{n}\sum(X_i-\bar X)^2\)
正态方差 \(\sigma^2\) 的无偏估计 \(\frac{1}{n-1}\sum(X_i-\bar X)^2\)

6.8.4   选择方法的短路径

我应该用哪个区间

先问:估的是什么?再问:样本量多大?最后问:公式假设靠不靠谱?

你要估计 优先选择 小心事项
均值,样本不小 t 区间 明显偏态时检查稳健性
均值,小样本且近似正态 t 区间 离群值影响很大
比例,小样本或极端比例 Wilson 不要默认 Wald
比例差 比例差区间 看 0 是否在区间内
中位数、分位数、相关系数 Bootstrap 样本太小或时序数据要谨慎
最大值、最小值 专门极值方法 普通 Bootstrap 不稳

6.8.5   常见误区

把 95% CI 当成真值概率

频率学派置信区间里,真值固定,区间随机。正确说法是:重复抽样并构造区间,长期约 95% 的区间覆盖真值。

小样本 σ 未知还用 z

\(s\) 代替 \(\sigma\) 会增加不确定性,小样本要用 t 分布补偿。

比例区间默认 Wald

Wald 公式简单,但小样本和极端比例容易越界或覆盖不足。实战优先 Wilson。

MLE 一定无偏

MLE 追求让观测数据最像,不保证无偏。正态方差的 MLE 分母是 \(n\),就是有偏估计。

Bootstrap 万能

Bootstrap 强在复杂统计量,但普通 Bootstrap 不适合极值统计量和强时间依赖数据。


6.8.6   小率的最后一页

这一章像是从“我猜一个数”升级成“我知道自己猜得有多不稳”。
对。下一章假设检验,就是把“不确定的估计”进一步变成“能不能下判断”。

小率的笔记本

参数估计的核心不是神奇公式,而是一条工作流:抽样得到数据,构造估计量,评价估计量,给出不确定性范围。点估计要配区间估计,公式区间要检查假设,公式难推时考虑 Bootstrap。


6.8.9   练一练

本章核心练习题汇总。建议先动笔再看参考答案。

练习 6.1.1 — 概念区分

下列哪些是参数, 哪些是统计量? (a) 全国成年男性平均身高 175 cm (b) 这次抽样 100 人的样本均值 174.3 cm © σ = 7 cm

参考答案

(a) © 是参数 (总体属性, 固定); (b) 是统计量 (基于样本, 随机)。

练习 6.1.2 — 矩估计

\(X \sim \mathrm{Exp}(\lambda)\) , \(E[X] = 1/\lambda\) 。求 \(\lambda\) 的矩估计。

参考答案

\(\bar{X} = 1/\hat{\lambda} \Rightarrow \hat{\lambda} = 1/\bar{X}\)

练习 6.2.1 — 无偏吗?

样本极差 \(R = X_{(n)} - X_{(1)}\) 是不是总体极差的无偏估计?

参考答案

不是, 通常 $E[R] < $ 总体极差 (因极差受样本数限制, 总会偏小)。是 有偏低估

练习 6.2.2 — MSE 计算

\(\hat{\theta}_1\) 无偏, 方差 = 4; \(\hat{\theta}_2\) 偏差 = 1, 方差 = 2。哪个 MSE 小?

参考答案

MSE₁ = 4 + 0 = 4; MSE₂ = 2 + 1 = 3。 \(\hat{\theta}_2\) 更小, 虽然有偏。

练习 6.3.1 — 几何分布 MLE

\(X_i \sim \mathrm{Geom}(p)\) , \(P(X=k) = (1-p)^{k-1} p\) , \(k \geq 1\) 。求 \(\hat{p}_{MLE}\)

参考答案

\(\ell(p) = n \log p + (\sum x_i - n) \log (1-p)\) 求导: \(\hat{p}_{MLE} = n / \sum x_i = 1/\bar{X}\)

练习 6.3.2 — 不变性

\(\hat{\sigma}^2 = 4\)\(\sigma^2\) 的 MLE, 那么 \(\sigma\) 的 MLE 是?

参考答案

由不变性: \(\hat{\sigma} = \sqrt{4} = 2\)

练习 6.4.1 — 解读

某药效研究报告 "降压均值 6.5 mmHg, 95% CI [3.2, 9.8]" 。下面哪些说法对? (1) 真值有 95% 概率在 [3.2, 9.8] (2) 这种统计方法在 95% 的研究中能覆盖真值 (3) 95% 的患者降压在 3.2~9.8 之间 (4) 因 0 不在区间内, 药有效

参考答案

(2) 正确; (4) 在 5% 显著性下可接受 (见第 7 章); (1) 是常见误读; (3) 把 CI 当预测区间, 错。

练习 6.4.2 — 计算

某零件抗压强度 σ = 12 (kg/cm²)。抽 64 件 \(\bar{x} = 200\)。求 99% CI。

参考答案

SE = 12/8 = 1.5。z₀.₀₀₅ = 2.576。CI = 200 ± 2.576×1.5 = 200 ± 3.86 = [196.14, 203.86]。

练习 6.5.1 — 小样本

n=9, \(\bar{x} = 25\), \(s = 6\)。 (a) 95% CI? (b) 90% CI?

参考答案

SE = 6/3 = 2。 df=8。 (a) \(t_{0.025,8} = 2.306\) → 25 ± 4.61 = [20.39, 29.61]。 (b) \(t_{0.05,8} = 1.860\) → 25 ± 3.72 = [21.28, 28.72]。

练习 6.5.2 — 大小样本对比

若用 z=1.96 代替练习 6.5.1 的 t, 95% CI 会偏窄还是偏宽? 误差有多大?

参考答案

z=1.96 < t=2.306, 故误用 z 会让 CI 偏窄 ~ 18%, 实际覆盖率显著低于 95%。

练习 6.6.1 — 民调

随机调查 600 人, 312 人支持。求支持率 95% Wald CI。

参考答案

p̂ = 312/600 = 0.52。SE = √(0.52×0.48/600) = 0.0204。 CI = 0.52 ± 1.96×0.0204 = 0.52 ± 0.040 = [48.0%, 56.0%]。

练习 6.6.2 — 极端 p̂

n=20, X=20 (全成功)。Wald 给 [1,1]; 用 Wilson 算 95% CI。

参考答案

Wilson: \(p \in (1 + 0.096 \pm 1.96 \sqrt{0 + 0.0096})/(1+0.192)\) \(= (1.096 \pm 0.192)/1.192 = [0.759, 1.080]\) → 截到 [0.759, 1.000]。 远比 Wald 合理。

练习 6.7.1 — 步骤

用一句话说出 Bootstrap 的关键操作。

参考答案

『从原样本中有放回抽 n 个』, 重复多次, 得到统计量的近似分布。

练习 6.7.2 — 适用判断

下列哪些适合用 Bootstrap? (a) 总体均值 CI (n=200) (b) 总体最大值 CI © 时间序列移动平均 CI (d) 中位数 CI

参考答案

(a)(d) 适合 (经典使用场景); (b) 不适合, 极值不稳; © 不能直接用普通 Bootstrap, 需 Block Bootstrap。