A.3 常用概率分布表
本附录目标
- 提供 z / t / χ² / F 临界值速查
- 给 Python 一行计算 替代纸质表
A.3.1 标准正态 Z 表
\(P(Z \leq z) = \Phi(z)\), 常用临界:
| \(\alpha\) (单侧) |
\(z_{1-\alpha}\) |
| 0.10 |
1.282 |
| 0.05 |
1.645 |
| 0.025 |
1.960 |
| 0.01 |
2.326 |
| 0.005 |
2.576 |
| 0.001 |
3.090 |
from scipy.stats import norm
norm.ppf(0.975) # 1.9600
norm.cdf(1.96) # 0.9750
A.3.2 t 分布双侧 95% 临界值 \(t_{0.025, df}\)
| df |
\(t\) |
| 1 |
12.706 |
| 2 |
4.303 |
| 5 |
2.571 |
| 10 |
2.228 |
| 15 |
2.131 |
| 20 |
2.086 |
| 30 |
2.042 |
| 50 |
2.009 |
| 100 |
1.984 |
| ∞ |
1.960 |
from scipy.stats import t
t.ppf(0.975, df=20)
A.3.3 χ² 上 5% 临界值 \(\chi^2_{0.05, df}\)
| df |
\(\chi^2\) |
| 1 |
3.84 |
| 2 |
5.99 |
| 3 |
7.81 |
| 5 |
11.07 |
| 10 |
18.31 |
| 20 |
31.41 |
| 30 |
43.77 |
| 50 |
67.50 |
| 100 |
124.34 |
from scipy.stats import chi2
chi2.ppf(0.95, df=10)
A.3.4 F 分布上 5% 临界值 \(F_{0.05, df_1, df_2}\)
部分常用 (df1 在列, df2 在行):
| df2 df1 |
1 |
2 |
5 |
10 |
30 |
| 5 |
6.61 |
5.79 |
5.05 |
4.74 |
4.50 |
| 10 |
4.96 |
4.10 |
3.33 |
2.98 |
2.70 |
| 20 |
4.35 |
3.49 |
2.71 |
2.35 |
2.04 |
| 30 |
4.17 |
3.32 |
2.53 |
2.16 |
1.84 |
| 60 |
4.00 |
3.15 |
2.37 |
1.99 |
1.65 |
| ∞ |
3.84 |
3.00 |
2.21 |
1.83 |
1.46 |
from scipy.stats import f
f.ppf(0.95, dfn=5, dfd=20)
A.3.5 泊松概率示例
\(P(X = k) = e^{-\lambda} \lambda^k / k!\)
from scipy.stats import poisson
poisson.pmf(2, mu=3) # P(X=2 | λ=3)
poisson.cdf(5, mu=3) # P(X<=5)
A.3.6 二项概率示例
\(P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}\)
from scipy.stats import binom
binom.pmf(3, n=10, p=0.4)
binom.cdf(5, n=10, p=0.5)
A.3.7 Python 是新表
| 功能 |
scipy.stats |
| 概率密度 |
.pdf(x, *) (连续) / .pmf(k, *) (离散) |
| 累积概率 |
.cdf(x, *) |
| 分位数 (反 cdf) |
.ppf(p, *) |
| 随机抽样 |
.rvs(size=n, *) |
| 矩 |
.mean(), .var() |
→ 不用查纸质表; 任何分布任何分位数都能算。
A.3.8 检验对照速查
| 检验 |
假设 |
统计量 |
分布 |
| 单样本 z |
\(\sigma\) 已知 |
\(\dfrac{\bar x - \mu_0}{\sigma/\sqrt n}\) |
N(0,1) |
| 单样本 t |
\(\sigma\) 未知 |
\(\dfrac{\bar x - \mu_0}{s/\sqrt n}\) |
\(t_{n-1}\) |
| 两样本 t (独立, 等方差) |
|
公式 §7 |
\(t_{n_1+n_2-2}\) |
| 配对 t |
|
差值 t |
\(t_{n-1}\) |
| 卡方拟合 |
|
\(\sum (O-E)^2/E\) |
\(\chi^2_{k-1}\) |
| 卡方独立 |
|
同上 |
\(\chi^2_{(r-1)(c-1)}\) |
| 方差比 F |
|
\(s_1^2 / s_2^2\) |
\(F_{n_1-1, n_2-1}\) |
| ANOVA F |
|
MSB/MSW |
\(F_{k-1, N-k}\) |
| 相关系数 t |
|
\(r\sqrt{(n-2)/(1-r^2)}\) |
\(t_{n-2}\) |
A.3.9 置信区间速查
| 参数 |
CI |
| \(\mu\) (\(\sigma\) 知) |
\(\bar x \pm z_{\alpha/2} \sigma/\sqrt n\) |
| \(\mu\) (\(\sigma\) 未知) |
\(\bar x \pm t_{\alpha/2, n-1} s/\sqrt n\) |
| \(p\) (大 n) |
\(\hat p \pm z_{\alpha/2} \sqrt{\hat p(1-\hat p)/n}\) |
| \(p\) (Wilson) |
见 §6 |
| \(\sigma^2\) |
\([(n-1)s^2/\chi^2_{1-\alpha/2}, (n-1)s^2/\chi^2_{\alpha/2}]\) |
| \(\mu_1 - \mu_2\) |
类比单样本 |
A.3.10 样本量速查
| 目标 |
公式 |
| 估 \(\mu\) 误差 \(E\) |
\(n = (z_{\alpha/2} \sigma / E)^2\) |
| 估 \(p\) 误差 \(E\) |
\(n = z_{\alpha/2}^2 p(1-p) / E^2\) (保守 \(p=0.5\)) |
| 两均值检验功效 |
\(n = 2 (z_{1-\alpha/2} + z_{1-\beta})^2 \sigma^2 / \delta^2\) |
| 两比例检验功效 |
§16.1 公式 |
A.3.11 下一步
- 下节 §A.4 中英术语对照, 看英文文献再无障碍。