9.5 小结¶
第 9 章把一个问题反复拆开:当我们面对三组及以上的数据时,怎样判断“看起来不一样”是不是足够有证据?ANOVA 的答案不是立刻两两比较,而是先看整体结构:组间差异是否大过组内自然波动。
9.5.1 一句话抓住 ANOVA¶
ANOVA 的核心是:
如果组间差异大、组内波动小,F 就大;如果组间差异和组内波动差不多,F 就小。F 大到一定程度时,我们拒绝“所有组均值相等”的零假设。
9.5.2 本章四条主线¶
| 主线 | 解决的问题 | 关键词 |
|---|---|---|
| 单因素 ANOVA | 三组及以上均值是否全相等 | SSB、SSW、F、p |
| 双因素 ANOVA | 两个因素及其组合是否影响结果 | 主效应、交互作用 |
| 事后检验 | 显著以后哪几组不同 | Tukey HSD、多重比较 |
| 实验设计 | 数据怎样来才可信 | 重复、随机化、区组 |
9.5.3 报告结果时别只写 p 值¶
一段更完整的报告通常包含:
- 检验类型:单因素 ANOVA、双因素 ANOVA 或带区组的模型。
- 自由度和 F 值:例如
F(2, 12) = 28.50。 - p 值:例如
p < 0.001。 - 效应量:例如
η² = 0.82。 - 事后检验:如果总检验显著,说明哪些组之间差异显著。
- 设计说明:数据是否独立、是否随机化、是否有区组或重复测量。
ANOVA 显著不是故事结束
显著只说明“至少有差异”。它不自动告诉我们差异在哪里,也不保证差异有实际意义。
9.5.4 什么时候换方法¶
| 数据情况 | 更合适的做法 |
|---|---|
| 方差明显不齐 | Welch ANOVA 或 Games-Howell 事后比较 |
| 分布严重偏斜且样本很小 | Kruskal-Wallis 或置换检验 |
| 同一对象重复测量 | 重复测量 ANOVA 或混合效应模型 |
| 有连续协变量 | 协方差分析 ANCOVA 或回归模型 |
| 设计中有明显区组 | 把区组纳入模型 |
小率的笔记本
ANOVA 是“比较均值”的框架,但真正要判断的是信号和噪声的比例。先看整体,再定位差异;先设计好实验,再解释结果。遇到方差不齐、重复测量或复杂结构时,不要硬套普通 ANOVA。
9.5.5 练一练¶
练习 9.1
四组数据,每组 10 人。ANOVA 表中 SSB = 240,SSW = 360。请计算 F 值和自由度。
参考答案
组间自由度为 4 - 1 = 3,组内自由度为 40 - 4 = 36。MSB = 240 / 3 = 80,MSW = 360 / 36 = 10,所以 F = 80 / 10 = 8.0。
练习 9.2
双因素 ANOVA 中,如果交互作用显著,为什么主效应要谨慎解释?
参考答案
因为一个因素的效果会随另一个因素的水平改变。此时“整体平均”的主效应可能掩盖局部差异,应进一步看简单效应或分层比较。
练习 9.3
k = 5 组,如果想做所有两两比较,一共有多少对?为什么不能直接做普通 t 检验?
参考答案
两两比较数为 C(5, 2) = 10。若每次都用 0.05 判断,整体至少出现一次假阳性的概率会上升,需要使用 Tukey、Bonferroni、Holm 等多重比较控制方法。
练习 9.4
饼干实验中,上层烤架温度更高。比较三种配方时,应该怎样设计更合理?
参考答案
把烤架位置作为区组。在上层、中层、下层每个区组内都随机安排三种配方,让配方差异不被烤架位置系统性混淆。
