跳转至

9.5   小结

第 9 章把一个问题反复拆开:当我们面对三组及以上的数据时,怎样判断“看起来不一样”是不是足够有证据?ANOVA 的答案不是立刻两两比较,而是先看整体结构:组间差异是否大过组内自然波动。

图 9.5.1 方差分析核心知识地图

9.5.1   一句话抓住 ANOVA

ANOVA 的核心是:

\[ F=\frac{\text{组间均方}}{\text{组内均方}} \]

如果组间差异大、组内波动小,F 就大;如果组间差异和组内波动差不多,F 就小。F 大到一定程度时,我们拒绝“所有组均值相等”的零假设。

9.5.2   本章四条主线

主线 解决的问题 关键词
单因素 ANOVA 三组及以上均值是否全相等 SSB、SSW、F、p
双因素 ANOVA 两个因素及其组合是否影响结果 主效应、交互作用
事后检验 显著以后哪几组不同 Tukey HSD、多重比较
实验设计 数据怎样来才可信 重复、随机化、区组

9.5.3   报告结果时别只写 p 值

一段更完整的报告通常包含:

  • 检验类型:单因素 ANOVA、双因素 ANOVA 或带区组的模型。
  • 自由度和 F 值:例如 F(2, 12) = 28.50
  • p 值:例如 p < 0.001
  • 效应量:例如 η² = 0.82
  • 事后检验:如果总检验显著,说明哪些组之间差异显著。
  • 设计说明:数据是否独立、是否随机化、是否有区组或重复测量。

ANOVA 显著不是故事结束

显著只说明“至少有差异”。它不自动告诉我们差异在哪里,也不保证差异有实际意义。

9.5.4   什么时候换方法

数据情况 更合适的做法
方差明显不齐 Welch ANOVA 或 Games-Howell 事后比较
分布严重偏斜且样本很小 Kruskal-Wallis 或置换检验
同一对象重复测量 重复测量 ANOVA 或混合效应模型
有连续协变量 协方差分析 ANCOVA 或回归模型
设计中有明显区组 把区组纳入模型

小率的笔记本

ANOVA 是“比较均值”的框架,但真正要判断的是信号和噪声的比例。先看整体,再定位差异;先设计好实验,再解释结果。遇到方差不齐、重复测量或复杂结构时,不要硬套普通 ANOVA。


9.5.5   练一练

练习 9.1

四组数据,每组 10 人。ANOVA 表中 SSB = 240,SSW = 360。请计算 F 值和自由度。

参考答案

组间自由度为 4 - 1 = 3,组内自由度为 40 - 4 = 36。MSB = 240 / 3 = 80,MSW = 360 / 36 = 10,所以 F = 80 / 10 = 8.0。

练习 9.2

双因素 ANOVA 中,如果交互作用显著,为什么主效应要谨慎解释?

参考答案

因为一个因素的效果会随另一个因素的水平改变。此时“整体平均”的主效应可能掩盖局部差异,应进一步看简单效应或分层比较。

练习 9.3

k = 5 组,如果想做所有两两比较,一共有多少对?为什么不能直接做普通 t 检验?

参考答案

两两比较数为 C(5, 2) = 10。若每次都用 0.05 判断,整体至少出现一次假阳性的概率会上升,需要使用 Tukey、Bonferroni、Holm 等多重比较控制方法。

练习 9.4

饼干实验中,上层烤架温度更高。比较三种配方时,应该怎样设计更合理?

参考答案

把烤架位置作为区组。在上层、中层、下层每个区组内都随机安排三种配方,让配方差异不被烤架位置系统性混淆。