第 2 章 描述统计¶
Abstract
第一章里,小率已经知道:看到数字时,不要急着相信,也不要急着否定,先问它从哪里来、代表什么、能不能支持行动。第二章开始,我们要学习第一批真正的工具:怎样把一堆记录看清楚。
描述统计不是为了把所有指标都机械算一遍,而是为了回答几个朴素问题:这组数据的对象是谁?每一列代表什么?大多数值集中在哪里?散得有多开?有没有长尾、异常值和奇怪形状?图表应该怎样画,才不会把读者带偏?
小率把一天的记录摊在桌上:奶茶小票、公交等待时间、体检数字、班级问卷、运动步数。每张纸上都有数字,但它们混在一起时,只像一团杂乱的信息。
均哥没有先拿计算器,而是把这些纸按来源分成几堆:消费记录放一边,等待时间放一边,问卷答案放一边,身体指标放一边。小率这才发现,统计学的第一步并不是“赶快算平均”,而是先把问题摆正。
我以前以为描述统计就是算几个数,原来它更像整理线索。
对。先分清每张纸是什么,再看中心、波动、形状和图表。看清楚以后,后面的判断才有地基。
这一章会反复训练一个顺序:
- 先问对象:这组数据记录的是谁或什么?
- 再认变量:每一列到底表示类别、数量、等级,还是时间?
- 接着看分布:数字集中在哪里,散得多开,尾巴往哪边拖?
- 最后选工具:该用均值还是中位数,该画直方图还是条形图?
如果第一章是在学会“看见生活里的数字”,第二章就是开始学会“把数字收拾成能理解的样子”。描述统计的价值不在于炫耀公式,而在于帮我们避免两种常见错误:把一堆复杂数据压成一个过度简单的数字,或者面对一堆数字完全不知道从哪里看起。
本章内容¶
- 2.1 总体与样本
- 2.2 变量与数据类型
- 2.3 频数与频率分布
- 2.4 均值
- 2.5 中位数与众数
- 2.6 方差与标准差
- 2.7 极差与四分位距
- 2.8 偏度与峰度
- 2.9 数据可视化基础
- 2.10 小结
这一章的主线
描述统计的顺序很像整理房间:先确认“这些东西来自哪里”,再分类,再数一数,再找中心,再看波动,最后用图表把结构讲清楚。

