跳转至

1.3   小结

这一章,小率没有先背公式,也没有先记一堆专业名词。他先做了一件更重要的事:学会在生活里看见数据。

奶茶店的销量榜、天气预报的提醒、地图上的等待时间、体检报告里的红色箭头、新闻里的图表、AI 给出的回答,都在提醒我们:现代生活到处都有数字,但数字不会自动变成可靠判断。我们要学会看来源、看背景、看变化,也要知道什么时候该继续追问。

均哥和小率整理统计学入门工具包

1.3.1   本章像一次入门旅行

第一站,我们在街头和奶茶店里发现:统计学无处不在。

它不是从复杂公式开始的,而是从一个个生活问题开始的:

  • 这个排行榜真的能代表好吃吗?
  • 天气预报提醒我带伞,我要不要听?
  • 体检报告出现红色箭头,是不是一定很严重?
  • 新闻图表看起来变化很大,是真的变化大,还是画法夸张?
  • AI 给出的解释很顺口,我能不能直接相信?

第二站,我们走进统计学简史,看见统计学一路从古代账册走到 AI 时代。

古代,人们先把粮食、田地、户籍和赋税数清楚;近代,人们开始用死亡清单、概率问题和公共卫生图表讲道理;现代,人们用模型理解误差、实验和现实规律;到了 AI 与计算时代,机器学习、深度学习、Transformer 和 ChatGPT 又把“从数据中学习规律”推到了更大的规模。

入门统计学复盘故事图

均哥给小率留了一句话:

统计学不是让你变成计算机器,而是让你在不确定的世界里,少一点盲目,多一点证据。

1.3.2   看到数字时,先问五件事

读数据前先问五件事

这五个问题会在整本书里反复出现:

  1. 它想回答什么问题:这个数字到底在说明哪件事?
  2. 它从哪里来:谁记录的,怎么记录的,有没有遗漏?
  3. 它代表谁:这些记录能不能说明我们真正关心的人和事?
  4. 它有多稳:换个时间、换一批记录,结论会不会变很多?
  5. 它能指导什么行动:看完以后,我们到底要做什么改变?

这五个问题不复杂,却很有用。它们能帮我们避免两种极端:一种是看到数字就全信,另一种是觉得数字都不可信。好的统计思维站在中间:尊重证据,也检查证据。

1.3.3   统计学的基本路线

统计分析的基本流程

统计学处理问题,通常像这样一步步往前走:

步骤 通俗理解 一个生活例子
提出问题 先问清楚 这家店到底值不值得排队
收集记录 找证据 看销量、评价、等待时间和朋友反馈
整理记录 把混乱信息摆清楚 哪些评价是真体验,哪些只是跟风
寻找线索 看有没有重复出现的现象 差评是不是都集中在出餐慢
检查可靠性 别被偶然骗了 评价太少时,不急着下结论
做出行动 用证据帮助选择 这次先避开高峰,下次再比较

这条路线以后会越来越精细。第 2 章会开始讲“怎样把一堆数据看清楚”,之后我们再学习概率、分布、抽样、估计、检验、回归、机器学习和深度学习。

但它们的入口,其实就是本章这句话:

先把问题问清楚,再让数据帮我们看清楚。

1.3.4   下一章要学什么

第 2 章会进入描述统计。听起来像技术名词,其实就是“怎样把一堆记录看清楚”:

  • 哪些数值最常出现?
  • 大多数记录集中在哪里?
  • 有没有特别高或特别低的情况?
  • 一张图怎样帮助我们快速看懂一堆记录?
  • 为什么同一堆数据,换一种画法就会给人不同感觉?

这些工具就像统计学的放大镜。先看清数据,后面才谈得上判断、预测和决策。

小率的笔记本

第一章不要求我会复杂计算,只要求我养成习惯:看到数字,多问来源;看到结论,多问依据;看到图表,多问画法;看到 AI 回答,多问证据。统计学的入门,不是立刻算得很快,而是开始想得更清楚。