13.2 监督学习与无监督学习¶

社团老师又给小率两项任务。

第一项：根据同学的兴趣、历史活动和空闲时间，预测他最后会不会报名摄影社。第二项：不看报名结果，只根据兴趣和行为，把同学自然分成几类，方便以后设计活动。

同一张表，两个问题都像机器学习。差别藏在一个小小的地方：训练时有没有“参考答案”。

同学	运动兴趣	艺术兴趣	活动次数	是否报名摄影社
A	0.8	0.2	6	否
B	0.1	0.9	4	是
C	0.4	0.7	2	是
...	...	...	...	...

同一张表，为什么一会儿叫监督学习，一会儿叫无监督学习？

看你训练时用不用“答案列”。有答案学预测，没答案找结构。

13.2.1 有答案的题叫监督学习¶

监督学习（Supervised Learning） 的训练数据长这样：

\[ \{(\mathbf{x}_1,y_1),(\mathbf{x}_2,y_2),\ldots,(\mathbf{x}_n,y_n)\} \]

每个样本既有输入 \(\mathbf{x}\)，也有标签 \(y\)。模型要学：

\[ \hat y=f(\mathbf{x}) \]

如果 \(y\) 是类别，比如“报名 / 不报名”，任务叫 分类（Classification）。如果 \(y\) 是连续数字，比如“预计参加次数”，任务叫 回归（Regression）。

监督学习的关键词

训练时有标签，预测时给新样本标签。分类预测类别，回归预测连续数值。

监督学习里的监督，就是每道练习题后面都附了答案？

对。模型答完之后，可以和答案比一比，再调整规则。

13.2.2 没答案时先找结构¶

无监督学习（Unsupervised Learning） 只有输入：

\[ \{\mathbf{x}_1,\mathbf{x}_2,\ldots,\mathbf{x}_n\} \]

它没有“是否报名摄影社”这一列，所以不能直接学习 \(\mathbf{x}\to y\)。它常做两类事：

聚类（Clustering）：把相似同学放到同一组。
降维（Dimensionality Reduction）：把很多特征压成少数几个坐标，方便观察结构。

在社团数据里，聚类可能发现三类人：运动型、艺术型、社交型。但这些名字不是模型自动懂的，需要人根据每组特征解释。

所以无监督学习给的是线索，不是标准答案。

没错。它像先把地图上的点圈起来，再请人给每个圈命名。

13.2.3 五种学习范式放在一张表里¶

范式	数据长相	典型问题	常见方法
监督学习	\((\mathbf{x},y)\)	分类、回归	线性模型、树、神经网络
无监督学习	\(\mathbf{x}\)	聚类、降维	K-Means、PCA、DBSCAN
半监督学习	少量 \((\mathbf{x},y)\) + 大量 \(\mathbf{x}\)	标签很贵时分类	伪标签、标签传播
自监督学习	从数据自身造标签	文本、图像表征学习	掩码预测、对比学习
强化学习	状态、动作、奖励	游戏、控制、策略	Q-learning、策略梯度

先问有没有标签

判断任务类型时，先看训练时是否有目标列 \(y\)。有明确目标列，多半是监督学习；只有特征没有答案，多半是无监督学习。

13.2.4 用 Python 看同一批点的两种问法¶

from sklearn.datasets import make_blobs
from sklearn.linear_model import LogisticRegression
from sklearn.cluster import KMeans

X, y = make_blobs(n_samples=120, centers=2, random_state=2026)

clf = LogisticRegression().fit(X, y)
print("监督学习预测:", clf.predict(X[:5]).tolist())

kmeans = KMeans(n_clusters=2, random_state=2026, n_init="auto").fit(X)
print("无监督聚类编号:", kmeans.labels_[:5].tolist())

监督学习的输出会尽量对齐真实标签；聚类编号只是“第 0 组、第 1 组”，编号本身没有业务含义。

聚类结果不等于真相

聚类算法总能分出一些组，但“这些组是否有意义”要回到场景和数据质量中验证。不要把算法给出的簇名当作自然存在的类别。

小率的笔记本

有标签学预测，没标签找结构。分类和回归属于监督学习；聚类和降维属于无监督学习。半监督、自监督、强化学习都是在“标签从哪里来、反馈怎么来”上继续变化。