A.4 中英术语对照
本附录目标
- 提供 统计/ML/DL 中英术语 对照
- 速查论文 / 文档 / 课程
A.4.1 描述统计
| 中文 |
English |
| 总体 |
Population |
| 样本 |
Sample |
| 参数 |
Parameter |
| 统计量 |
Statistic |
| 均值 |
Mean / Average |
| 中位数 |
Median |
| 众数 |
Mode |
| 极差 |
Range |
| 四分位距 |
Interquartile Range (IQR) |
| 方差 |
Variance |
| 标准差 |
Standard Deviation |
| 偏度 |
Skewness |
| 峰度 |
Kurtosis |
| 直方图 |
Histogram |
| 箱线图 |
Box Plot |
| 散点图 |
Scatter Plot |
| 频数 |
Frequency |
| 经验分布函数 |
Empirical CDF |
A.4.2 概率与分布
| 中文 |
English |
| 概率 |
Probability |
| 条件概率 |
Conditional Probability |
| 独立 |
Independence |
| 贝叶斯定理 |
Bayes' Theorem |
| 随机变量 |
Random Variable |
| 离散 / 连续 |
Discrete / Continuous |
| 概率质量函数 |
PMF |
| 概率密度函数 |
PDF |
| 累积分布函数 |
CDF |
| 期望 |
Expectation / Expected Value |
| 方差 |
Variance |
| 协方差 |
Covariance |
| 相关系数 |
Correlation Coefficient |
| 矩 |
Moment |
| 矩母函数 |
MGF |
| 二项分布 |
Binomial |
| 泊松分布 |
Poisson |
| 指数分布 |
Exponential |
| 正态 / 高斯 |
Normal / Gaussian |
| 多元正态 |
Multivariate Normal |
| 卡方 |
Chi-square |
| t 分布 |
Student's t |
| F 分布 |
F distribution |
| Beta / Gamma / Dirichlet |
同名 |
A.4.3 抽样与估计
| 中文 |
English |
| 简单随机抽样 |
Simple Random Sampling |
| 分层抽样 |
Stratified Sampling |
| 整群抽样 |
Cluster Sampling |
| 系统抽样 |
Systematic Sampling |
| 抽样分布 |
Sampling Distribution |
| 标准误 |
Standard Error (SE) |
| 大数定律 |
Law of Large Numbers (LLN) |
| 中心极限定理 |
Central Limit Theorem (CLT) |
| 点估计 |
Point Estimate |
| 区间估计 |
Interval Estimate |
| 置信区间 |
Confidence Interval (CI) |
| 信度 / 显著水平 |
Confidence / Significance Level |
| 无偏 / 一致 / 有效 |
Unbiased / Consistent / Efficient |
| 最大似然 |
Maximum Likelihood (MLE) |
| 矩估计 |
Method of Moments |
| Bootstrap |
Bootstrap |
| Jackknife |
Jackknife |
A.4.4 假设检验
| 中文 |
English |
| 原假设 / 备择 |
Null / Alternative Hypothesis |
| 单侧 / 双侧 |
One-tailed / Two-tailed |
| 显著水平 α |
Significance Level |
| p 值 |
p-value |
| 第一类错误 / 第二类 |
Type I / Type II Error |
| 功效 |
Power |
| 拒绝域 |
Critical Region |
| 检验统计量 |
Test Statistic |
| 配对 t 检验 |
Paired t-test |
| 独立两样本 t |
Independent two-sample t |
| Welch t |
Welch's t-test |
| 方差分析 |
ANOVA |
| 事后检验 |
Post-hoc Test |
| 卡方检验 |
Chi-square Test |
| 拟合优度 |
Goodness of Fit |
| 列联表 |
Contingency Table |
| 非参检验 |
Nonparametric Test |
| 多重比较 |
Multiple Comparisons |
| Bonferroni |
Bonferroni Correction |
| FDR |
False Discovery Rate |
A.4.5 回归与 ANOVA
| 中文 |
English |
| 回归 |
Regression |
| 简单线性回归 |
Simple Linear Regression |
| 多元线性回归 |
Multiple Linear Regression |
| 普通最小二乘 |
Ordinary Least Squares (OLS) |
| 残差 |
Residual |
| 拟合值 |
Fitted Value |
| 决定系数 R² |
Coefficient of Determination |
| 调整 R² |
Adjusted R² |
| 多重共线性 |
Multicollinearity |
| 方差膨胀因子 |
VIF |
| 异方差 |
Heteroskedasticity |
| 自相关 |
Autocorrelation |
| 岭回归 |
Ridge Regression |
| Lasso |
Lasso |
| 弹性网 |
Elastic Net |
| 逻辑回归 |
Logistic Regression |
| 广义线性模型 |
GLM |
| 单因素方差分析 |
One-way ANOVA |
| 双因素 / 交互 |
Two-way / Interaction |
| 实验设计 |
Design of Experiments (DOE) |
| 区组设计 |
Block Design |
A.4.6 贝叶斯
| 中文 |
English |
| 先验 |
Prior |
| 似然 |
Likelihood |
| 后验 |
Posterior |
| 共轭先验 |
Conjugate Prior |
| 边际似然 / 证据 |
Marginal Likelihood / Evidence |
| 后验预测 |
Posterior Predictive |
| 最大后验 |
MAP |
| MCMC |
MCMC |
| Metropolis-Hastings |
同名 |
| 吉布斯抽样 |
Gibbs Sampling |
| 哈密顿蒙特卡洛 |
HMC |
| NUTS |
NUTS |
| 变分推断 |
Variational Inference (VI) |
| 贝叶斯因子 |
Bayes Factor |
| 可信区间 |
Credible Interval |
A.4.7 多元 / 时间序列
| 中文 |
English |
| 主成分分析 |
PCA |
| 因子分析 |
Factor Analysis |
| 典型相关 |
Canonical Correlation |
| 聚类 |
Clustering |
| K-Means |
K-Means |
| 层次聚类 |
Hierarchical Clustering |
| 多维标度 |
MDS |
| 自相关 |
Autocorrelation (ACF) |
| 偏自相关 |
PACF |
| 平稳 |
Stationary |
| 单位根 / ADF 检验 |
Unit Root / ADF |
| 白噪声 |
White Noise |
| 移动平均 |
Moving Average (MA) |
| 自回归 |
Autoregressive (AR) |
| ARIMA / SARIMA |
同名 |
| 季节性 |
Seasonality |
| Granger 因果 |
Granger Causality |
| 状态空间 |
State Space |
| 卡尔曼滤波 |
Kalman Filter |
A.4.8 机器学习
| 中文 |
English |
| 监督 / 无监督 |
Supervised / Unsupervised |
| 强化学习 |
Reinforcement Learning (RL) |
| 半监督 |
Semi-supervised |
| 自监督 |
Self-supervised |
| 训练集 / 验证集 / 测试集 |
Train / Validation / Test |
| 交叉验证 |
Cross-Validation (CV) |
| 偏差-方差 |
Bias-Variance Tradeoff |
| 过拟合 / 欠拟合 |
Overfitting / Underfitting |
| 正则化 |
Regularization |
| 早停 |
Early Stopping |
| 特征工程 |
Feature Engineering |
| 特征选择 |
Feature Selection |
| 类别不平衡 |
Class Imbalance |
| 准确率 |
Accuracy |
| 精确率 / 召回率 |
Precision / Recall |
| F1 / AUC / ROC |
同名 |
| 决策树 |
Decision Tree |
| 随机森林 |
Random Forest |
| 梯度提升 |
Gradient Boosting |
| 支持向量机 |
SVM |
| 朴素贝叶斯 |
Naive Bayes |
| K 近邻 |
k-NN |
| 集成学习 |
Ensemble Learning |
| Bagging / Boosting / Stacking |
同名 |
A.4.9 深度学习
| 中文 |
English |
| 神经网络 |
Neural Network (NN) |
| 多层感知机 |
Multilayer Perceptron (MLP) |
| 全连接层 |
Fully-Connected / Dense Layer |
| 卷积神经网络 |
CNN |
| 循环神经网络 |
RNN |
| 长短期记忆 |
LSTM |
| 门控循环单元 |
GRU |
| 注意力 |
Attention |
| 自注意力 |
Self-Attention |
| 多头注意力 |
Multi-Head Attention |
| Transformer |
Transformer |
| 编码器 / 解码器 |
Encoder / Decoder |
| 预训练 / 微调 |
Pre-training / Fine-tuning |
| 嵌入 |
Embedding |
| 激活函数 |
Activation Function |
| 反向传播 |
Backpropagation |
| 梯度下降 |
Gradient Descent |
| 学习率 |
Learning Rate (LR) |
| 批归一化 / 层归一化 |
Batch / Layer Normalization |
| Dropout |
Dropout |
| 权重衰减 |
Weight Decay |
| 大语言模型 |
Large Language Model (LLM) |
| RLHF |
RLHF |
| 低秩适应 |
Low-Rank Adaptation (LoRA) |
| 检索增强生成 |
RAG |
A.4.10 因果与生存
| 中文 |
English |
| 因果推断 |
Causal Inference |
| 潜在结果 |
Potential Outcome |
| 平均处理效应 |
Average Treatment Effect (ATE) |
| 条件 ATE |
CATE |
| 处理效应异质性 |
Heterogeneous Treatment Effect (HTE) |
| 倾向得分 |
Propensity Score |
| 倾向得分匹配 |
PSM |
| 反向倾向加权 |
IPTW |
| 双重稳健 |
Doubly Robust (DR) |
| 工具变量 |
Instrumental Variable (IV) |
| 双差分 |
Difference-in-Differences (DiD) |
| 断点回归 |
Regression Discontinuity (RDD) |
| 双重机器学习 |
Double ML (DML) |
| 因果图 |
Directed Acyclic Graph (DAG) |
| 混淆 |
Confounding |
| 碰撞器 |
Collider |
| 选择偏差 |
Selection Bias |
| 删失 |
Censoring |
| 生存函数 |
Survival Function |
| 风险函数 |
Hazard Function |
| Kaplan-Meier |
KM |
| Cox 比例风险 |
Cox Proportional Hazards |
| 加速失效时间 |
Accelerated Failure Time (AFT) |
| 竞争风险 |
Competing Risks |
| C-index |
Concordance Index |
A.4.11 工程与工具
| 中文 |
English |
| 流水线 |
Pipeline |
| 特征仓库 |
Feature Store |
| 模型注册 |
Model Registry |
| 持续集成 / 部署 |
CI / CD |
| A/B 测试 |
A/B Test |
| 分桶 |
Bucketing |
| 灰度发布 |
Canary Release |
| 数据漂移 |
Data Drift |
| 概念漂移 |
Concept Drift |
| 监控 |
Monitoring |
| 可观测性 |
Observability |
| 可解释性 |
Interpretability / Explainability |
| 公平性 |
Fairness |
| 隐私 |
Privacy |
| 差分隐私 |
Differential Privacy |
| 联邦学习 |
Federated Learning |
A.4.12 全书结束语
- 至此 17 章全部读完。 你已经从 看不懂数据 走到 能做完整数据科学项目 。
- 接下来: 选一个真实问题, 动手做 。 写代码 → 出错 → 查资料 → 解决 → 再做。 这是唯一的成长路径。
- 祝旅途愉快, Happy Stat-ing! 🎉
小率: 17 章一路相伴, 后面真实世界更精彩, 加油!
均哥: 我现在终于敢自称会统计了, 走, 接业务需求去!