跳转至

A.4   中英术语对照

本附录目标

  • 提供 统计/ML/DL 中英术语 对照
  • 速查论文 / 文档 / 课程

A.4.1   描述统计

中文 English
总体 Population
样本 Sample
参数 Parameter
统计量 Statistic
均值 Mean / Average
中位数 Median
众数 Mode
极差 Range
四分位距 Interquartile Range (IQR)
方差 Variance
标准差 Standard Deviation
偏度 Skewness
峰度 Kurtosis
直方图 Histogram
箱线图 Box Plot
散点图 Scatter Plot
频数 Frequency
经验分布函数 Empirical CDF

A.4.2   概率与分布

中文 English
概率 Probability
条件概率 Conditional Probability
独立 Independence
贝叶斯定理 Bayes' Theorem
随机变量 Random Variable
离散 / 连续 Discrete / Continuous
概率质量函数 PMF
概率密度函数 PDF
累积分布函数 CDF
期望 Expectation / Expected Value
方差 Variance
协方差 Covariance
相关系数 Correlation Coefficient
Moment
矩母函数 MGF
二项分布 Binomial
泊松分布 Poisson
指数分布 Exponential
正态 / 高斯 Normal / Gaussian
多元正态 Multivariate Normal
卡方 Chi-square
t 分布 Student's t
F 分布 F distribution
Beta / Gamma / Dirichlet 同名

A.4.3   抽样与估计

中文 English
简单随机抽样 Simple Random Sampling
分层抽样 Stratified Sampling
整群抽样 Cluster Sampling
系统抽样 Systematic Sampling
抽样分布 Sampling Distribution
标准误 Standard Error (SE)
大数定律 Law of Large Numbers (LLN)
中心极限定理 Central Limit Theorem (CLT)
点估计 Point Estimate
区间估计 Interval Estimate
置信区间 Confidence Interval (CI)
信度 / 显著水平 Confidence / Significance Level
无偏 / 一致 / 有效 Unbiased / Consistent / Efficient
最大似然 Maximum Likelihood (MLE)
矩估计 Method of Moments
Bootstrap Bootstrap
Jackknife Jackknife

A.4.4   假设检验

中文 English
原假设 / 备择 Null / Alternative Hypothesis
单侧 / 双侧 One-tailed / Two-tailed
显著水平 α Significance Level
p 值 p-value
第一类错误 / 第二类 Type I / Type II Error
功效 Power
拒绝域 Critical Region
检验统计量 Test Statistic
配对 t 检验 Paired t-test
独立两样本 t Independent two-sample t
Welch t Welch's t-test
方差分析 ANOVA
事后检验 Post-hoc Test
卡方检验 Chi-square Test
拟合优度 Goodness of Fit
列联表 Contingency Table
非参检验 Nonparametric Test
多重比较 Multiple Comparisons
Bonferroni Bonferroni Correction
FDR False Discovery Rate

A.4.5   回归与 ANOVA

中文 English
回归 Regression
简单线性回归 Simple Linear Regression
多元线性回归 Multiple Linear Regression
普通最小二乘 Ordinary Least Squares (OLS)
残差 Residual
拟合值 Fitted Value
决定系数 R² Coefficient of Determination
调整 R² Adjusted R²
多重共线性 Multicollinearity
方差膨胀因子 VIF
异方差 Heteroskedasticity
自相关 Autocorrelation
岭回归 Ridge Regression
Lasso Lasso
弹性网 Elastic Net
逻辑回归 Logistic Regression
广义线性模型 GLM
单因素方差分析 One-way ANOVA
双因素 / 交互 Two-way / Interaction
实验设计 Design of Experiments (DOE)
区组设计 Block Design

A.4.6   贝叶斯

中文 English
先验 Prior
似然 Likelihood
后验 Posterior
共轭先验 Conjugate Prior
边际似然 / 证据 Marginal Likelihood / Evidence
后验预测 Posterior Predictive
最大后验 MAP
MCMC MCMC
Metropolis-Hastings 同名
吉布斯抽样 Gibbs Sampling
哈密顿蒙特卡洛 HMC
NUTS NUTS
变分推断 Variational Inference (VI)
贝叶斯因子 Bayes Factor
可信区间 Credible Interval

A.4.7   多元 / 时间序列

中文 English
主成分分析 PCA
因子分析 Factor Analysis
典型相关 Canonical Correlation
聚类 Clustering
K-Means K-Means
层次聚类 Hierarchical Clustering
多维标度 MDS
自相关 Autocorrelation (ACF)
偏自相关 PACF
平稳 Stationary
单位根 / ADF 检验 Unit Root / ADF
白噪声 White Noise
移动平均 Moving Average (MA)
自回归 Autoregressive (AR)
ARIMA / SARIMA 同名
季节性 Seasonality
Granger 因果 Granger Causality
状态空间 State Space
卡尔曼滤波 Kalman Filter

A.4.8   机器学习

中文 English
监督 / 无监督 Supervised / Unsupervised
强化学习 Reinforcement Learning (RL)
半监督 Semi-supervised
自监督 Self-supervised
训练集 / 验证集 / 测试集 Train / Validation / Test
交叉验证 Cross-Validation (CV)
偏差-方差 Bias-Variance Tradeoff
过拟合 / 欠拟合 Overfitting / Underfitting
正则化 Regularization
早停 Early Stopping
特征工程 Feature Engineering
特征选择 Feature Selection
类别不平衡 Class Imbalance
准确率 Accuracy
精确率 / 召回率 Precision / Recall
F1 / AUC / ROC 同名
决策树 Decision Tree
随机森林 Random Forest
梯度提升 Gradient Boosting
支持向量机 SVM
朴素贝叶斯 Naive Bayes
K 近邻 k-NN
集成学习 Ensemble Learning
Bagging / Boosting / Stacking 同名

A.4.9   深度学习

中文 English
神经网络 Neural Network (NN)
多层感知机 Multilayer Perceptron (MLP)
全连接层 Fully-Connected / Dense Layer
卷积神经网络 CNN
循环神经网络 RNN
长短期记忆 LSTM
门控循环单元 GRU
注意力 Attention
自注意力 Self-Attention
多头注意力 Multi-Head Attention
Transformer Transformer
编码器 / 解码器 Encoder / Decoder
预训练 / 微调 Pre-training / Fine-tuning
嵌入 Embedding
激活函数 Activation Function
反向传播 Backpropagation
梯度下降 Gradient Descent
学习率 Learning Rate (LR)
批归一化 / 层归一化 Batch / Layer Normalization
Dropout Dropout
权重衰减 Weight Decay
大语言模型 Large Language Model (LLM)
RLHF RLHF
低秩适应 Low-Rank Adaptation (LoRA)
检索增强生成 RAG

A.4.10   因果与生存

中文 English
因果推断 Causal Inference
潜在结果 Potential Outcome
平均处理效应 Average Treatment Effect (ATE)
条件 ATE CATE
处理效应异质性 Heterogeneous Treatment Effect (HTE)
倾向得分 Propensity Score
倾向得分匹配 PSM
反向倾向加权 IPTW
双重稳健 Doubly Robust (DR)
工具变量 Instrumental Variable (IV)
双差分 Difference-in-Differences (DiD)
断点回归 Regression Discontinuity (RDD)
双重机器学习 Double ML (DML)
因果图 Directed Acyclic Graph (DAG)
混淆 Confounding
碰撞器 Collider
选择偏差 Selection Bias
删失 Censoring
生存函数 Survival Function
风险函数 Hazard Function
Kaplan-Meier KM
Cox 比例风险 Cox Proportional Hazards
加速失效时间 Accelerated Failure Time (AFT)
竞争风险 Competing Risks
C-index Concordance Index

A.4.11   工程与工具

中文 English
流水线 Pipeline
特征仓库 Feature Store
模型注册 Model Registry
持续集成 / 部署 CI / CD
A/B 测试 A/B Test
分桶 Bucketing
灰度发布 Canary Release
数据漂移 Data Drift
概念漂移 Concept Drift
监控 Monitoring
可观测性 Observability
可解释性 Interpretability / Explainability
公平性 Fairness
隐私 Privacy
差分隐私 Differential Privacy
联邦学习 Federated Learning

A.4.12   全书结束语

  • 至此 17 章全部读完。 你已经从 看不懂数据 走到 能做完整数据科学项目
  • 接下来: 选一个真实问题, 动手做 。 写代码 → 出错 → 查资料 → 解决 → 再做。 这是唯一的成长路径。
  • 祝旅途愉快, Happy Stat-ing! 🎉
小率: 17 章一路相伴, 后面真实世界更精彩, 加油!
均哥: 我现在终于敢自称会统计了, 走, 接业务需求去!