本书旨在深入浅出地介绍统计方法与机器学习的核心概念和算法应用。它不仅涵盖了传统统计方法的基础知识,还深入探讨了机器学习领域的关键技术。本书首先从机器学习中的数学基础入手,包括数据的描述存储、线性变换和特征分解、概率的基本思想、概率论和统计方法在机器学习中的应用等。其次,根据机器学习的基本概念、各种分类和路径等,较全面地给出机器学习的俯瞰图。最后,本书将视角投放到当前人工智能最火爆的深度学习领域,从神经元模型到神经网络,再到目前人人关注的大语言模型。本书通过丰富的实例和实际数据集,帮助读者深入理解各种机器学习方法的原理和应用场景。
样章试读
目录
- 目录
第一篇 机器学习数学基础
第1章 线性代数 1
1.1 基本术语 1
1.1.1 标量与量 1
1.1.2 柜阵 3
1.1.3 张量 5
1.2 向量与矩阵的计算 6
1.2.1 向量与矩阵的加法和减法 6
1.2.2 向量内积 9
1.2.3 向量外积 11
1.2.4 矩阵乘法 12
1.2.5 矩阵转置 15
1.3 特殊类型的向量和矩阵 16
1.3.1 单位向量 16
1.3.2 单位矩阵和逆矩 16
1.3.3 对角矩阵 18
1.3.4 对称辦 19
1.3.5 正交向量与正交矩阵 20
1.4 向量间的距离 21
1.4.1 欧氏距离 21
1.4.2 曼哈顿距离 23
1.4.3 切比雪夫距离 23
1.4.4 夹角余弦距离 24
1.5 线性变换和特征分解 25
1.5.1 线性映射 25
1.5.2 特征值与特征向量 27
1.5.3 特征分解与对角化 28
1.5.4 奇异值分解 30
第2章 概率与统计基础 32
2.1 概率的基本思想 32
2.1.1 试验结果与概率 32
2.1.2 概率的三个公理 35
2.1.3 机器学习与概率统计 36
2.2 条件概率和事件独立性 37
2.2.1 条件概率 37
2.2.2 事件独立性 38
2.2.3 贝叶斯定理 39
2.3 随机变量 41
2.3.1 离散型随机变量和连续型随机变量 41
2.3.2 随机变量的数字特征 43
2.3.3 随机变量的联合分布 46
2.4 统计基础 47
2.4.1 总体与采样 47
2.4.2 描述性统计量 48
2.4.3 置信区间和置信水平 50
2.4.4 参数估计 51
2.4.5 假设检验 53
2.5 从数据中推断概率模型 57
2.5.1 矩估计 57
2.5.2 最小二乘估计 57
2.5.3 最大似然估计 61
2.5.4 贝叶斯估计 62
第二篇 机器学习
第3章 机器学习基础 64
3.1 机器学习简介 64
3.1.1 机器学习基本概念 64
3.1.2 机器学习的分类 69
3.1.3 机器学习与人工智能、深度学习的关系 74
3.1.4 机器学习的路径 77
3.2 机器学习任务 79
3.2.1 分类任务 79
3.2.2 回归任务 80
3.2.3 聚类任务 81
3.3 提取高维空间中的重要关系 82
3.3.1 降维技术 82
3.3.2 主成分分析 84
3.3.3 线性判别分析 87
3.3.4 局部线性嵌入 90
3.4 欠拟合与过拟合 94
3.4.1 损失函数与评估函数 95
3.4.2 欠拟合与过拟合的识别 97
3.4.3 解决欠拟合与过拟合 103
第4章 分类算法 105
4.1 分类性能评估 105
4.1.1 分类模型性能评价指标 105
4.1.2 分类模型性能评价方法 112
4.1.3 分类模型参数调优 118
4.2 决策树算& 121
4.2.1 树模型的发展历程 121
4.2.2 决策树分类的基本流程 123
4.2.3 特征选择问题 124
4.2.4 经典决策树模型 129
4.2.5 提升决策树模型性能 130
4.3 k-近邻算法 135
4.3.1 k-近邻算法原理和流程 135
4.3.2使用碰邻算法进行分类应用 136
4.3.3 k值选择问题 137
4.4 支持向量机 140
4.4.1 线性支持向量机 141
4.4.2 软间隔支持向量机 144
4.4.3 核函数和非线性支持向量机 146
4.4.4 多分类支持向量机 152
第5章 聚类算法 155
5.1 聚类算法评 156
5.1.1 内部评价指标 156
5.1.2 外部评价指标 161
5.1.3 直观评估方法 164
5.2 划分法聚类算法 164
5.2.1 免-Means算法原理和流程 165
5.2.2 k值选择问题 167
5.2.3 优化和挑战 170
5.3 层次聚类算法 173
5.3.1 凝聚型层次聚类 173
5.3.2 分裂型层次聚类 176
5.3.3 簇数选择问题 177
5.4 基于密度的聚类算法 178
5.4.1 基本概念 179
5.4.2 DBSCAN算法原理和流程 180
5.4.3 DBSCAN 聚类算法变种OPTICS 183
5.5 聚类算法应用 189
第6章 回归算法 192
6.1 回归模型的评估 192
6.1.1 绝对误差指标 193
6.1.2 相对误差指标 195
6.2 线性回归模型 197
6.2.1 简单线性_模型 197
6.2.2 多元线性回归模型 198
6.2.3 线性回归模型的训练 198
6.3 岭回归 200
6.4 Lasso回归 202
第三篇 神经网络与深度学习
第7章 神经网络 209
7.1 神经元模型 210
7.1.1 人工神经元模S 210
7.1.2 激活函数 212
7.2 网络结构 214
7.2.1 单层神经网络 215
7.2.2 浅层神经网络 218
7.2.3 深层神经网络 218
7.3 模型训练 219
7.3.1 损失函数的选取 219
7.3.2 参数优化 222
7.3.3 前向传播与反向传播 227
7.3.4 模型优化避免过拟合 231
7.3.5 模型保存与模型部署 233
第8章 常见神经网络 235
8.1 卷积神经网络 235
8.1.1 核心概念 235
8.1.2 架构详解 237
8.1.3 损失函数和优化算法 240
8.1.4 应用案例 241
8.2 生成对抗醜 242
8.2.1 基本结构 243
8.2.2 生成器和判别器的训练 243
8.2.3 模式崩溃 S 244
8.2.4应用案例 246
8.3 Transformer 248
8.3.1 基本架构 249
8.3.2 算法优化 251
8.3.3 应用案例 252
第9章 深度学习最新发展 254
9.1 迁移学习 254
9.1.1 常见迁移学习方法 254
9.1.2 迁移学习的应用 255
9.1.3 迁移学习未来展望 256
9.2 强化学习 258
9.2.1 强化学习核心要素 258
9.2.2 强化学习的架构 259
9.2.3 马尔可夫决策过程 259
9.2.4 常见强化学习算法 260
9.2.5 强化学习未来展望 263
9.3 模型蒸馈 264
9.3.1 模型蒸馏原理 264
9.3.2 蒸馏过程与方法 266
9.3.3 模型蒸馏损失函数 267
9.3.4 模型蒸馏未来展望 269
9.4 大语言模型 270
9.4.1 大语言模型发展历程 271
9.4.2 大语言模型 272
9.4.3 大语言模型的训练方法 273
9.4.4 大语言模型未来展望 274
参考文献 276