什么是机器学习?机器学习能做什么?本书将带你走进机器学习的世界。
本书面向机器学习初学者,以山羊博士和双叶同学的教学漫画情境为引,以对话和图解为主要展现形式,从查看样本数据开始,循序渐进地讲解机器学习的基本语法、各种算法和编程样例。最后,本书通过图像预测数字,让读者体验机器学习的开发过程。
样章试读
目录
- 目录
第1章 机器学习的准备
第1课 什么是机器学习? 4
机器学习概述 6
数据分析和机器学习的区别 10
第2课 区分即理解 12
机器学习算法的本质——画线 16
为了准确区分,有意义的特征量尤为重要 18
第3课 机器学习的准备工作 20
在Windows中安装 Jupyter Notebook 21
在macOS上安装 Anaconda 24
为Jupyter Notebook安装必要的库 27
启动Jupyter Notebook 29Notebook的基本使用方法 33
第2章 查看样本数据
第4课 scikit-learn样本数据集 40
鸢尾花品种数据集 41
第5课 自动生成样本数据集 54
自动生成用于分类的数据集(聚类形) 54
自动生成用于分类的数据集(月牙形) 59
自动生成用于分类的数据集(双环形) 63
自动生成用于分类的数据集(同心圆形) 64
自动生成用于回归的数据集 66
第3章 了解机器学习的步骤
第6课 准备数据 72
第7课 划分训练数据和测试数据 76
第8课 选择模型进行训练 80
第9课 测试模型 82
第10课 输入新值并预测 85
第11课 将分类状态可视化 87
第4章 机器学习的各种算法
第12课 回归:线性回归 98
线性回归是什么算法? 99
模型的使用方法 100
试验 101
第13课 分类:逻辑回归 106
逻辑回归是什么算法? 108
模型的使用方法 108
试验 108
第14课 分类:SVM 115
模型的使用方法 120
试验 121
第15课 分类:决策树 127
决策树是什么算法? 128
模型的使用方法 128
试验 129
第16课 分类:随机森林 136
随机森林是什么算法? 137
模型的使用方法 137
试验 138
第17课 分类:k-NN 140
k-NN 是什么算法? 141
模型的使用方法 141
试验 142
第18课 聚类:k-means 143
k-means是什么算法? 144
模型的使用方法 146
试验 147
第5章 小智回归!根据图像预测数字
第19课 准备数据 152
新建Notebook 文件 153
第20课 准备训练数据 160
第21课 训练模型 163
第22课 预测 165
在Jupyter Notebook中上传文件 166
读取图像,预测数字 168
第23课 利用无监督学习将数据可视化 174
第24课 学无止境 179