人工智能时代,数据已成为核心战略资源。“数字+”快速渗透到各行各业,日益融入经济社会发展各领域全过程。无论党政机关还是众多企事业单位,都需要基于数据做出科学正确的决策。因此,顺应时代发展,不论是经管类、理工类,还是文史哲等各类专业的学生,都需要培养一定的数据思维,掌握分析工具以洞察规律、驱动创新。本书聚焦实用技能培养,主要介绍SAS、R、MATLAB和Python四大主流数据分析软件,通过通俗易懂的语言讲解编程基础、操作流程,并辅以典型案例详解,帮助读者快速上手实践。本书内容设计以“理解原理-动手实操-解读结果-应用落地”为主线,逐步提升数据处理与业务结合的能力。
样章试读
目录
- 目录
第一篇 基于SAS的统计分析
第一章 SAS语言基础 3
第一节 SAS语言概述 3
第二节 数据步 4
第三节 过程步 16
第二章 描述统计分析 20
第一节 基本语句介绍 20
第二节 计算描述统计量 24
第三节 绘制统计图形 33
第三章 参数估计与假设检验 38
第一节 基本语句介绍 38
第二节 单个正态总体的参数估计 40
第三节 两个正态总体的参数估计 41
第四节 0-1总体比例的参数估计 43
第五节 单样本t检验 45
第六节 两独立样本t检验 46
第七节 配对样本t检验 48
第八节 0-1总体比例的假设检验 49
第四章 方差分析 53
第一节 基本语句介绍 53
第二节 单因素方差分析 54
第三节 无交互作用的双因素方差分析 58
第四节 有交互作用的双因素方差分析 60
第五章 相关分析与回归分析 63
第一节 基本语句介绍 63
第二节 一元线性回归分析 66
第三节 多元线性回归分析 69
第四节 非线性回归分析 76
第五节 logistic回归分析 82
第二篇 基于R语言的统计分析
第六章 R软件的基础知识 89
第一节 R软件简介 89
第二节 R软件的优缺点 89
第三节 R软件的安装与运行 90
第四节 初识R软件 91
第七章 用R软件进行数据的描述 95
第一节 用频数分布表来观察数据分布 95
第二节 数值数据的图形展示 99
第三节 类别数据的图形展示 102
第四节 用统计量描述数据 103
第八章 用R软件进行数据的参数估计 105
第一节 一个正态总体均值的区间估计 105
第二节 两个正态总体均值差的区间估计 106
第三节 两个正态总体方差比的区间估计 107
第四节 总体比例的区间估计 108
第九章 用R软件进行数据的假设检验 110
第一节 一个正态总体均值的检验 110
第二节 两个正态总体均值差的检验 111
第三节 两个正态总体方差比的检验 112
第四节 非正态总体参数的检验 112
第十章 用R软件进行数据的方差分析 114
第一节 单因素方差分析 114
第二节 无交互作用的双因素方差分析 115
第三节 有交互作用的双因素方差分析 116
第十一章 用R软件进行数据的回归分析 117
第一节 相关分析 117
第二节 一元线性回归分析 118
第三节 多元线性回归分析 120
第三篇 基于MATLAB的统计分析
第十二章 MATLAB基础 125
第一节 MATLAB主界面 125
第二节 数据和变量 127
第三节 数组及其运算 129
第四节 M文件和M函数 135
第十三章 数理统计分析 138
第一节 概率分布 138
第二节 统计量分析与数据可视化 141
第三节 数据插值与拟合 146
第十四章 数据描述性分析 152
第一节 一维数据的分布与检验 152
第二节 多维数据的分布与检验 155
第三节 数据变换 159
第十五章 回归分析 164
第一节 一元线性回归 164
第二节 一元多项式回归 167
第三节 多元回归 171
第十六章 最优化求解 176
第一节 无约束优化问题 176
第二节 带约束优化问题 180
第三节 多元优化问题 183
第四篇 基于Python的数据处理
第十七章 Python语言简介 189
第一节 变量、数据类型与数据结构 190
第二节 控制流程 193
第三节 文件读写 195
第四节 函数 195
第五节 模块 196
第十八章 Python数据采集 198
第一节 读写文本格式的数据 198
第二节 网络爬虫 202
第三节 使用Python查询数据库 217
第十九章 Python机器学习 221
第一节 机器学习的分类及对应类库 221
第二节 线性模型 222
第三节 决策树 230
第四节 聚类算法 233
第五节 降维 237
第六节 支持向量机 243
第七节 人工神经网络 247
第二十章 数据可视化 251
第一节 数据可视化简介 251
第二节 matplotlib.pyplot库的介绍 251
第三节 简单图表绘制 254