全书共九章, 内容包括大数据概述、聚类分析、判别分析、主成分分析、因子分析、线性模型、回归诊断、有偏估计、变量选择. 各章都有丰富的案例分析, 为加深读者对每章内容的理解, 将每章的练习分为理论和实证部分, 书后附有参考答案, 为使书中案例贴近数据的应用实际, 采用了获取方便的证券市场高频数据并使用国际通用的 R 软件进行数据收集、处理、加工和分析, 便于读者自己动手和实际应用需要. 全书内容讲解简明扼要, 注重应用, 让读者从收集数据开始, 掌握数据收集、整理和大数据统计分析的全过程.
样章试读
目录
- 目录
前言
第1章大数据概述1
一、大数据的数字特征3
二、大数据的图表示6
练习1 12
第2章聚类分析13
一、相似性度量13
二、系统聚类法17
三、变量聚类法23
四、动态聚类法28
练习2 29
第3章判别分析31
一、距离判别31
二、费歇判别38
三、贝叶斯判别42
练习3 50
第4章主成分分析51
一、基本思想51
二、样本主成分52
三、特征值因子的筛选57
四、主成分分类66
练习4 68
第5章因子分析69
一、因子分析模型70
二、因子旋转73
三、因子得分76
练习5 82
第6章线性模型83
一、线性模型及参数的最小二乘估计83
二、最小二乘估计的性质85
三、线性模型的显著性检验87
四、正回归93
练习6 96
第7章回归诊断98
一、残差102
二、残差图106
三、异常点110
练习7 113
第8章有偏估计115
一、均匀压缩估计115
二、主成分估计117
三、岭估计122
练习8 126
第9章变量选择128
一、变量选择准则128
二、逐步回归130
三、绝对约束估计132
四、弹性约束估计135
五、非负约束估计139
练习9 142
练习提示与参考答案143
参考文献152
附录R应用程序153