本书着重介绍大数据建模与分析中常用的概率极限理论,主要内容包括相依随机变量和过程的极限理论、Stein方法及其应用、自正则化极限理论、高维样本协方差矩阵的谱统计量渐近分布理论、随机梯度方法及其应用、随机复杂网络的整体和局部结构、分布式统计推断方法和渐近理论、Gauss逼近原理及其应用等。
样章试读
目录
- 目录
《大数据与数据科学专著系列》序
前言
第1章 经典极限理论 1
1.1 基本概念 1
1.1.1 概率空间 1
1.1.2 条件概率 3
1.1.3 独立性 3
1.1.4 随机变量及其分布 4
1.1.5 二维随机向量 6
1.1.6 多维随机向量 8
1.1.7 数学期望 9
1.1.8 方差 11
1.1.9 协方差 12
1.1.10 条件期望 13
1.1.11 特征函数 13
1.1.12 矩量法 14
1.1.13 随机变量的收敛 15
1.1.14 经典极限定理 18
1.2 大数定律 18
1.3 中心极限定理 21
1.3.1 常用证明方法 22
1.3.2 Berry-Esséen界 23
1.3.3 Cramér中偏差 25
1.3.4 Edgeworth展开 25
1.4 弱不变原理 26
1.5 强不变原理 30
1.6 附注 31
1.7 习题 33
第2章 相依序列极限定理 39
2.1 相依随机序列 39
2.1.1 鞅 39
2.1.2 平稳序列 41
2.1.3 Markov链 41
2.2 平稳随机序列遍历性 43
2.2.1 均值遍历性 44
2.2.2 强遍历性 47
2.3 鞅中心极限定理 49
2.3.1 平稳鞅差序列 49
2.3.2 鞅差组列 51
2.4 鞅逼近方法 51
2.5 Markov链中心极限定理 60
2.6 线性过程中心极限定理 68
2.7 应用 74
2.8 附注 78
2.9 习题 80
第3章 Stein方法 82
3.1 Stein引理和Stein方程 82
3.2 独立随机变量的部分和 86
3.3 非线性统计量 94
3.3.1 非线性统计量的Berry-Esséen界 94
3.3.2 U-统计量 99
3.4 可交换对 100
3.4.1 基本概念和性质 101
3.4.2 L1界 102
3.4.3 Berry-Esséen界 111
3.5 非正态逼近 115
3.5.1 L1界 117
3.5.2 Berry-Esséen界 118
3.5.3 应用:Curie-Weiss模型 119
3.6 附注 122
3.7 习题 123
第4章 自正则化极限理论 128
4.1 依分布收敛 128
4.1.1 独立同分布情形 129
4.1.2 独立非同分布情形 132
4.2 Berry-Esséen界 132
4.3 自正则化大偏差定理 135
4.4 自正则化中偏差定理 141
4.5 Cramér型中偏差定理 146
4.6 附注 152
4.7 习题 153
第5章 高维协方差矩阵 155
5.1 经典多元统计分析理论 155
5.1.1 主成分分析 157
5.1.2 无线性分布 158
5.2 经验谱分布 160
5.2.1 Mar?enko-Pastur分布 161
5.2.2 Stieltjes变换 162
5.2.3 经验谱极限分布 165
5.3 线性特征根统计量的中心极限定理 168
5.4 极值特征根的渐近分布 174
5.4.1 极值特征根的几乎必然收敛性 174
5.4.2 Tracy-Widom分布 177
5.4.3 极值特征根的渐近分布 182
5.5 有限秩扰动 184
5.6 附注 187
5.7 习题 192
第6章 随机梯度下降法 197
6.1 强凸函数优化 198
6.1.1 凸函数和强凸函数 198
6.1.2 简单随机梯度下降法 202
6.2 随机逼近的收敛性 207
6.2.1 线性方程组求解 207
6.2.2 非线性问题求解 212
6.2.3 最小均方算法 214
6.3 非凸函数优化 215
6.4 附注 222
6.5 习题 225
第7章 随机复杂网络 228
7.1 图的基本概念 228
7.2 Erd?s-Rényi随机图 230
7.2.1 ER 随机图的演化和相变 232
7.2.2 ER 随机图顶点度的分布 237
7.3 偏好依附模型 241
7.4 复制模型 249
7.4.1 顶点的估计 251
7.4.2 顶点度的估计 253
7.5 谱半径 254
7.6 半圆律 256
7.7 区块检测 260
7.8 附注 262
7.9 习题 264
第8章 分布式参数统计推断 267
8.1 分布式一步估计法 268
8.1.1 线性平均估计 268
8.1.2 中位数估计 270
8.2 指数型分布族分布式参数估计 278
8.3 Newton-Raphson迭代法 285
8.3.1 分布式估计Newton型迭代法 285
8.3.2 分布式估计Newton型迭代法 288
8.4 加权分布式估计 298
8.5 附注 302
8.6 习题 304
第9章 Gauss逼近 310
9.1 Gauss 随机向量部分量的最大值 319
9.2 独立随机向量部分和的最大分量 324
9.2.1 条件独立分布逼近 324
9.2.2 强逼近 326
9.3 经验过程Gauss逼近 329
9.4 应用 334
9.4.1 局部经验过程 334
9.4.2 轮廓经验过程 335
9.4.3 非Gauss模型的Dantzig选择 337
9.4.4 伪发现选择 340
9.5 附注 343
9.6 习题 348
附录 常用概率不等式 353
A 基本概率不等式 353
B 独立随机变量部分和的概率不等式 355
C 鞅不等式 357
D 其他不等式 359
参考文献 363
《大数据与数据科学专著系列》已出版书目 375