时空数据的异质性与稀疏分布特征制约了数据挖掘算法的实现,显著影响时空数据刻画与分析能力。因此,研究异质分布稀疏时空数据重构与预测方法对于精准刻画地表自然与社会系统具有重要意义。本书通过融合时空统计和机器学习方法,提出了时空缺失数据渐进式插值、稀疏时空数据重构、顾及时空异质性的动态预测等模型。通过这些创新方法,本书为时空数据挖掘领域提供了全新的研究视角和解决方案。
样章试读
目录
- 目录
“博士后文库”序言
前言
第1章 绪论 1
1.1 研究背景和意义 1
1.2 国内外研究现状 3
1.2.1 时空数据的统计基础 3
1.2.2 缺失时空数据插值 5
1.2.3 稀疏时空数据重构 9
1.2.4 时空数据预测 13
1.3 科学问题的提出 22
1.4 研究内容 23
1.4.1 时空缺失数据的渐进式插值方法 24
1.4.2 顾及空间异质性的集成空间推断方法 24
1.4.3 轻量级稀疏时空数据重构方法 25
1.4.4 顾及时空异质性的动态预测模型 25
1.4.5 基于多任务多视图的时空预测模型 25
1.4.6 可解释的时空注意力神经常微分方程预测模型 25
第2章 时空缺失数据的渐进式插值方法 27
2.1 引言 27
2.2 模型框架 27
2.3 问题定义 29
2.4 粗粒度插值 29
2.5 细粒度插值 32
2.5.1 设定滑动窗口 33
2.5.2 细粒度空间维度插值 35
2.5.3 细粒度时间维度插值 38
2.6 时空整合 40
2.7 实验设计与模型验证 43
2.7.1 实验设计 43
2.7.2 插值精度比较 46
2.7.3 影响因素分析 48
2.8 本章小结 51
第3章 顾及空间异质性的集成空间推断方法 52
3.1 引言 52
3.2 模型框架 52
3.3 基学习器模型设计 53
3.3.1 地理加权回归模型 53
3.3.2 地理最优相似度模型 54
3.3.3 随机森林模型 55
3.4 集成策略设计 56
3.4.1 顾及空间异质性的集成策略设计 56
3.4.2 空间加权集成神经网络设计 56
3.5 顾及地理空间异质性的集成学习训练框架 57
3.6 案例1:中国PM2.5浓度空间推断 58
3.6.1 实验设计 58
3.6.2 推断精度定量分析 61
3.6.3 推断精度定性分析 63
3.6.4 基学习器对推断精度的作用分析 64
3.7 案例2:中国香港滑坡易发性空间推断 65
3.7.1 实验设计 65
3.7.2 推断精度对比 68
3.8 本章小结 69
第4章 轻量级稀疏时空数据重构方法 71
4.1 引言 71
4.2 模型框架 71
4.3 时空表示 72
4.4 改进的 SES 算法 72
4.5 改进的 IDW 算法 74
4.6 极限学习机 75
4.7 实验设计与模型验证 77
4.7.1 实验设计 77
4.7.2 重构精度比较 81
4.7.3 时空依赖性的影响 83
4.7.4 统计显著性检验 84
4.7.5 计算复杂度和效率分析 85
4.8 本章小结 86
第5章 顾及时空异质性的动态预测模型 88
5.1 引言 88
5.2 模型框架 88
5.3 时间非平稳性建模 90
5.3.1 特征表示 90
5.3.2 道路网络交通模式识别 90
5.3.3 细粒度时间区间剖分 93
5.4 空间异质性建模 95
5.4.1 自适应的时空状态矩阵 96
5.4.2 自适应的时空权重 99
5.4.3 自适应的时空参数 100
5.4.4 预测函数 101
5.5 实验设计与模型验证 102
5.5.1 实验设计 102
5.5.2 交通模式确定和时间区间划分 106
5.5.3 动态性和异质性检验 109
5.5.4 预测精度比较 112
5.5.5 扩展性评估 116
5.6 讨论 117
5.7 本章小结 118
第6章 基于多任务多视图的时空预测模型 119
6.1 引言 119
6.2 模型框架 119
6.3 构造时空立方体 120
6.4 多核学习方法 122
6.5 多任务多视图学习方法 123
6.6 粒子群优化算法 128
6.7 实验设计与模型验证 130
6.7.1 实验设计 130
6.7.2 预测精度比较 133
6.7.3 影响因素分析 134
6.7.4 训练时间评估 136
6.8 讨论 137
6.9 本章小结 138
第7章 可解释的时空注意力神经常微分方程预测模型 139
7.1 引言 139
7.2 预备知识 139
7.2.1 问题定义 139
7.2.2 神经常微分方程 141
7.3 模型框架 141
7.4 STA-ODE的构建 142
7.4.1 隐藏状态导数的参数化 143
7.4.2 隐藏状态的迭代解 144
7.4.3 多个隐藏状态的融合 145
7.5 STA-ODE的优化 147
7.6 算法与训练 148
7.7 实验设计与模型验证 149
7.7.1 实验设计 149
7.7.2 基准模型对比 151
7.7.3 预测结果的定性分析 152
7.7.4 不同组件对预测结果的影响作用 153
7.7.5 损失函数对预测结果的影响作用 154
7.7.6 模型可解释性分析 154
7.8 本章小结 156
第8章 总结与展望 157
8.1 主要研究成果 157
8.2 主要创新点 160
8.3 研究展望 161
参考文献 164
编后记 191