本书深入介绍无人机系统的组成,以及无人机系统在现实世界的对地观测与智能分析任务中所依赖的视觉增强与重建,目标检测与跟踪,目标识别与理解,视觉建图、导航与定位以及具身主动感知与理解等核心技术。全书不仅涵盖现代无人机的基础系统组成和配备的基本视觉任务模块,还深入阐述具身视觉问答、具身视觉导航等前沿智能算法,以及其在智能交通、环境监测、应急救援等领域的应用。通过结合最新研究成果与实际应用,本书为读者提供丰富的理论知识和实践指导。
样章试读
目录
- 目录
第1章 概述 1
1.1 无人机系统 1
1.1.1 无人机飞行平台 2
1.1.2 任务载荷 3
1.1.3 传感设备 4
1.1.4 计算平台 5
1.2 无人机感知 6
1.2.1 概念 6
1.2.2 关键技术 7
本章小结 12
习题 13
第2章 视觉增强与重建 14
2.1 视觉增强与重建背景 14
2.2 视觉增强的基本方法 15
2.2.1 无人机航拍图像压缩失真修复的基本方法 15
2.2.2 无人机航拍图像去噪声的基本方法 17
2.2.3 无人机航拍图像去云去雾的基本方法 22
2.2.4 无人机航拍图像去阴影的基本方法 27
2.2.5 无人机航拍图像超分辨率重建的基本方法 29
2.3 视觉重建的基本方法 31
2.3.1 相机标定 31
2.3.2 特征提取与匹配 32
2.3.3 稀疏重建 33
2.3.4 密集匹配 33
2.4 传统无人机航拍影像三维重建方法 34
2.4.1 运动恢复结构方法 35
2.4.2 立体匹配方法 36
2.4.3 多视角立体视觉方法 37
2.5 基于深度学习的无人机航拍影像三维重建方法 37
2.5.1 基于深度学习的运动恢复结构方法 38
2.5.2 基于深度学习的立体匹配方法 38
2.5.3 基于深度学习的多视角立体视觉方法 39
2.5.4 神经辐射场方法 39
2.6 无人机航拍激光点云三维重建 41
2.6.1 基于无人机航拍激光点云的建筑物三维重建 42
2.6.2 基于无人机航拍激光点云的城市环境三维重建 46
本章小结 49
习题 50
第3章 目标检测与跟踪 51
3.1 目标检测的背景 51
3.2 目标检测的基本方法 51
3.2.1 基于特征的目标检测方法 51
3.2.2 基于CNN的两阶段目标检测方法 55
3.2.3 基于CNN的单阶段目标检测方法 58
3.2.4 基于Transformer的目标检测方法 61
3.3 无人机航拍运动目标检测方法 63
3.3.1 问题定义 63
3.3.2 帧差法 63
3.3.3 背景差法 64
3.3.4 光流法 65
3.4 无人机航拍弱小目标检测 66
3.4.1 问题定义 66
3.4.2 特征与空间对齐网络 67
3.5 无人机目标实例分割方法 71
3.5.1 实例分割基础 72
3.5.2 实例分割技术挑战 72
3.5.3 基于卷积神经网络的实例分割模型 73
3.5.4 基于FPN的多尺度特征融合 74
3.5.5 基于注意力机制的实例分割方法 75
3.6 目标跟踪介绍 77
3.7 无人机单目标跟踪 79
3.7.1 基于光流法的无人机单目标跟踪方法 82
3.7.2 跟踪-学习-检测目标跟踪算法 84
3.7.3 基于均值漂移跟踪算法的无人机跟踪方法 85
3.7.4 基于相关滤波的无人机单目标跟踪方法 87
3.8 无人机多目标跟踪 93
3.8.1 多目标跟踪介绍 93
3.8.2 多目标跟踪算法的一般工作流程 99
3.8.3 多目标跟踪算法的分类 101
3.8.4 多目标跟踪的应用 109
3.8.5 目标跟踪的评价指标 113
3.9 无人机目标跟踪的前沿研究 115
3.10 无人机目标跟踪的未来发展方向 116
本章小结 117
习题 118
第4章 目标识别与理解 119
4.1 目标细粒度类别识别背景 119
4.2 目标细粒度识别基本方法 119
4.2.1 基于特征提取的传统方法 119
4.2.2 基于定位-分类的深度学习方法 120
4.2.3 基于网络集成的深度学习方法 121
4.2.4 基于高阶编码特征的深度学习方法 122
4.3 目标个体识别(重识别)技术 123
4.3.1 目标个体识别任务的定义 124
4.3.2 无人机目标识别的研究意义 124
4.4 目标个体识别基本方法 125
4.5 无人机目标个体识别任务 126
4.5.1 跨视角目标个体识别 126
4.5.2 跨模态目标个体识别 128
4.5.3 多尺度目标个体识别 130
4.5.4 多类别目标个体识别 131
4.6 无人机目标行为识别介绍 132
4.7 无人机目标行为识别基本方法 133
4.7.1 目标行为识别传统方法 133
4.7.2 基于卷积神经网络的目标行为识别方法 134
4.7.3 基于循环神经网络的目标行为识别方法 135
4.7.4 基于生成对抗网络的目标行为识别方法 136
4.7.5 基于注意力机制的目标行为识别方法 137
4.8 无人机目标行为预测 138
4.8.1 基于视频预测的无人机目标行为预测方法 138
4.8.2 基于轨迹预测的无人机目标行为预测方法 140
4.8.3 基于异常预测的无人机目标行为预测方法 142
本章小结 144
习题 145
第5章 视觉建图、导航与定位 147
5.1 视觉建图背景 147
5.2 面向无人机视觉导航的实时精确二维全景拼接建图 149
5.2.1 图像配准 150
5.2.2 图像融合 151
5.3 基于正射影的无人机航拍图像拼接基本框架 152
5.3.1 SFM过程 153
5.3.2 正射影图生成 154
5.4 无人机长距离视觉优化建图与定位 154
5.4.1 经典视觉SLAM框架 154
5.4.2 基于ORB特征的三维定位与地图构建算法 157
5.5 无人机神经渲染虚实融合建图 160
5.5.1 基于神经辐射场的三维重建基本框架 160
5.5.2 基于3D Gaussian的三维重建基本框架 165
5.6 无人机融合视觉建图的目标地理定位 167
5.6.1 航拍图像目标地理定位的算法框架 168
5.6.2 基于卡尔曼滤波的无人机地理定位算法 169
本章小结 171
习题 172
第6章 具身主动感知与理解 173
6.1 无人机具身视觉问答背景 173
6.2 基于无人机的具身视觉问答方法 175
6.2.1 基于无人机的具身视觉问答方法框架 175
6.2.2 基于多模态因式双线性池化的无人机具身视觉问答 178
6.2.3 基于知识蒸馏的无人机具身视觉问答 180
6.3 无人机视觉语言导航概述 181
6.4 无人机视觉语言导航任务的常用方法 184
6.4.1 基于数据增广的方法 184
6.4.2 基于数据表征的方法 188
6.4.3 基于行为策略学习的方法 191
本章小结 195
习题 196
参考文献 197