论文目录 | |
摘要 | 第1-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第10-23页 |
1.1 研究背景和意义 | 第10-12页 |
1.2 国内外研究现状 | 第12-20页 |
1.3 论文的主要内容和组织结构 | 第20-23页 |
1.3.1 主要内容 | 第20-21页 |
1.3.2 组织结构 | 第21-22页 |
1.3.3 章节关系 | 第22-23页 |
第2章 联合特定人物和场景的视频检索理论及关键任务 | 第23-34页 |
2.1 基于内容的视频实例检索方法 | 第23-26页 |
2.1.1 视频实例检索的概念 | 第23-24页 |
2.1.2 视频实例检索的相关知识 | 第24-26页 |
2.2 联合特定人物和场景的视频实例检索的关键任务 | 第26-29页 |
2.2.1 视频中特定人物的实例检索 | 第26-28页 |
2.2.2 视频中特定场景的实例检索 | 第28页 |
2.2.3 视频中联合特定人物和场景的实例检索结果优化 | 第28-29页 |
2.3 联合特定人物和场景的视频实例检索面临的挑战 | 第29-30页 |
2.4 联合特定人物和场景的视频实例检索技术框架 | 第30-32页 |
2.5 本章小结 | 第32-34页 |
第3章 基于局部与全局特征组合优化的特定场景检索 | 第34-58页 |
3.1 引言 | 第34-35页 |
3.2 视频预处理 | 第35-39页 |
3.2.1 关键帧提取 | 第36-37页 |
3.2.2 基于局部的查询预处理 | 第37-39页 |
3.2.3 基于全局的查询预处理 | 第39页 |
3.3 基于局部特征的特定目标检索 | 第39-44页 |
3.3.1 SIFT特征与BOW模型 | 第40-42页 |
3.3.2 基于BOW的局部特征提取与结果初排 | 第42-44页 |
3.3.3 基于SIFT的空间重排及局部检索结果生成 | 第44页 |
3.4 基于全局特征的特定场景检索 | 第44-48页 |
3.4.1 卷积神经网络的基本理论 | 第45-46页 |
3.4.2 基于RCNN的全局特征提取 | 第46-47页 |
3.4.3 基于RCNN的全局检索结果生成 | 第47-48页 |
3.5 基于局部与全局组合优化的特定场景检索 | 第48页 |
3.6 实验与分析 | 第48-56页 |
3.6.1 实验环境和实验数据 | 第48-52页 |
3.6.2 实验过程及评测方法 | 第52-53页 |
3.6.3 实验结果及分析 | 第53-56页 |
3.7 本章小结 | 第56-58页 |
第4章 基于噪声去除与近邻补全的视频实例检索 | 第58-69页 |
4.1 引言 | 第58页 |
4.2 基于噪声去除的视频实例检索 | 第58-61页 |
4.2.1 噪声数据定义 | 第58-61页 |
4.2.2 基于噪声去除的视频检索方法实现 | 第61页 |
4.3 基于近邻补全的视频实例检索 | 第61-64页 |
4.3.1 近邻补全方法动机 | 第61-63页 |
4.3.2 基于近邻补全的视频检索方法实现 | 第63-64页 |
4.4 基于噪声去除与近邻补全联合优化的视频实例检索 | 第64页 |
4.5 实验与分析 | 第61-67页 |
4.5.1 实验环境与实验数据 | 第64页 |
4.5.2 实验过程及评测方法 | 第61-65页 |
4.5.3 实验结果及分析 | 第65-67页 |
4.6 本章小结 | 第67-69页 |
第5章 联合特定人物和场景的视频实例检索系统设计与实现 | 第69-86页 |
5.1 引言 | 第69页 |
5.2 视频检索系统设计与实现 | 第69-75页 |
5.2.1 需求分析 | 第69-71页 |
5.2.2 流程分析 | 第71-73页 |
5.2.3 功能细节 | 第73-75页 |
5.3 联合特定人物和场景的视频检索系统结果展示界面设计 | 第75-79页 |
5.4 联合特定人物和场景的视频检索系统结果交互界面设计 | 第79-81页 |
5.5 实验与分析 | 第81-85页 |
5.5.1 实验环境和实验数据 | 第81-82页 |
5.5.2 实验过程与评测方法 | 第82页 |
5.5.3 实验结果与分析 | 第82-85页 |
5.6 本章小结 | 第85-86页 |
第6章 总结与展望 | 第86-88页 |
参考文献 | 第88-91页 |
攻读硕士学位期间的科研工作情况 | 第91-92页 |
致谢 | 第92-93页 |