教育论文网

深度强化学习推荐算法研究与实现

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机的应用论文信息处理(信息加工)论文检索机论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机软件论文程序设计、软件工程论文程序设计论文
深度强化学习推荐算法研究与实现
论文目录
 
摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-16页
 1.1 研究背景和研究意义第10-12页
 1.2 国内外研究现状和发展趋势第12-15页
 1.3 研究内容与章节安排第15-16页
第二章 基础算法概述第16-32页
 2.1 协同过滤推荐算法第16-22页
  2.1.1 基于用户的协同过滤推荐算法第17页
  2.1.2 基于项目的协同过滤推荐算法第17-18页
  2.1.3 常见相似度与预测数据计算第18-19页
  2.1.4 系统评价标准第19-22页
 2.2 深度强化学习算法第22-31页
  2.2.1 深度学习之卷积神经网络第22-25页
  2.2.2 强化学习算法第25-29页
   2.2.2.1 Q-learning算法第26-28页
   2.2.2.2 策略梯度(Policy Gradient)第28-29页
  2.2.3 深度Q学习算法第29-31页
 2.3 本章小结第31-32页
第三章 基于深度特征提取的强化学习推荐算法第32-52页
 3.1 现状分析第32-33页
 3.2 算法模型构建第33-44页
  3.2.1 模型数据特征提取第35-40页
   3.2.1.1 用户特征提取第35-37页
   3.2.1.2 用户兴趣的动态捕捉第37-38页
   3.2.1.3 电影特征提取第38-40页
  3.2.2 Q网络设计第40页
  3.2.3 动作与奖励值设计第40-41页
  3.2.4 历史记录回放机制第41-42页
  3.2.5 基于深度特征提取的深度强化学习推荐系统流程第42-44页
 3.3 实验数据与结果第44-50页
  3.3.1 实验数据介绍第44-47页
  3.3.2 实验设计与结果对比第47-50页
   3.3.2.1 奖励值设定合理性验证第47-48页
   3.3.2.2 系统推荐精度第48-50页
   3.3.2.3 历史回放机制策略的有效性第50页
 3.4 本章小结第50-52页
第四章 基于策略梯度算法改进的强化学习推荐模型(DPGQN)第52-58页
 4.1 现状分析与解决思路第52-53页
 4.2 基于策略梯度算法改进的强化学习推荐模型第53-55页
  4.2.1 模型实现框架第53-54页
  4.2.2 策略梯度网络连续动作决策第54-55页
 4.3 实验设计与结果第55-56页
 4.4 本章小结第56-58页
第五章 总结与展望第58-60页
 5.1 研究工作总结第58页
 5.2 研究展望第58-60页
参考文献第60-64页
致谢第64-66页
攻读学位期间取得的研究成果第66页

本篇论文共66页,点击这进入下载页面
 
更多论文
深度强化学习推荐算法研究与实现
基于情感增强的对话模型的设计与实
面向Android Native应用的代码保护
基于处理器跟踪和控制流完整性的软
基于灰度图的恶意软件检测方法研究
基于移动终端手指操作行为的身份认
智能合约运行时自我保护技术的研究
云环境下支持密文搜索的健康数据安
基于动态符号执行和静态分析的Fuzz
基于全局函数调用关系的Android系统
面向驾驶场景的车载应用检测技术研
面向医疗图像的可逆数字水印算法研
基于双向Transformer编码器及分段卷
基于交互式图模型的关系抽取模型研
基于抽象语法树的代码缺陷检测技术
文本主题建模技术研究与实现
支持隐私保护的数据挖掘方法研究及
基于对抗网络的跨领域关系抽取研究
面向Android平台的App保护方案研究
基于FAHP与SVM的安全风险评估方案研
面向车联网的分层区块链设计与实现
基于微服务业务平台的服务监控研究
视频智能填充的研究与实现
基于web的三维虚拟形象生成与控制方
基于微服务架构的加氢站选址系统设
面向文本的实体关系提取方法的研究
组件化可配置B2B2C平台运营前端系统
基于微服务的B2B2C平台销售系统服务
基于LDA主题模型和ALS协同过滤的节
基于隐式社群和多模态的视频推荐算
复合型日志模版提取方法的研究与实
面向智能客服的多人交互式WebAR系统
基于网络切片下的车联网无线资源分
基于雾计算的智能工厂网络资源调度
基于Hyperledger的私有区块链系统设
示例图像的特征表示和检索
行人的特征表示与再辨识
面向物联网应用的增强安全机制研究
可扩展的智能合约扫描器的研究与实
基于视频分析的动态纹理缺陷检测
基于Appium的APP并行自动化测试平台
面向异构计算的大数据智能分析平台
基于移动大数据的人群移动事件的检
基于移动摄像头的多目标检测、跟踪
复杂条件下的高效人脸检测算法
个性化推荐的城市穿越与定向运动平
“城市穿越”的智能化数据管理系统
Scratch教学平台教师端管理系统的设
面向篮球运动的智能比赛解析系统设
基于上下文感知和多特征的群组活动
基于仿射匹配的双目视觉由运动恢复
面向三维重建的单目深度估计研究与
 
神经网络论文 深度强化学习论文 推荐系统论文 优先级回放论文
版权申明:目录由用户szr1234567**提供,www.51papers.com仅收录目录,作者需要删除请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved