教育论文网

基于深度强化学习的第一人称射击游戏研究

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文计算技术、计算机技术论文计算机软件论文程序包(应用软件)论文
基于深度强化学习的第一人称射击游戏研究
论文目录
 
摘要第1-5页
abstract第5-6页
第一章 绪论第9-18页
    1.1 研究工作的背景与意义第9-10页
    1.2 研究历史与现状第10-16页
        1.2.1 深度学习的研究第10-11页
        1.2.2 深度强化学习的研究第11-15页
        1.2.3 基于深度强化学习的FPS游戏研究第15-16页
    1.3 本文的主要工作第16-17页
    1.4 本文的结构安排第17-18页
第二章 深度强化学习基础第18-33页
    2.1 强化学习概述第18-22页
    2.2 马尔可夫决策过程第22-25页
    2.3 基于值函数的算法第25-28页
        2.3.1 Q-Learning和 Sarsa算法第26-27页
        2.3.2 DQN算法第27-28页
    2.4 基于策略梯度的算法第28-32页
        2.4.1 REINFORCE算法第29-30页
        2.4.2 Actor-Critic算法第30-32页
    2.5 本章小结第32-33页
第三章 基于深度强化学习算法的FPS游戏第33-57页
    3.1 FPS游戏的特点第33-35页
    3.2 DRQN算法第35-38页
    3.3 算法的改进第38-50页
        3.3.1 智能体分解第38-49页
            3.3.1.1 动作空间分解第38-42页
            3.3.1.2 任务分解第42-47页
            3.3.1.3 奖励分解第47-49页
        3.3.2 多任务学习第49-50页
    3.4 ViZDoom平台介绍第50-52页
    3.5 基于ViZDoom平台的算法实现第52-56页
    3.6 本章小结第56-57页
第四章 实验结果与分析第57-73页
    4.1 实验设置第57-62页
        4.1.1 实验环境第57页
        4.1.2 评估指标第57-58页
        4.1.3 网络结构第58-59页
        4.1.4 超参数设置第59-62页
    4.2 实验结果分析第62-72页
        4.2.1 超参数对比第63-66页
        4.2.2 多任务学习第66-67页
        4.2.3 动作空间分解第67-68页
        4.2.4 任务分解第68-69页
        4.2.5 奖励分解第69-70页
        4.2.6 与其他方法对比第70-72页
    4.3 本章小结第72-73页
第五章 全文总结与展望第73-75页
    5.1 全文总结第73-74页
    5.2 后续工作展望第74-75页
致谢第75-76页
参考文献第76-81页
攻读硕士学位期间取得的成果第81页

本篇论文共81页,点击这进入下载页面
 
更多论文
基于深度强化学习的第一人称射击游
基于扫频光学相干层析技术的光学间
实体链接系统的研究与应用
基于深度学习的目标检测算法研究与
基于地面场景的长期目标跟踪算法研
基于LTCC技术的可重构滤波器研究
基于大功率毫米波测试系统的数据挖
无人机自组织网络中的高效智能接入
家庭有害气体检测系统设计和实现
基于全相位FFT高精度接收机算法原理
基于专用小型LTE基站的快速小区切换
基于网络业务模糊关联分析的运行态
基于异质网络的账号分类研究
基于网络嵌入的领英账号分类方法研
频控阵雷达信号检测算法研究
基于惯性传感器的行人自主定位关键
微波非互易性器件研究
X波段比幅式天线天馈网络设计
大动态脉冲数字AGC研究与设计
基于最大相关熵理论的分布式卡尔曼
陀螺读出电路误差补偿算法研究与设
随钻震电信号的采集及数据处理研究
基于ZYNQ的FC交换机软件设计
基于社交网络的事件属性与发展趋势
基于零样本学习的视频图像超分辨技
基于卷积神经网络的图像显著对象检
多用户联合波束成形与离散相位优化
麦克风阵列声源定位系统设计与实现
抗直升机旋翼遮挡卫星通信系统的FP
短波通信自适应处理技术研究
交叠兴趣社区中恶意软件的传播模型
基于机器学习的网络入侵检测技术研
基于深度学习的Web应用攻击检测
基于地球同步轨道照射源的双基地SA
基于空间调制的无线通信安全传输关
基于车载通信的城市路网实时路径规
基于神经网络的运动姿态智能识别技
可调谐铌酸锂波导高阶布拉格光栅研
纳米颗粒增强的光纤微流激光及其传
无序光纤结构中激光脉冲的产生及优
基于光纤随机激光器的牙齿样本成像
8mm纳米冷阴极行波管仿真研究
申威处理器页表结构Cache的优化研究
甚深亚微米级高性能TCAM设计与实现
螺旋天线小型化技术研究
绿色无线通信网络中的接入关系优化
基于视频信号微小变化的信号增强及
车载毫米波雷达天线系统优化设计
基于智慧城市的交通态势感知与可视
基于无人机的移动边缘计算资源分配
面向推荐系统的机器学习算法研究
资源高效的服务功能链部署算法研究
集成毫米波通信的5G车联网通信与计
基于深度学习的视觉里程计技术研究
 
深度强化学习论文 第一人称射击游戏论文 智能体分解论文 多任务学习论文
版权申明:目录由用户lll**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved