教育论文网

基于模仿学习的策略学习方法研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文自动推理、机器学习论文
基于模仿学习的策略学习方法研究
论文目录
 
摘要第1-5页
ABSTRACT第5-7页
第一章 绪论第7-20页
  1.1 引言第7-8页
  1.2 强化学习第8-11页
  1.3 模仿学习第11-18页
  1.4 待研究问题第18-19页
  1.5 本文工作和组织结构第19-20页
第二章 "AngryBird"游戏与单步示例策略学习第20-26页
  2.1 引言第20页
  2.2 相关工作第20-21页
  2.3 本文方法第21-24页
  2.4 实验第24-25页
  2.5 总结第25-26页
第三章 "Ms.PacMan"游戏与多步示例策略学习第26-39页
  3.1 引言第26-27页
  3.2 相关工作第27-28页
  3.3 本文方法第28-31页
  3.4 实验第31-38页
  3.5 总结第38-39页
第四章 基于自生成样本学习的奖赏塑形方法第39-51页
  4.1 引言第39-40页
  4.2 相关工作第40-41页
  4.3 本文方法第41-46页
  4.4 实验第46-50页
  4.5 总结第50-51页
第五章 结束语第51-53页
参考文献第53-64页
致谢第64-65页
附录第65-66页

本篇论文共66页,点击这进入下载页面
 
更多论文
基于模仿学习的策略学习方法研究
基于模糊集和决策粗糙集的数据挖掘
云计算环境中科学工作流时间/成本调
基于多示例多标记学习的手机游戏道
基于专家系统的智能操作票系统的研
基于开放式数控系统的软PLC的研究
基于Pareto人工鱼群算法的多目标斗
基于SERCOS接口的开放式数控系统的
线性时滞多智能体系统的最优控制研
扩展过道布置问题的建模与改进分散
单片机控制PMIG逆变焊机的研制
Signal on/off型电—电致化学发光农
超细晶粒钢焊接HAZ奥氏体晶粒长大的
一种面向结构健康监测的无线传感器
用于电力开关柜测温的声表面波无线
厚板焊接残余应力试验测量与计算
具有车载备援节点的无线传感网气体
含稀土铝合金表面氧化膜结构与性能
CAN总线结合ZigBee的空气钻井燃爆模
双层辉光离子渗含钛表面冶金高速钢
基于Renyi信息增量的异质多传感器协
分子键裂型生物传感器检测系统研究
ULSI铜互连线微观结构和应力研究
高速列车表面脉动压力测试传感器设
新型室温磁致冷材料
半导体金属氧化物传感器的制备与性
稀土钼/钨热电子发射材料显微结构及
移动传感器网络中Sybil攻击检测研究
面向任务的教育仿人机器人控制系统
大蒜提取物抗氧化作用研究
空间机器人路径规划与轨迹跟踪控制
红外热反射涂料的研究
 
机器学习论文 强化学习论文 模仿学习论文 策略梯度论文
版权申明:目录由用户涵涵**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved