载入中...
基于模仿学习的策略学习方法研究
硕士博士毕业论文站内搜索
全站论文库
硕士博士论文库
普通期刊论文库
分类:
教育论文网
→工业技术论文→
自动化技术、计算机技术论文
→
自动化基础理论论文
→
人工智能理论论文
→
自动推理、机器学习论文
基于模仿学习的策略学习方法研究
论文目录
摘要
第1-5页
ABSTRACT
第5-7页
第一章 绪论
第7-20页
1.1 引言
第7-8页
1.2 强化学习
第8-11页
1.3 模仿学习
第11-18页
1.4 待研究问题
第18-19页
1.5 本文工作和组织结构
第19-20页
第二章 "AngryBird"游戏与单步示例策略学习
第20-26页
2.1 引言
第20页
2.2 相关工作
第20-21页
2.3 本文方法
第21-24页
2.4 实验
第24-25页
2.5 总结
第25-26页
第三章 "Ms.PacMan"游戏与多步示例策略学习
第26-39页
3.1 引言
第26-27页
3.2 相关工作
第27-28页
3.3 本文方法
第28-31页
3.4 实验
第31-38页
3.5 总结
第38-39页
第四章 基于自生成样本学习的奖赏塑形方法
第39-51页
4.1 引言
第39-40页
4.2 相关工作
第40-41页
4.3 本文方法
第41-46页
4.4 实验
第46-50页
4.5 总结
第50-51页
第五章 结束语
第51-53页
参考文献
第53-64页
致谢
第64-65页
附录
第65-66页
本篇论文共
66
页,
点击这进入下载页面
。
更多论文
基于模仿学习的策略学习方法研究
基于模糊集和决策粗糙集的数据挖掘
云计算环境中科学工作流时间/成本调
基于多示例多标记学习的手机游戏道
基于专家系统的智能操作票系统的研
基于开放式数控系统的软PLC的研究
基于Pareto人工鱼群算法的多目标斗
基于SERCOS接口的开放式数控系统的
线性时滞多智能体系统的最优控制研
扩展过道布置问题的建模与改进分散
单片机控制PMIG逆变焊机的研制
Signal on/off型电—电致化学发光农
超细晶粒钢焊接HAZ奥氏体晶粒长大的
一种面向结构健康监测的无线传感器
用于电力开关柜测温的声表面波无线
厚板焊接残余应力试验测量与计算
具有车载备援节点的无线传感网气体
含稀土铝合金表面氧化膜结构与性能
CAN总线结合ZigBee的空气钻井燃爆模
双层辉光离子渗含钛表面冶金高速钢
基于Renyi信息增量的异质多传感器协
分子键裂型生物传感器检测系统研究
ULSI铜互连线微观结构和应力研究
高速列车表面脉动压力测试传感器设
新型室温磁致冷材料
半导体金属氧化物传感器的制备与性
稀土钼/钨热电子发射材料显微结构及
移动传感器网络中Sybil攻击检测研究
面向任务的教育仿人机器人控制系统
大蒜提取物抗氧化作用研究
空间机器人路径规划与轨迹跟踪控制
红外热反射涂料的研究
机器学习论文
强化学习论文
模仿学习论文
策略梯度论文
版权申明
:目录由用户
涵涵**
提供,
www.51papers.com
仅收录目录,作者需要删除这篇论文目录
请点击这里
。
|
设为首页
||
加入收藏
||
站内搜索引擎
||
站点地图
||
在线购卡
|
版权所有
教育论文网
Copyright(C) All Rights Reserved