教育论文网

基于深度强化学习的双臂机器人物体抓取

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化技术及设备论文机器人技术论文机器人论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文
基于深度强化学习的双臂机器人物体抓取
论文目录
 
摘要第1-10页
ABSTRACT第10-12页
第1章 绪论第12-24页
  1.1 课题背景与研究意义第12-13页
  1.2 预备知识第13-14页
  1.3 强化学习研究现状第14-18页
    1.3.1 强化学习的数学表示第14-15页
    1.3.2 强化学习算法分类第15-16页
    1.3.3 完全信息博弈DRL研究进展第16-17页
    1.3.4 不完全信息博弈DRL研究进展第17-18页
  1.4 多智能体强化学习研究现状第18-20页
  1.5 双臂机器人控制策略研究现状第20-21页
  1.6 本文主要工作第21-22页
  1.7 全文内容安排与结构第22-24页
第2章 深度强化学习第24-42页
  2.1 深度强化学习与监督学习第24页
  2.2 深度强化学习数学模型第24-41页
    2.2.1 离线策略和在线策略第28页
    2.2.2 时间差分算法第28-30页
    2.2.3 深度Q网络算法第30-34页
    2.2.4 演员-评论家算法第34-37页
    2.2.5 策略梯度方法第37-41页
  2.3 本章小结第41-42页
第3章 双臂机器人协同算法第42-52页
  3.1 稀疏性奖励第42-48页
  3.2 多智能体协同第48-50页
  3.3 双智能体强化学习算法第50-51页
  3.4 本章小结第51-52页
第4章 仿真实验环境第52-66页
  4.1 Gym简介第52-54页
    4.1.1 Gym安装第52-53页
    4.1.2 Gym添加新环境第53-54页
  4.2 安装MuJoCo仿真器第54-55页
    4.2.1 编写MuJoCo仿真模型第54-55页
    4.2.2 添加MuJoCo新模型第55页
  4.3 机器人建模第55-64页
    4.3.1 实体机器人第55-57页
    4.3.2 创建新场景第57-60页
    4.3.3 接入DRL算法第60-62页
    4.3.4 仿真实验第62-64页
  4.4 本章小结第64-66页
第5章 实体机器人控制系统第66-78页
  5.1 机器人控制架构第67-69页
    5.1.1 ROS基础介绍第67-68页
    5.1.2 ROS远程调用第68-69页
  5.2 算法移植第69-76页
    5.2.1 实验一: Reach场景第69-71页
    5.2.2 定位抓取目标第71-74页
    5.2.3 实验二: Pick up场景第74-76页
  5.3 本章小结第76-78页
第6章 结论与展望第78-80页
  6.1 结论第78-79页
  6.2 展望第79-80页
参考文献第80-86页
致谢第86-88页
攻读学位期间发表的学术成果和参加的科研项目第88-90页
学位论文评阅及答辩情况表第90页

本篇论文共90页,点击这进入下载页面
 
更多论文
基于深度强化学习的双臂机器人物体
基于用户上下文轨迹预测的移动众包
中国在“一带一路”国家的OFDI效率
基于精益生产的HL电机生产流程改善
协商民主视角下城市社区居民需求回
民族企业的现代化探索——信丰企业
农地经营权流转的收益分配研究
论莫言与余华创作的苦难意识
明代儒家圣贤家族志研究
鲁迅与北新书局关系研究——兼谈鲁
《骆驼祥子》与中学语文教学
论孙毓棠的诗歌创作
青春的蜕变—张悦然小说创作研究
张载“生生”思想探微
邵雍易学视域下的天人之学
所得税优惠与政府补助对我国人工智
急性髓细胞白血病基因芯片数据的降
基于弱相互作用构筑的液晶传感平台
外商直接投资对城市化发展的影响—
近代中国洋粉进口与民族资本机制面
基于不同底物的体外合成生物学研究
无煤柱自成巷围岩变形机理与控制方
中韩合作电影的产品开发策略研究
基于条件变分自编码器的网络性能预
面向二维形状的骨架计算方法研究
潍柴动力排程到制造业务系统的设计
交通运营公司IT设备综合管理系统的
某轨道公司合同管理系统设计与实施
红塔集团卷烟产品数字化研发平台的
泰安市农村商业银行理财综合业务管
O2O凭证验真系统的设计与实现
基于Siebel escript语言的企业营销
基于广义M-J集与复Lorenz系统的加密
基于几何分解的网格生成方法研究
数字胚胎连续断面数据获取及三维重
A公司手机产品非洲市场营销策略研究
基于模型的柴油机排放虚拟标定平台
稀土掺杂上转换纳米材料的制备及其
数控加工工艺知识智能生成关键技术
钒铈共掺杂铌酸锂晶体中的极化子及
考虑新能源接入的输电网规划研究
风机叶片接闪过程的先导特性与极性
分布式电源接入后的配电网降损及规
面向被保护对象模型的交直流混联电
莱芜配电网故障停电指标优化及可靠
基于一二维水动力耦合模型的大站水
基于元胞自动机的城市洪涝数值模拟
烟台地区风电场风速仿真研究
中国协商民主渠道的特征和发展趋势
习近平新时代知识分子思想研究
中国自媒体中的智慧社区治理研究—
电动汽车用新型五相永磁同步电机的
面向税务的智能问答系统的设计与实
基于.net的供应链采购管理系统的设
非车险理赔系统报案模块设计与实现
战略性股权资本来源对上市公司成长
儿童颅内生殖细胞肿瘤的早期诊断指
考虑用户知识特征的在线知识服务平
糖尿病性视网膜病变患者黄斑区视网
 
深度强化学习论文 多智能体协作论文 双臂机器人论文
版权申明:目录由用户张**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved