教育论文网

面向人机交互的强化学习与意图推理

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文
面向人机交互的强化学习与意图推理
论文目录
 
摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-19页
  · 课题背景及研究意义第10-11页
  · 人机交互技术发展及应用第11-14页
  · 强化学习第14-15页
    · 强化学习简述第14页
    · 存在的问题及解决途径第14-15页
  · 意图推理第15-16页
    · 意图推理概述第15-16页
    · 研究现状总结第16页
  · 意图推理与强化学习的融合第16-17页
  · 本文主要内容和章节安排第17-19页
第二章 强化学习理论及算法第19-28页
  · 引言第19页
  · 强化学习模型与主要组成要素第19-22页
    · 强化学习基本模型第19-20页
    · 强化学习主要组成元素第20-22页
  · 马尔可夫决策模型(MDP)第22-23页
  · 强化学习基本算法第23-26页
    · 瞬时差分算法(TD)第24-25页
    · Q学习算法(Q-learning)第25-26页
  · 人机交互应用中的关键问题第26-27页
    · 泛化问题第26-27页
    · 收敛速度第27页
    · 强化函数与算法结构设计第27页
  · 本章小结第27-28页
第三章 基于强化学习和意图推理的目标跟踪第28-46页
  · 引言第28-30页
  · 系统控制框架与基础理论第30-35页
    · 系统控制框架概述第30页
    · 粒子滤波第30-33页
    · 灰色预测第33-35页
  · 加入意图推理的强化学习算法第35-37页
  · 系统实现与实验第37-45页
    · 实验平台第37-39页
    · 状态环境的划分第39页
    · 机器人动作行为的定义第39-40页
    · 奖惩回报函数的设定第40页
    · 实验结果与分析第40-45页
  · 本章小结第45-46页
第四章 基于意图推理的交互式强化学习第46-68页
  · 引言第46-47页
  · 基本交互式强化学习算法第47-50页
    · 交互式强化学习算法第47-48页
    · 探索与利用第48-50页
  · 基于贪婪指导的交互式强化学习算法第50-54页
  · 基于意图推理的交互式强化学习算法第54-59页
    · 奖惩意图的建模与推理第55-57页
    · 指导意图的建模与推理第57-58页
    · 算法设计第58-59页
  · 实验设计与结果分析第59-66页
    · 实验任务设计第60-62页
    · 对比实验设计第62页
    · 实验结果与分析第62-66页
  · 本章小结第66-68页
第五章 总结与展望第68-70页
  · 论文工作总结第68-69页
  · 研究展望第69-70页
参考文献第70-77页
致谢第77-78页
攻读硕士学位期间已发表或录用的论文第78-80页

本篇论文共80页,点击这进入下载页面
 
更多论文
面向人机交互的强化学习与意图推理
工业以太网交换机环网冗余技术及其
时变系统的去伪自适应控制算法研究
未标定环境下基于视觉的移动机器人
基于核可预测元分析算法的故障检测
基于模糊自适应的室内热舒适度建模
基于增量式核非负矩阵分解算法的数
基于可预测偏最小二乘算法的复杂工
四足机器人穿越台阶静态稳定步态规
复杂干扰环境下被动传感器目标跟踪
基于博弈论的群智感知计算中的参与
基于众包模式的城市级路面危害坑洞
基于NFC技术的温度传感器的设计和开
全光信号处理辅助的高空间分辨率OF
啤酒行业物流监控系统的应用研究
发动机售后配件市场需求预测研究
U公司品质规划与流程改进
HS项目质量信息管理系统设计
S公司新产品开发项目进度与风险管理
XT公司备件服务配送中心选址问题研
平衡机新产品开发阶段的项目质量策
飞机总装制造项目组织风险管理研究
装备制造型企业SF工厂的项目管理流
知识工程在船用柴油机开发风险管理
民用飞机项目设计质量管理研究
流程优化技术在煤机企业客户满意度
标准化作业在WF公司高压共轨轨体生
大规模定制企业多项目冲突预防管理
电力设备投标报价风险分析及决策研
呼叫中心外包服务的质量管理研究—
构建新型营业厅营销服务融合—切换
基于六西格玛方法的H产品成品率研究
基于供应链交付指标优化的干系人及
地方电子口岸项目需求管理和风险分
展示广告中点击率预估问题研究
银行现金清分中心服务外包项目的可
不稳定行波解的松弛算法研究
一类推广的无压Euler-Poisson方程组
微波本振的光纤稳相传输技术研究
从主位推进模式看英汉语篇翻译——
基于实时监控的IP网和光网络任务协
优化虚拟机放置均衡数据中心网络核
基于优化LQG基准的预测控制系统经济
从社区社会组织发展看社区治理创新
自回归过程统计过程控制与工程过程
CIR模型的模拟及参数估计分析研究
相似可分离函数的非参数匹配与有效
给定直径的树Wiener指数研究
关于时间离散化二维等熵欧拉方程组
界约束非线性最小二乘问题的无导数
具有齐次势能的三个自由度的哈密顿
基于随机游走的动态社团划分算法
幂律分布型随机序列和分布的求解方
船海结构物疲劳热点裂纹应力强度因
锶铁氧体/海藻酸复合水凝胶的制备与
基于混沌时间序列的短期负荷预测研
光时域反射的事件分析算法研究
沙门氏菌耐药质粒的筛查与特征分析
上海市食品中单核细胞增生李斯特菌
致病性副溶血弧菌TDH表达调控因子筛
基于CRISPR序列的沙门氏菌分子分型
灰色链霉菌JSD-1发酵工艺及代谢产物
基于单分子蛋白质测序芯片的研究
微电极阵列检测离体细胞电生理信号
 
人机交互论文 强化学习论文 意图推理论文 灰色预测论文 奖惩信息论文 指导信息论文 仿人机器人论文
版权申明:目录由用户林**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved