教育论文网

基于虚拟遗憾最小化算法的德州扑克机器博弈研究

硕士博士毕业论文站内搜索    
分类:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文
基于虚拟遗憾最小化算法的德州扑克机器博弈研究
论文目录
 
摘要第1-5页
ABSTRACT第5-9页
第1章 绪论第9-17页
  1.1 课题背景及意义第9-11页
    1.1.1 课题研究背景第9-10页
    1.1.2 研究的目的和意义第10-11页
  1.2 国内外相关技术研究现状第11-15页
    1.2.1 机器博弈大事记第11-12页
    1.2.2 国外研究现状第12-14页
    1.2.3 国内研究现状第14-15页
  1.3 主要研究内容和组织结构第15-17页
    1.3.1 主要研究内容第15-16页
    1.3.2 论文的组织结构第16-17页
第2章 机器博弈基本理论第17-25页
  2.1 正则博弈和扩展式博弈第17-18页
  2.2 信息集第18-19页
  2.3 纳什均衡和劣策略第19-20页
  2.4 Kuhn扑克第20-22页
    2.4.1 Kuhn扑克游戏规则第20-21页
    2.4.2 3-Kuhn扑克游戏状态空间复杂度分析第21-22页
  2.5 德州扑克第22-24页
    2.5.1 德州扑克游戏规则第22页
    2.5.2 德州扑克博弈特性第22-23页
    2.5.3 德州扑克状态空间复杂度分析第23-24页
  2.6 本章小结第24-25页
第3章 虚拟遗憾最小化算法研究第25-42页
  3.1 遗憾最小化算法第25-27页
    3.1.1 遗憾最小化(Regret Minimization)第25-26页
    3.1.2 遗憾匹配(Regret Matching)第26-27页
  3.2 虚拟遗憾最小化算法(CFR)第27-30页
  3.3 蒙特卡罗虚拟遗憾最小化算法(MCCFR)第30-34页
    3.3.1 基于随机抽样的蒙特卡罗虚拟遗憾最小化算法第31-32页
    3.3.2 基于外部抽样的蒙特卡罗虚拟遗憾最小化算法第32-34页
  3.4 纯虚拟遗憾最小化算法(Pure CFR)第34-35页
  3.5 一种改进的虚拟遗憾最小化算法(CFR+)第35-36页
  3.6 虚拟遗憾最小化算法的德州扑克决策模型第36-41页
    3.6.1 德州扑克状态空间抽象第36-38页
    3.6.2 离线学习对手策略的虚拟遗憾最小化算法第38-39页
    3.6.3 在线自适应对手策略的虚拟遗憾最小化算法第39-41页
  3.7 本章小结第41-42页
第4章 实验与结果分析第42-53页
  4.1 实验系统结构第42-47页
    4.1.1 德州扑克机器博弈系统实现的七个阶段第42-45页
    4.1.2 德州扑克机器博弈系统框架第45-47页
  4.2 实验数据的搜集与整理第47-48页
  4.3 实验结果分析第48-52页
    4.3.1 算法性能分析第48-51页
    4.3.2 改进的CFR算法在3人Kuhn扑克游戏中的应用第51页
    4.3.3 改进的CFR算法在德州扑克游戏中的应用第51-52页
  4.4 本章小结第52-53页
结论第53-55页
参考文献第55-60页
附录第60-65页
附录A 德州扑克游戏第60-62页
  A.1 牌型分类第60-61页
  A.2 德州扑克不同玩法第61-62页
附录B 计算机德州扑克大赛第62-65页
致谢第65页

本篇论文共65页,点击这进入下载页面
 
更多论文
基于虚拟遗憾最小化算法的德州扑克
基于空间搜索的遗传算法研究
基于近邻传播的多目标进化算法及其
利用RBF神经网络研究新信息对个股价
一种新型GRNN神经网络的制冷压缩机
回响状态网络及概念机网络的储备池
求解分布式约束优化问题的搜索算法
面向不平衡数据集分类的层次引力模
基于加速度传感器的人体摔倒检测系
基于SEMG辅助的MIMU个人定位技术研
基于智能算法的复杂网络社区挖掘研
基于推理的分布式约束优化完备算法
基于FPGA的大规模脉冲深度神经网络
基于蚁群优化的云计算资源调度
基于故障树的准分子激光角膜屈光治
大规模多层感知器神经网络的研究与
基于粒子群算法的线性规划问题的研
基于雷达和红外传感器数据融合技术
多传感器信息融合算法研究及其应用
基于多传感器信息融合的管道安全运
多源多模态感知数据的变频采样及融
基于神经网络的可穿戴无线传感网络
基于无线传感器网络的家居安防系统
磁控溅射薄膜压力传感器的研制
新型位置传感器解码系统的研究与设
用于损伤检测的新型低声阻抗传感器
水平管道中的浓相气固两相流流动参
红外气体传感器测试及校准软件的设
人体基础运动条件下的动态手势识别
WSNs中拓扑控制算法的设计与实现
基于TOSThreads的数据采集系统的设
新型适配体传感器的构建及应用于结
抵御恶意攻击的无线传感网络安全定
基于Zigbee的无线传感网络能耗控制
复杂环境下无线传感网络覆盖控制策
核酸适配体结合传感阵列用于结构相
不同基底厚膜电阻应变传感器的制备
CMOS成像器件的噪声模型及噪声抑制
基于降解细菌的电位型微生物传感器
一种基于电容边缘效应的玻璃表面水
基于微纳光纤光学微腔传感器的设计
新型气固两相流电容式传感器研究
基于FBG的液位和温度同时测量方法
无线传感器网络移动节点覆盖控制研
基于压电敏感材料的加速度传感器设
基于传感器网络的室内人员定位算法
气泡结构法布里—珀罗光纤压力传感
基于背景更新的无线传感器网络入侵
基于无线传感器网络的温室监控系统
基于相干光时域反射计的温度传感技
基于手机内置传感器的室内目标运动
基于STM32的健康监护系统的设计
基于无线传感网的大气雾霾监测系统
无线传感器网络路由算法的研究
MQ-3酒精气体传感器性能退化试验研
座椅接触面压力场分布与坐姿识别的
WSN入侵检测中实值否定选择算法和抗
FLRDS-FBG应变传感器研究
三维ECT电容传感器研究与设计
基于无线传感网络冻融循环下路基环
 
CFR算法论文 德州扑克论文 非完备信息机器博弈论文
版权申明:目录由用户025863253**提供,www.51papers.com仅收录目录,作者需要删除这篇论文目录请点击这里
| 设为首页||加入收藏||站内搜索引擎||站点地图||在线购卡|
版权所有 教育论文网 Copyright(C) All Rights Reserved