【摘 要】
:
随着人工智能(Artificial Intelligence,AI)相关学科的不断发展,AI逐渐在游戏领域展现出极大的潜力。游戏AI可分为两类:一类以击败人类顶尖高手为目标,会消耗大量算力;另一类以成为普通人玩伴为目标,注重在保证一定游戏水准的同时降低算力消耗,其中典型代表为斗地主AI。为在维持斗地主AI游戏胜率的同时,有效降低其算力开销,研究了游戏胜率与剩余手牌的关系,发现剩余手牌数目较少时,出
论文部分内容阅读
随着人工智能(Artificial Intelligence,AI)相关学科的不断发展,AI逐渐在游戏领域展现出极大的潜力。游戏AI可分为两类:一类以击败人类顶尖高手为目标,会消耗大量算力;另一类以成为普通人玩伴为目标,注重在保证一定游戏水准的同时降低算力消耗,其中典型代表为斗地主AI。为在维持斗地主AI游戏胜率的同时,有效降低其算力开销,研究了游戏胜率与剩余手牌的关系,发现剩余手牌数目较少时,出牌策略对胜率的影响越强的规律,并以之为基础,提出一种新型的分段建模处理方式。具体而言,将斗地主游戏按游戏进程的不同分为两个阶段,正常游戏阶段和残局阶段。划分标准为:当有一名玩家的手牌不大于两张时,游戏由正常游戏阶段转入残局游戏阶段。正常游戏阶段时,系统仅使用经卷积神经网络(Convolutional Neural Network,CNN)训练的模型出牌,充分利用了CNN在空间特征提取方面的优势,并有效降低了算力消耗。残局阶段时,系统首先使用经CNN训练的猜牌模型计算该玩家剩余手牌,随后根据出牌信息反推另一位玩家手牌,最后以三方手牌信息构造博弈树并使用Alpha-Beta剪枝算法遍历搜索出最优解,在控制算力消耗的同时,有效提升了游戏胜率。对此斗地主游戏AI系统进行了训练和测试,从出牌模型准确率,猜牌模型准确率,胜率,开销等方面对系统进行了评估。在实验条件下,当AI扮演地主角色时,胜率为67%,扮演农民角色时,胜率为51%,平均每步计算时间17.31ms。证明了该系统整体拥有一定的胜率,同时有较优异的性能,达到了商业应用可接受的水平。
其他文献
随着交通基础设施的完善和经济的发展,车辆数量和司机数量猛增,公共交通安全问题频发。传统的智能交通监控系统因需要大量的人力且操作较为困难而难以实施全面覆盖。因此,运用人工智能来实现新一代的智能交通监控系统是非常有必要的。基于注意力模型的视觉模拟算法(简称视觉注意力算法)可以将交通视频中较为重要的区域标记出来以便观看,且能根据具体使用需求建立训练集来人为确定重要区域是哪一方面(如人或车)。同时可以作为
隧道掘进爆破中运用最为广泛的是楔形掏槽结构,但在目前的隧道工程爆破中,楔形掏槽参数的选择多采用经验及工程类比,往往难以达到好的掏槽效果,降低了隧道掘进爆破效率。本文以鸿图嶂隧道工程Ⅲ级围岩段为背景。统计分析了现场爆破振动测试数据,利用萨道夫斯基非线性回归公式描述了隧道开挖爆破时的振动强度衰减规律,发现掏槽眼爆破时围岩产生的振动最大。说明控制掏槽眼爆破产生的振动强度是降低掘进爆破震害的关键,且辅助眼
为了满足对建筑主体结构的通风、采光及使用空间的多种要求,越来越多的大型商场以及综合楼等在建筑主体结构楼板中间进行了开洞。地震作用时,由于楼板局部开洞,平面内刚度降低,楼板传递水平力的途径也发生改变,因此要探究楼板开洞后的抗震性能及优化措施。本文在某实际框架结构的基础上,建立了楼板开洞与不开洞分别在三种楼板刚度假定下的模型,并利用ETABS中振型分解反应谱法分析,研究楼板开洞对结构抗震性能的影响。建
随着石化行业的发展,石化工程建设项目不断增多,难度也不断增大,一旦发生事故,会对作业人员生命安全和财产造成重大影响。因此,要保障石化施工作业过程中的安全,就要保证施工作业许可管理的有效实施。本文针对石化施工过程的作业许可管理,开展了以下研究:根据国内现行的石化施工作业许可管理制度,结合实地调研,总结了目前石化施工作业许可管理在实际实施过程中的问题,并以此为突破点,从全新的管理理论角度将石化施工作业
摘要目的:基于目前的证据系统评价中药复方对肾虚证不孕症患者临床疗效的影响。方法:检索中国知识资源总库(CNKI)、中文科技期刊数据库(维普)、中国学术期刊数据库(万方)、PubMed、EMBASE、Ovid,纳入的RCT研究,实验组是中药复方或中药复方联合西药,对照组为西药治疗,由2名评价员按Cochrane 手册标准独立对文献资料进行提取、质量评价,采用Rev Man5.3软件进行数据合成和Me
背景 现阶段,心血管疾病仍是我国居民死亡的主要病因,每年约有1万人死于院外心脏骤停而院外心脏骤停患者生存率<5%。早期除颤为改善院外心脏骤停患者预后及降低病死率等方面提供了新方法和新途径,但现有研究结论尚存争议,且国内尚无相关系统评价。目的 采用Meta分析法,探讨现场第一反应者使用自动体外除颤器(AED)对院外心脏骤停患者存活率的影响。方法 计算机检索PubMed、The Cochrane Li
随着社会的快速发展与进步,我国的钢铁行业正在面临新的机遇与挑战,如何节约资源,降低生产成本,提高产品综合竞争力成为企业关注的热点。因此,开发一种低成本、综合力学性能优良的微合金化高强钢势在必行。本文以三种不同V含量的Nb-V-Ti复合微合金化高强钢为研究对象,通过控制V含量的添加,研究了 V元素对Nb-V-Ti复合微合金化高强钢的组织演变规律的影响,主要研究内容及实验结果如下:(1)通过连续冷却转
微服务架构作为一种对单体应用架构的升级,在性能和开发模式等各方面都有较好的表现,在各种互联网产品中都得到了广泛的应用,成为近年来最主流的软件架构。但是传统的微服务架构中框架与业务仍是紧耦合的关系,使得框架自身演进困难,另外还由于传统的微服务框架难以支持多语言的并行开发等原因,使得开发人员将眼光转向新的软件架构。基于服务网格架构思想,设计并实现了一个具备服务注册与发现、自动化配置、RPC调用、流量控
作为无人飞行器任务规划系统的核心之一,航迹筛选的主要功能是对已有的航迹集合进行进一步的筛选,从而留下用户可能感兴趣的航迹,降低决策者在进行最终决策时的选择范围。在传统航迹筛选方法中,决策者往往是通过人为地为每个筛选指标设定相应的权系数或者相对重要性描述,将航迹筛选问题转化为单目标优化问题进行求解,虽然在一定程度上使得复杂的航迹筛选问题得到了简化,但同时也造成了航迹质量的优劣严重依赖于各筛选指标之间
本文基于声子晶体的谷霍尔相变原理,设计了一种声学拓扑结构,利用具有两种不同谷霍尔相的声子晶体的边界传输效应,提出了新的声源定位的方法。(1)首先验证了当声子晶体的散射体至少具有二重旋转对称性时,通过调节散射体的旋转自由度,可以调节声子晶体带隙特性,尤其是禁带频率的位置和宽带。声子晶体的本征手性和声涡中心随着旋转自由度的变化发生反转,即发生谷霍尔相变,能带交叉形成稳定的狄拉克锥。在具有两种不同谷霍尔