【摘 要】
:
计算机博弈作为人工智能领域的一个重要分支,得到了极其快速的发展。计算机博弈是一个有关对策和斗智问题的研究领域,属于人工智能中的问题求解与搜索技术。博弈的核心思想实
论文部分内容阅读
计算机博弈作为人工智能领域的一个重要分支,得到了极其快速的发展。计算机博弈是一个有关对策和斗智问题的研究领域,属于人工智能中的问题求解与搜索技术。博弈的核心思想实际上就是对博弈树节点的估值过程和对博弈树搜索过程的结合。估值是各种博弈问题中最难以处理的一个问题,局面估值的准确性在很大程度上决定了博弈程序的棋力高低。本文基于增强学习,研究了计算机博弈中的一些关键技术。针对静态估值函数依赖人类棋类知识水平和评估不够准确的问题,将TD(λ)算法与BP神经元网络相结合,即BP-TD(λ)算法。该算法使用BP神经元网络作为局面的估值函数,利用TD(λ)算法直接从原始经验中学习,自动调整估值函数的参数,将BP神经元网络的有监督学习转换为无监督学习,避免了神经网络在有监督学习下调整参数值容易受人类经验影响的缺陷。为了更好地提高博弈训练的性能,针对开局和中局,提出分阶段设置参数值的策略。设置开局阶段的参数值时,着法选择使用的是随机的着法选择策略;设置中局阶段的参数值时,着法选择使用的是极大极小的选择策略。采用以上的方法和策略,以五子棋为模型,实现了基于增强学习的五子棋博弈系统TDRenju,通过对估值部分的改进和增强,提高了棋力。
其他文献
随着互联网和信息化技术的不断发展,企业及其他各种组织积累了大量的数据,人们面临着从大量不同类型、不同来源的数据中获取有用知识的问题。数据挖掘技术融合了人工智能、数
半导体制造工艺的发展带来了晶体管单片集成度的增加,电路设计能力的提升推进了集成电路功能和复杂度的提高。这样,集成电路规模便与日俱增,测试数据量和测试难度也自然加大
随着计算机技术和网络技术的发展,存储技术已从本地存储发展到网络存储。目前,磁盘存储阵列(简称存储阵列)是网络存储器的主要形式之一,它从磁盘上存取数据的速度,往往成为用
随着多核处理器在计算领域的广泛使用,面向多核处理器的程序性能优化成为重要的研究问题。当今主流多核处理器都采用共享Cache结构,然而共享Cache所带来的Cache伪共享、Cache
任务调度问题是网格环境下完成大规模计算任务的关键环节,也是网格应用的必要基础。高效的网格任务调度策略及其算法,能够充分地利用网格系统的资源,提高网格应用的整体性能
随着计算机和互联网的越来越普及,在电子政务网和企业内部网中,许多文件都以电子文档进行分发和存储,PDF因其具有以下两个优点成为首选的电子文档格式:一、格式和操作平台无
游客在大型景点旅游时,在没有导游的情况下,景点的文化可能会得不到全面的解说,游客遇到的困难也可能无法得到有效的帮助。基于此,本课题根据手机已有的GPS技术功能,同时在现
本文针对在智能电网数据集成中出现的由于数据异构原因产生的“信息孤岛”问题,将XML和本体技术结合起来应用在电力系统中,采用基于B/S的三层体系结构,以中间件的方式来解决电力系统的异构数据集成,从而实现对各个分布式数据源的透明访问和集中管理。首先,通过运用电力系统实例分析了现有的基于关系数据库构建本体方法在概念提取方面的不足之处,并对其加以改进,然后通过数据验证了改进后方法的可行性和高效性,并在一定
随着Internet和信息技术的飞速发展,信息过载变得越来越严重,由此推荐系统应运而生。在推荐系统所采用的技术中,协同过滤是最为成功的技术。但是伴随着应用范围的扩大和应用
随着科学技术的发展和人们生活水平的提高,数字图像处理技术被应用到人们生产生活中的各个领域。这使得数字图像处理技术成为近年来科学家研究的热门领域,图像修复技术是数字