强化学习及其在协同虚拟环境导航知识中的应用研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户：CHENGXB

【摘要】

：

协同虚拟环境(CVE)是虚拟现实技术与网络技术相结合的产物,将分布在不同地理位置的独立的虚拟现实系统通过网络连接起来,使多个Agent在一个共享的三维环境中进行交互,协作完

【作者】

：

肖莉

【机构】

：

湖南师范大学

【出处】

：

湖南师范大学

【发表日期】

：

2009年期

【关键词】

：

协同虚拟环境协同导航强化学习 Q-学习算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

协同虚拟环境(CVE)是虚拟现实技术与网络技术相结合的产物,将分布在不同地理位置的独立的虚拟现实系统通过网络连接起来,使多个Agent在一个共享的三维环境中进行交互,协作完成任务。目前,CVE系统已经在科学可视化、协同设计、战争模拟等多个领域得到广泛的应用。在虚拟环境中,特别是大范围复杂的虚拟环境中智能体很容易迷路,对智能体来讲,能调整自己的方向实现导航的目标更是不容易。在人工智能领域,长期以来一个重要的目标是如何设计一个Agent使它能够在复杂环境中自主地完成任务,这与协同虚拟环境中智能体的自助导航控制问题极为相似。强化学习理论作为智能学习的一个重要分支,是从控制论、统计学、心理学和认知学等相关学科发展而来的,有着相当长的历史,在智能学习中得到广泛研究。论文对协同虚拟环境及其导航进行了深入研究和探讨,根据CVE协同导航所具有的自身特点,并在单用户导航模型的基础上,建立和完善了协同导航模型的框架。同时作者在分析了智能体导航控制的基础上,根据CVE协同导航模型与强化学习理论模型的相似性,将强化学习应用到协同虚拟环境中智能体导航控制上,并重点研究了基于Q-学习的导航知识获取算法。为了改善该算法在协同导航控制中的应用效果,本文提出一种基于最优路径的Q-学习算法,将虚拟环境中移动的智能体与目标之间的绝对距离量化成强化学习中的状态函数,并通过前后状态的比较,使得每次状态/动作对的选择都能达到靠近目标位置的目的,另外,将多个智能体的学习成果进行共享,加强各个智能体对环境信息的感知,使其能更快学习到正确决策,进行有效的寻路与导航控制,寻找一条到达目的地的最优路径。

其他文献

劳特累克广告画的艺术风格成因及特点

摘要图鲁兹·劳特累克是后印象派画家，也是19世纪末20世纪初广告画的代表人物。本文深入分析了劳特累克广告画作风格的成因，受到同一时期广告大师朱尔斯·谢雷特、后印象派画风、东方的浮世绘版画以及当时创作环境的影响，逐渐形成了自己独特的艺术风格；进而具体探讨了广告画呈现的艺术特点，造型上滑稽幽默，手法上装饰平涂，色彩上诡异神秘，情感上愤世嫉俗，形式上躁动不安的艺术风格，表现出这位广告画家内心震撼的心灵

期刊

劳特累克艺术风格风格成因艺术特点印象派画家后印象派情感寄托浮世绘人物形象塑造美学意义

3-5岁儿童关系类概念学习的研究

关系类概念是一种类属成员由特殊关系决定的类概念，早期关于类概念的研究主要是集中于儿童如何学习和形成物体类概念的研究。但实际上，关系类概念在生活中占很大比例，在抽象思维

学位

关系类概念概念学习类属成员学习策略语言名称

宽恕的先验心理维度

宽恕是现代人重要的心理品质之一,对宽恕心理发生机制的深入研究有利于人际关系和社会关系的和谐。本文从先验心理的视角探讨宽恕的先验维度,力求深化对宽恕心理及其维度的认

学位

宽恕先验心理先验心理维度

控制环境污染要从源头抓起

该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥

期刊

控制环境污染环保型新工艺原材料印制线路板化学品生产二口恶英产品与环境相协调农药法规食物链传递控制污染源化学稳定性材料和工艺安全间

新课程标准下的竞技运动素材转化的理论研究

2001年9月,我国《体育(与健康)课程标准(实验稿)》(以下简称《新课程标准》)开始在全国试行。《新课程标准》确定了“健康第一”的指导思想,为我们开展好学校体育教育指明了

学位

新课程标准竞技运动素材转化

诈骗犯的主动欺骗行为及其心理机制

学位

强化学习及其在协同虚拟环境导航知识中的应用研究

其他学术论文