一种基于优势更新的机器人平衡控制算法

来源 :山东科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:songzs1203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对自平衡机器人运动平衡控制问题,提出了一种基于优势更新的强化学习机制作为机器人的自平衡仿生学习算法。该算法利用优势更新中的基线,结合强化学习中的概率好奇心机制,以一定的概率选择优等行为,剔除劣等行为,从而使机器人在未知环境下可获得像生物一样的自主学习技能,实现机器人的仿生自平衡运动控制。最后,应用该算法对机器人进行自平衡的仿真实验。结果表明,这种基于优势更新的强化学习算法能使机器人获得较强的平衡控制技能,取得了较好的动态性能,体现了机器人的仿生特性。
其他文献
本文介绍了超声波液体密度测量仪的工作原理和特性,并对其进行了设计和制作。超声波液体密度测量仪主要包括水下探头和水上数据处理单元。水下探头分为水声换能器的制作,探头
目的:系统整理历代中医药文献中有关黄褐斑病因、病机、诊断、治则、方药等记载,通过古今对比分析,并结合当代社会环境下女性生理病理特点,证实滋阴活血治法是治疗黄褐斑重要
世界上的政治家、军事家普遍认为,小股土匪可以在山区农村长期生存,而大规模的正规军队却难以长久地在山区农村存在和发展,主要原因是无法解决供给问题。俄国的布哈林就曾说
项目融资是20世纪70年代以后国际金融市场上推出的一种新型筹资方式,近年来已经发展成为大型工程项目建设筹集资金的一种卓有成效的手段,在国际上得到了非常广泛的运用。我国
汽车内流场的研究是汽车空气动力学的一个相对较新的领域。随着社会的发展,人们生活水平的提高,人们对汽车室内舒适性的要求也越来越高。由于汽车室内空间狭小,结构复杂,长时
目前企业在对员工管理方面,仍存在着诸多与市场经济不相适应的地方。文章通过对员工管理现状的分析,阐述了员工管理的发展趋势以及几种有效的管理模式。
近年来,伴随MEMS微制造领域向柔性化、定制化、集成化、智能化发展的潮流,基于“自由堆积/去除”原理的直写技术迅速崛起,成为备受关注和研究的新型微制造技术。面对机遇,开发具有
先天性马蹄内翻足(congenital talipes equinovarus,CTEV)是最常见的儿童足部畸形之一,发病率为1‰~4‰。畸形包括高弓足、前足内收、跟骨内翻和踝关节跖屈。CTEV在未经治疗的
近几年花生地下害虫发生较重,常常造成花生严重减产。呋虫胺SG是由日本三井公司生产的杀虫剂,通过我们试验,使用不同剂量拌花生对花生出苗没有不良影响,与其它本地常用药剂相
19世纪末至20世纪初,欧洲经历了封建秩序崩溃、资本主义生产关系矛盾激化的社会动荡。涌现了形形色色的哲学思潮。值得一提的是在文艺、戏剧和音乐界掀起了一股真实主义思潮