【摘 要】
:
两轮机器人在环境中的行为学习存在自主探索效率低等问题,基于人脑中关于人类行为学习时的信息处理机制和相关神经结构之间的协调机制,建立了基于基底神经节的仿生行为学习模
论文部分内容阅读
两轮机器人在环境中的行为学习存在自主探索效率低等问题,基于人脑中关于人类行为学习时的信息处理机制和相关神经结构之间的协调机制,建立了基于基底神经节的仿生行为学习模型,并引入内在动机,研究其背后的神经结构与其协调机制,建立基于内在动机的基底神经节的仿生行为学习模型。基于人脑基底神经节的多巴胺持续调机制,引入价值衰减机制,提出了基于价值衰减机制的基底神经节仿生行为学习模型(VD-BG),机器人获得的评价值随时间进行衰减,以此来快速达到目标,改善机器人的学习效果。通过仿真实验证实了模型的有效性。针对机器人在未知环境中自主探索效率低等问题,研究内在动机背后的神经结构以及与基底神经节的相关协调机制(CIM-BLM),建立基于内在动机的基底神经节仿生行为学习模型,提高机器人的智能化程度。该模型在Actor-Critic模型的基础上将内在动机设置为其奖励值,使机器人可以自主选择合适的动作。仿真实验表明了该模型具有较高的自主学习能力。由于内在动机奖励函数在真实环境中不易获得,引入元学习概念,提出了基于元学习的内在动机仿生行为学习模型(MIM-BLM),更符合生物的可解释性,在Actor-Critic模型的基础上加入一个元价值网络来获得内在奖励,并且通过仿真实验达到了预期效果。课题提出的仿生行为学习模型,主要针对两轮机器人平衡控制行为的学习,通过模拟人脑中的信息处理机制,为提高智能体的自主探索和学习能力提供了新的思路与方法。图38幅;表4个;参51篇。
其他文献
"四气"是毛泽东、邓小平、江泽民、胡锦涛所多次强调并加以精辟阐述的朝气、锐气、正气、骨气。"四气"学说既包含着共产党人的全部"精、气、神"和中华民族精神的精髓,又抓住了我们
湖南省郴州市提出建立“湖南最开放城市、湘粤赣省际区域中心城市”的两城建设目标。政务、企业信息服务的巨大需求促使构建以物流信息服务中心、科技信息服务中心、政务信息
“一带一路”战略,不仅是一条经济大动脉,更是一条文化大通道,在世界经济复苏乏力之际,不仅带来了中国机遇,更为世界各国不同文明的融汇架起了友谊的桥梁。 从2014年3月到塔吉克斯坦考察,7月和塔吉克斯坦国家工业部签订协议,12月19号中泰新丝路塔吉克斯坦农业纺织产业园项目奠基,到2015年4月2号项目正式开工,9月30号两座扎花车正式投产,棉花试种超越了原苏联时期的棉花产量,再到2016年8月31
吉林省生产的粳稻在国内有较高的地位,其独特的自然生长条件,使得所产大米口感、品质均属上乘,又因其地理标志大米在国内影响力较大,故研究此地区的大米确证技术是十分必要的。二十一世纪,通过经济全球化和食品的迅速流通,作为地理标志大米,因为其所能带来的经济效益,所以在大米生产和包装及流通中,频现不同品种混卖、以假乱真等食品安全问题;假冒、掺假的松原大米也流通在市场中,这不仅对松原地理标志大米造成了不良的影
随着物联网和移动设备的不断发展,人们对更高的定位精确度提出了迫切的要求。室外能够提供高精度位置服务的全球定位系统(Global Positioning System,GPS),因卫星信号受到墙
共享经济时代,越来越多的消费者参与到通过资源共享创造价值,互助以及节能的新时代生活方式中来。以滴滴出行为代表的第三方出行平台以其平台化、规模化和对消费者的便利化吸引了大量的用户群体。新兴行业的蓬勃发展一方面极大地促进了我国经济的发展,但与此同时,由于缺乏必要的自我规范、政府监管,各种问题层出不穷,在一定程度上也降低了消费者对平台的感知评价。随着越来越多的负面报道出现在消费者的视野里,消费者对平台的