基于深度强化学习的大型空间薄膜结构非线性振动控制方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:presk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大尺寸的薄膜结构因质量轻、成本低、面积大、折叠体积小、展开可靠性高等优点,在航天领域的应用愈来愈广泛。但是大型薄膜很容易因为空间环境中的振动与冲击、空间飞行器变轨时带来的惯性力等因素产生难以消减的振动,影响薄膜自身及航天器的正常工作,因此关于薄膜的振动控制方面引起了广泛关注与研究。本课题从薄膜边界振动控制的研究入手,基于ABAQUS软件建立了大尺寸薄膜自由振动的有限元模型。以耗散薄膜振动能量为目的,通过观察边界点的振幅情况选择边界横向作动方式来对薄膜进行振动控制。对薄膜模型使用子程序接口VUAMP进行速度负反馈方式的控制仿真,选择出了既能抑振,又能防止振动传入的作动点,验证该种作动方式的有效性,后续优化了作动点的布局。仿真结果表明该种作动方式能够高效抑制薄膜振动。本课题将控制薄膜振动转化为强化学习问题,使用python语言结合Tensorflow框架构建了深度强化学习智能体。该智能体能通过训练、学习与探索逐渐掌握控制薄膜振动的策略。为了验证强化学习控制方法的有效性,需要建立地面模拟试验系统,本课题对该试验系统进行了系统框架、程序与通信的设计,使该系统能够实现高度自动化的实验,使强化学习智能体经过自主学习、训练后成为薄膜振动抑制专家。最后,为了验证强化学习控制方法的有效性,使用假设模态法建立了薄膜的有限元模型,在该模型的多阶振型上分别进行基于强化学习控制方法的仿真,该方法在智能体训练完成后都实现了高效的控制效果,同时改变多种类型的条件,强化学习方法均有不错的表现。将强化学习方法与速度负反馈方法在同条件下进行对比,仿真结果表明强化学习在振动控制的各个阶段都表现得更为高效,由此展现出强化学习方法的优势。
其他文献
在吉林省中部地区的梨树县,依据玉米病虫害对气候变化的敏感性,通过田间试验进行了不同熟期玉米病虫害发生种类、程度以及对玉米产量的影响。为了明确气候变化条件下,吉林省
为维护社会稳定,保证人民安全,打击恐怖分子,遏制暴乱行动,提高部队的军事实力成为重中之重。部队军事实力不仅体现在武器的先进程度,还反映在部队的单兵作战能力及团队合作
在当前经济全球化的形势下,我国企业之间的竞争环境发生了巨大的变化,我国企业的经营管理者逐渐认识到营运资金管理的重要性。营运资金是企业的血液,能否正常循环流通决定了
春秋战国时期是中国文化第一次繁荣期,同时也是中国文化消费最早的全面发展期。文化消费第一次进入当时社会生活的各个层面,诸如文化典籍消费、文化教育消费、礼乐文化消费。
随着航空技术的发展,系统设计的重点从飞机机体的设计逐渐转变为机载电子设计上,而对飞机航电系统的进行改进,能够以较小的代价改善系统的功能。面对日益复杂的周边环境,迫切
经典小说《简爱》塑造了简爱和罗彻斯特两个经典人物。简爱聪慧而谦卑、刚烈而仁慈,娴静而热情;罗彻斯特外表骄傲蛮横,内心友善慈悲。简爱和罗彻斯特的婚姻虽波折重重,遗憾多
为开发深度处理技术使石化废水处理厂生物工艺后的废水(石化废水生化出水)达标(GB 31571-2015)排放,本论文探究了曝气生物滤池(BAF)工艺和以臭氧为核心的氧化技术、以及其组合工艺
记者从市经信委获悉,浙江省最近公布了第二批“三名”(知名企业、知名品牌、知名企业家)培育试点企业名单,绍兴有4家龙头企业上榜,分别是菲达环保、新和成、黄酒集团及宝业集团。
报纸
我国是世界上自然灾害最严重的国家之一。长期以来,我国政府一直重视通过工程性的防灾减损措施,抵御自然灾害。对灾害发生后的救援,则基本上是靠国家财政和民间捐助,缺少相应
随着国家经济体制改革进入深水区,金融业也迎来了新的发展机遇。以传统金融为基础,引入了互联网技术的互联网金融就是一种创新型金融服务,其主要服务形态有互联网众筹、第三方支付和P2P网络借贷。与传统银行借贷不同的是,P2P网络借贷是借助P2P网络借贷平台这一金融性中介机构,进行资金的融入和借出,其业务模式可分为信息中介、信用担保及债权转让三类。P2P网络借贷平台自2006年首次出现后,又经过了起步萌芽期