基于生成对抗网络的运行指标动态校正方法

来源 :东北大学 | 被引量 : 0次 | 上传用户:lw8307817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂工业生产全流程运行优化与控制过程中,各个生产过程的局部优化难以保证整个工业流程的优化,目前对工业生产进行优化控制的研究大多数停留在工序的局部优化控制阶段,而对整个工业生产过程的全局优化控制研究很少。因此为了实现在不确定性复杂的情况下生产全流程的全局优化与动态校正,对工业过程运行指标决策过程的研究至关重要。为了协调各个生产过程的运行指标从而解决企业所关注的与生产全流程产品质量、产量、效率和消耗等综合生产指标等相关的优化问题,许多专家学者提出很多基于知识的方法,但这些方法并不能很好地对工业过程中存在的先验知识进行建模,因此不同程度的遭遇了“知识瓶颈”。本文针对存在的问题,依托国家自然科学基金项目“数据驱动的复杂工业系统运行优化控制及应用(61525302)”,开展复杂工业生产全流程运行指标优化决策方法研究,提出基于生成对抗网络(Generative Adversarial Networks,GAN)的动态校正模型,能够在动态不确定性下实现全局优化和动态调整操作,主要工作如下:1)给出了关于复杂工业过程运行指标动态校正的问题描述;并针对该问题,提出复杂工业运行指标动态校正的三个目标,用于评价模型性能;提出基于生成对抗网络GAN的复杂工业过程运行指标动态校正策略;给出基于变分推理原理(Variational Inference)的策略价值函数推导。2)提出决策生成对抗网络DMGAN(Decision Making GAN)框架,该框架包括一个编码器、一个生成器(也称决策器)及两个判别器,其中两个判别器分别对潜变量空间与决策空间进行约束。在DMGAN中,通过两个对抗学习准则及三个循环一致性准则来进行学习和推理过程以实现潜变量空间与目标决策空间的双映射、目标空间到决策空间的单映射过程;为了匹配与日益增长的工业复杂度,提出深度神经网络RU-Net(Reinforced U-Net)来提高生成器模型的泛化能力,在原来的U-Net基础上进行三个方面的改进:一个更加通用的混合函数模型、特征提取层的模块设计化以及Drop-Level规范化训练准则,其中,混合函数与模块化设计用于增强局部表征能力,而Drop-Level方法可以防止RU-Net出现过拟合;提出知识相似度评估手段KDA(Knowledge Dissimilarity Assessment),基于 Parzen Window 概率密度估计和互信息(Mutual Information)用于评估产生的校正决策空间与实际运行知识间的差异程度,除此以外,提出基于MSE(Mean Square Error)的两种手段来多维度评估运行指标动态校正过程的性能表现;利用选矿过程的实际生产数据作为测试平台,仿真实验和对比实验表明所提DMGAN有效性及多功能性。3)提出复杂工业过程运行指标任务驱动的多步动态校正模型RAGAN(Recurrent Attention GAN),该模型包括 DA(Distributed Attention)机制与 RAAE(Recurrent Adversarial Auto-encoder)框架;提出分布式注意力DA机制,并在该机制基础上建立感知网络包括编码器读入网络、决策智能体读入网络与条件读入网络、决策智能体写入网络、和判别器读入网络与条件读入网络,其中读入网络与条件读入网络分别实现对输入运行指标变量、条件变量的动态选择以产生相应的感知区域而写入网络则实现对CCM(Cumulative Canvas Matrix)矩阵的部分修改,采用强化学习来训练基于DA机制的网络结构如何合理分配感知资源;采用LSTM(Long Short-Term Memory)构造编码器、决策智能体及判别器,其中决策智能体基于对感知网络所感知工业运行状况的来更新LSTM中MC(Memory Cell)产生的中间状态,该中间状态用于指导各个感知网络在下一时间步长下的动作,包括基于DA机制感知网络所需参数以确定下一时刻下感知网络如何分配感知资源、与编码网络顺序连接构成递归自编码器RAE(Recurrent Auto-encoder)以实现对现有决策空间的重构动作和在时间步长产生基于当前条件变量的运行指标校正值以更新初始决策值的智能体与环境交互动作;奖励值则监督学习与强化学习构成的混合损失函数组成;提出一种新的递归GAN框架RAAE,该框架采用递归方式构造GAN模型与递归自编码网络,并且在GAN模型中递归判别模型能够与当前生成器达到纳什均衡以促进RAAE模型性能提高;利用选矿过-程的实际生产数据作为测试平台,仿真实验和对比实验表明所提RAGAN有效性。
其他文献
2019年12月1日生效的《疫苗管理法》规定,我国实行预防接种异常反应补偿制度,对接种过程或者接种后出现异常反应损害的受种者给予补偿。首次将预防接种异常反应补偿写入法律,为受害者寻求补偿提供了法律依据。但是《疫苗管理法》在异常反应的补偿范围上将偶合性、心因性反应排除在异常反应补偿之外,缩减了异常反应补偿范围;异常反应鉴定程序不公正,公众对鉴定结果存疑,降低鉴定结果的公信力;预防接种异常反应补偿标准
我国社会工作专业自2009年招收第一届研究生以来,在不断探索和发展过程中,逐渐形成了自身的核心优势能力。明晰社会工作的核心能力内涵和提升策略有助于提高MSW学生今后的职业竞争力和推进高校教育以能力为本的培养模式探索。本研究对社会工作者核心能力的相关研究进行了回顾,通过对相关文献的整理分析,得出既有研究对社会工作者核心能力的讨论维度,包含社会工作专业价值观、专业知识和专业方法技巧三个方面。此外,在社
通过淬火后时效热处理过程中析出第二相(α相或者ω相)是α+β两相钛合金与亚稳β钛合金主要的强化方法。钛合金中出现的应力诱发马氏体相变对钛合金的力学性能具有重要的影响,因此关于钛合金应力诱发马氏体相变临界诱发应力的影响因素,以及通过适当的热处理工艺对应力诱发马氏体相变的调控机理一直都是研究的热点。本文将Ti-3Al-5Mo-4.5V双相钛合金在750℃与800℃进行淬火热处理,分别得到了不含淬火马氏
我国老年人赡养权益保障的制度建构主要侧重于保障老年人的物质生活条件和身体健康,对于老年人精神赡养权益的保障问题没有给予足够的关注和重视。直到2013年,老年人精神赡养权益才得到法律的明确规定和保护,但是,在保障体系的建设中完善程度远不及物质赡养。老年人精神赡养权益的特殊性决定了保障老年人精神赡养权益的法律责任形式具有特殊性,老年人精神赡养权益具有明显的道德倾向,同时还具有明确的法律规制性。根据对我
法国历史悠久,文化底蕴深厚,文化产业是其重要的经济支柱。法国的文化创意产业具有独特的创意活力,是法国文化产业中具有发展潜力的新兴产业。法国博物馆文化资源丰富,在该国政府部门调控下,博物馆文创产业的发展逐具规模。首都巴黎的博物馆更是数不胜数,其中具有代表性是卢浮宫博物馆。卢浮宫博物馆通过以开发经营博物馆文化产品为代表的商业经营活动带动了品牌效应,也成功地传播了博物馆文化。近年来,随着我国文博事业的蓬
研究背景:中晚期肝细胞癌(Hepatocellularcarcinoma,HCC)总体预后较差,放射治疗作为重要的局部区域治疗手段,在中晚期肝癌的治疗中起到越来越重要的作用。随着免疫治疗的进展,肝癌免疫治疗,特别是抗PD-1/PD-L1治疗,为肝癌的综合治疗提供了新的思路。放疗与免疫治疗存在协同增效作用。本研究旨在探讨放疗联合抗PD-1免疫治疗中晚期HCC的安全性与疗效。研究方法:本文为回顾性临床
中国是世界上第一大水果生产国,但在国际水果市场,特别是高端水果市场中的份额一直处于较低的水平,其中最主要的原因就是水果品质分级标准不严格。通过计算机视觉和图像处理技术,研究提升水果品质分级准确率的方法,能够降低人工进行水果品质分级的主观性,具有重要的社会和经济意义。不同水果种类之间分级标准不一致、不同水果等级之间划分标准差异小、水果果梗区域与水果缺陷区域相似等原因造成水果品质等级难以区分。针对以上
当前党中央、国务院大力发展乡村振兴战略和精准扶贫工作,加之地理标志承载着巨大的经济价值与文化价值,其保护也与“三农”问题紧密相关。因此,如何在法律和制度层面上切实解决地理标志证明商标侵权的问题,从而更好进行地理标志保护就显得尤为重要。但我国地理标志证明商标在侵权认定方面还存在着侵权判断标准含糊,举证存在障碍和合理使用界定不清晰的问题。基于此,本文通过百余个案例证明在司法实践中地理标志侵权认定方面存
本文研究的Gosper曲线是一种空间填充曲线,它的特性为:当曲线足够长时,它可以充满Gosper岛.这类曲线可应用于数学规划、稀疏多维数据库索引、电子学、生物学以及互联网地图中.因此Gosper曲线具有很高的研究价值.在前期的研究过程中,已经完善了离散仿射曲线的基础理论:给出了离散曲线、切线、仿射映射和第一、第二仿射曲率的定义,以及仿射曲率的计算公式和几何意义.平面离散曲线的第一、第二仿射曲率是仿
金属合金的成分和微观组织可以决定金属的性能,在合金材料生产过程中,金相分析是必不可少的阶段。本文以半连续铸造铝硅合金图像为对象,结合图像处理、机器学习以及深度学习先进理论,对金相图像分析方法进行深入研究,实现了对半连续铸造Al-12.7Si-0.7Mg合金图像微观组织的准确分割及分析,具体研究内容如下:(1)综述了国内外金相分析方法的研究现状。分析了从传统的金相图像分析技术到基于图像处理技术的金相