基于Winslow泛函的生成模型

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gzsoft168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概率生成模型,也叫作生成模型,是在机器学习和概率统计问题中的一类具有极高实际应用价值的模型。它的应用十分广泛,可以用来对不同种类的数据进行建模,比如图像,声音,文本数据,同时它能够通过多种方式融入强化学习,所以在数据预测,图片处理,文本生成等领域有广泛的作用。但是如何设计一种高效且有效的生成模型,也是非常具有挑战性的。生成模型的关键步骤就是对目标分布进行参数化估计。为了在一定程度上简化讨论,在本文中我们将主要关注通过极小化交叉熵(KL)的原理工作的生成模型。生成模型的种类非常多,但是主要能分为两类,一类是构造一个显式的密度分布。在这些显式的密度模型中,密度是可以计算处理的,所以模型的更新也是相对直接的。比如变分自编码器。另一类生成模型没有显式地表示数据所在空间上的概率分布,相反,该模型提供了某种方式来减少与这种概率分布的直接交互。通常是直接提取样本的能力,比如使用马尔科夫链来随机变换现有样本的方法,以便从同一分布中获得另一个样本。特别的,有一类特别的具有显式密度函数的生成模型,是基于定义两个不同空间之间的连续非线性变换来构造的,称为流模型。换句话说,这类模型从一个简单的分布出发,将其与一个变换相结合,以一种复杂的方式扭曲空间,进而得到复杂的分布。如果对该映射进行控制,那么对应的概率分布也是可以控制的。这类模型比如NICE模型与Real NVP方法,通过设计一个可逆的编码器,直接定义了明确的且可处理的概率密度分布。但是这类模型也有其缺点,比如网络结构复杂,导致计算量大,训练时间长。本文同样考虑这样一种特殊的生成模型,通过构造初始分布与目标分布之间的映射,来对目标概率分布进行估计。我们发现,求解这样一种映射与求解偏微分方程中的自适应网格法有很多相似之处。自适应网格方法是一种基于变分法的迭代网格构造方法,该方法能够改变偏微分方程解的变化较大区域附近的网格分布,在求解具有奇异解的偏微分方程过程中特别有效。而这样一种网格移动,是由Winslow能量泛函所控制的。如果我们将把样本映射到概率密度较高的区域,看成将网格点移动到解的梯度较大的区域的过程。我们就能通过Winslow泛函来建立这两种问题的联系,进而将这种能量泛函运用到生成模型的构建中来。本文的主要内容可以分为四个部分,其具体的工作能够概括为如下:(1)对一些相关的生成模型进行介绍,包括直接使用梯度方法极小化交叉熵的方法以及Stein变分梯度下降方法(SVGD)算法。给出其中重要定理的证明,并且提供了一些简单的算例来展示其效果。(2)我们希望映射的更新能够满足一定的约束条件,所以我们引入了Winslow泛函。这种能量泛函被用于求解PDE的迭代自适应网格方法中。我们通过介绍这种算法,说明了Winslow泛函的定义。并且通过简单的例子介绍其效果与原理,为我们后续提出基于Winslow泛函的生成模型提供一个良好的基础。(3)在对生成模型以及自适应网格法有了一定认识后,我们详细说明了这两种方法的内在联系与相同点,同时分析了将Winslow泛函运用到构建生成模型的可行性。有了以上的铺垫,我们提出了一种基于Winslow泛函的生成模型,将更新映射转化为更新控制函数,再通过控制函数来决定映射。我们简要介绍了该其原理并对相关的细节进行了证明。我们通过在一维与二维情况下不同的数值实验说明了其效果,并和之前提到的生成模型进行简单的比较。(4)在高维情况下,对偏微分方程进行数值求解是非常复杂的,为了能够将我们的方法运用到高维问题上,我们探讨了如何在神经网络框架下实现我们的算法。所以我们简要介绍了求解PDE的神经网络算法,Ritz算法以及在机器学习中比较经典的生成模型,生成对抗模型(GAN)。我们详细讨论了神经网络结构的设计中的难点,包括损失函数的设计,边界条件与迭代流程的处理。最终通过一些数值算例对其有效性进行了验证,并做了简要分析。本文的数值实验结果,说明了这样一种基于Winslow泛函的生成模型是有效的。并且不论是使用数值求解还是使用神经网络求解问题,该方法都取得了不错的效果,能够在较低次数的迭代下达到较低的交叉熵。总的来说,本文的价值主要体现在如下几个方面:(1)我们的工作为生成模型的算法构建提供了一种新的思路。我们成功的将自适应网格算法中所使用的Winslow泛函应用到生成模型的算法构建中,将求解目标映射的问题转化为求解偏微分方程问题。我们在一些数值实验中成功验证了该算法的有效性。此外,我们对所介绍的算法都进行了一些数值实验,并且就结果给出了一些初步的分析与探究。(2)我们成功在神经网络框架下实现了我们的模型。我们介绍了如何使用神经网络求解偏微分方程,然后详细讨论了对于基于Winslow泛函的生成模型在设计网络结构设计中的难点与处理方法。最终在低维情况下验证了我们的网络结构的训练效果。(3)我们的工作提出了很多值得研究问题。在生成模型的研究中,本文的工作数值算例都是在低维度下进行的,并且集中于目标概率为显式概率分布。本文并未对离散数据集以及高维度问题进行过多的讨论,我们相信该模型也能够在这些问题上适用。我们的网络框架设计还有一些缺点,比如并未对计算雅可比矩阵的过程进行优化,而随着维度上升,雅克比矩阵的计算会变得非常复杂。这些问题非常值得进一步研究。
其他文献
目的:探讨VSD负压封闭引流装置(Vacuum Sealing Drainage,VSD)在皮肤软组织缺损治疗中的临床应用。方法:在本次研究中,对新疆医科大学第一附属医院自2019年9月至2021年1月整形外科收治的因外伤导致皮肤软组织缺损患者收集到共50例,按照随机分组法,分为实验组与对照组,各25人,实验组为采用VSD负压封闭引流技术治疗的皮肤软组织缺损病患,对照组则采用传统换药实施治疗的皮肤
学位
本文选取青藏高原东北缘东向延伸前沿地带——甘肃东南地区为研究区域,该地区地质构造环境极其复杂,地质灾害频发,古今地震不断。本文主要以甘肃东南地区2013年岷县—漳县Ms6
目的:基于三级预防和精准医疗的要求,本研究针对肝脏肿瘤X射线相衬显微成像图像,探讨血管骨架化分析与机器学习方法在肝脏肿瘤分类预测研究中的应用,为肝胆外科和影像科医生提供更加具有参考意义的辅助方案,以提高肝脏肿瘤的诊断效率与准确率,尽早发现早期肝脏肿瘤,这对三级预防所提倡的早发现、早诊断和早治疗具有重要意义。方法:人体肿瘤样本采集自新疆医科大学附属某三甲医院肝胆外科,动物实验选择8只SPF级7周龄雄
学位
企业并购发展已久。近年来,我国许多优秀企业通过实施并购和投资的方式,谋求企业整体实力的提升。家电行业历来是我国经济发展的重要产业,但在全球来看,我国的家电行业仍存在
目的:本研究通过对孕产妇和新生儿进行流行病学调查及实验室检测,探讨孕期多环芳烃(polycyclic aromatic hydrocarbons,PAHs)暴露对孕产妇和新生儿DNA氧化损伤与新生儿糖脂代谢及胰岛素功能的影响,阐明多环芳烃暴露与新生儿糖脂代谢功能的相关性。方法:分别选择在乌鲁木齐市某医院采暖期和非采暖期的367对孕产妇及其新生儿作为研究对象,对其进行流行病学调查和生物样品的采集。采
学位
当前的征管方式改革正在推进税收征管方式由传统的办税服务厅征收向着网络征收转变,税务信息系统不可避免的与财政系统、工商系统、商业银行、国库等部门进行数据交互,随着金
学位
西部地区作为一直以来的后发地区,农业在该地区经济中比重较高,但受自然条件、政策等因素限制其农业对内对外发展水平仍与我国其他地区差距较大。作为国家最新的一项发展战略,西部陆海新通道建设为沿线省域农业外向化新格局的重新建构带来新机遇,要想抓住这次机会必须重视当下新通道区域农业未来的提升空间,那么科学评估沿线省域农业外向化发展潜力就显得十分重要。本文采用文献研究法和统计分析法展开研究:首先采取文献研究法
学位
铝合金作为重要的结构材料之一,由于比重小、强度高等一系列优点被广泛应用到汽车、建筑等行业和日常生活中。此外,铝合金也是国防工业所用到的主要金属材料之一,如用于潜艇
随着能源消耗加剧,环境污染问题日益突出。化石燃料污染较大,不能满足人们对于低碳、无毒等环保需求。当前全球能源结构正逐步调整,氢能具备无污染、高效能、储量丰富等特点,