【摘 要】
:
相比于实体试验,计算机试验在科学和工程领域已经变得越来越普遍,这主要是因为实体试验往往既费时又昂贵,有的又具有破坏性甚至不可实施。在计算机试验中,我们最常使用能够将设计点在整个试验空间中尽可能均匀分布的空间填充设计。拉丁超立方体设计(简写为LHD)和均匀设计是两类最受欢迎的空间填充设计,其中,LHD可以满足一维的空间填充性质,然而它不能保证二维或者更高维的空间填充性质。因此,如何构造好的LHD是计
论文部分内容阅读
相比于实体试验,计算机试验在科学和工程领域已经变得越来越普遍,这主要是因为实体试验往往既费时又昂贵,有的又具有破坏性甚至不可实施。在计算机试验中,我们最常使用能够将设计点在整个试验空间中尽可能均匀分布的空间填充设计。拉丁超立方体设计(简写为LHD)和均匀设计是两类最受欢迎的空间填充设计,其中,LHD可以满足一维的空间填充性质,然而它不能保证二维或者更高维的空间填充性质。因此,如何构造好的LHD是计算机试验中的一个重要课题。一般来说,我们采用一些基于模型的或者与模型无关的最优性准则来改善LHD的性能。熵准则是一个较为常用的基于模型的准则。对于常被用来对计算机试验的数据集进行建模的高斯过程(简写为GP)模型而言,最大化熵等价于最大化协方差矩阵的行列式的自然对数。除了最大熵准则,综合均方误差(简写为IMSE)、最大预测方差(简写为MPV)和平均预测方差(简写为APV)准则也是一些常用的基于模型的最优性准则。除此之外,最大最小距离、最小最大距离、正交性和均匀性准则是一些被广泛使用的独立于模型的设计准则。此外,研究者们也做了很多努力去构造基于两种或者更多种最优性准则的设计。根据效应稀疏原则,在计算机试验中,通常只有一少部分的因子是显著的。现有设计(例如最大最小距离设计和均匀设计)可能在低维投影上表现较差,这显然是我们不希望的。因此,在实际中,拥有较好的投影性质的空间填充设计在最近变得越来越受欢迎。除此之外,对于计算机试验而言,我们需要因子水平数较多的设计,但是通常没有必要要求设计的行数等于其因子水平数。近些年,行数和因子的水平数较为灵活的U-型设计在计算机试验领域也受到了更多的关注。本学位论文的主要工作是为计算机试验构造具有较好的空间填充性质的设计。在本学位论文中,我们试图通过提出新的最优性准则和新的构造方法来解决上述的相关设计问题。现有的投影设计往往是基于独立于模型的设计准则,试图在所有投影上实现较好的空间填充性质。然而对于GP模型而言,基于模型的设计准则通常是更为合适的。于是,我们提出了一些针对GP模型的新的最优性准则,并且使用输入变换的方法来生成这样好的投影设计。此外,对于例如正交性准则和最大最小距离准则这样的不基于模型的设计准则,现有的设计方法通常对于设计的行数和因子的水平数有一定的限制。我们提出了一些新的构造方法,从而可以构造出现有方法得不到的较好的空间填充设计。以下是本学位论文的结构。第一章介绍了与空间填充设计相关的研究进展以及计算机试验、常用准则等预备知识。在第二章中,我们采用在一组投影上平均的熵准则来生成投影设计,并称这个平均的熵准则为期望熵准则(简写为EEC)。我们还证明了当我们基于一个单调函数对LHD的每列进行变换并且保持其拉丁超立方体结构时,可以提高设计在EEC下的表现。现有的投影设计(例如最大投影设计)试图实现在所有投影上基于距离、均匀性或者正交性等准则的较好的空间填充性质。然而,由于拟合GP模型常常是一个重要的目标,如熵准则这样的基于模型的准则在很多情况下是更为合适的。本章考虑两种输入变换:一种是对称Beta分布的分位数函数,并选择能够最优化EEC的分布参数;另一种是对应于对称密度函数的分位数函数的非参数变换,同样选择能够最优化EEC的分布参数。我们还考虑了能够充分利用因子重要性顺序信息的修正的变换方法。数值研究显示我们提出的针对LHD的变换能够快捷有效地构造稳健的最大EEC设计。对比于其他常用的空间填充设计,当投影到各个维度上时,本章得到的设计在较大范围的协方差参数的取值下都有更大的熵和更小的MPV,但同时在APV的值上有少许的增长。第三章提出了一种新的构造具有灵活行数的正交拉丁超立方体设计(简写为OLHD)和近似OLHD的旋转方法,并且新构造的设计不能由现有的方法得到。正交性对于LHD而言是一个很好的性质,不仅是因为它使得在线性模型中主效应的估计是互不相关的,并且在拟合GP模型时正交性也是空间填充性质的基石。在现有的构造OLHD的方法中,旋转方法由于其理论上的优雅以及对低维投影上的空间填充性质的贡献而特别具有吸引力。除此之外,我们基于最大最小距离准则和混杂矩阵进一步提高了所得到的OLHD的性能,并且我们还构造了一类新的正交设计。本章给出了相应的理论性质以及构造算法。第四章提出了一种利用不完全区组设计构造具有灵活行数和因子水平数的U-型设计的系统组合构造方法。在计算机试验中,我们需要多水平数的设计,然而有时我们不需要让每个因子的水平数等于设计的行数,就像LHD那样。对于我们新构造的设计,其性能可以由小设计的性能保证。通过使用不同的小设计和区组设计,应用我们提出的方法可以生成基于最大最小距离准则和正交性准则的不同类型的U-型设计。在本章我们给出了构造算法以及所得设计的理论性质。第五章是本学位论文的总结。
其他文献
试验是人们了解自然、探索自然规律的重要手段,它在工业、农业、工程及科学的各个领域有着重要的理论意义和应用价值.试验主要分为两类:实体试验与计算机试验.实体试验是在农田、工厂或实验室进行的,通过试验员亲手操作、现场观测来完成,而计算机试验是通过复杂的计算机代码来实现的.试验设计是试验中最关键的环节之一,通过合理地控制变量的取值来实现统计分析中的某些优良性质.本学位论文旨在对试验设计的某些新课题展开研
背景和目标:肺癌是在全球范围内发病率和死亡率最高的癌症,肺腺癌是肺癌最常见的类型。尽管近年在研究和治疗中取得了巨大进步,但是治疗效果仍有待提高。研究表明,肝X受体(liver X receptor,LXR)被其配体T0901317(T317)激活后,能促进干扰素γ(interferonγ,IFNγ)表达,发挥抗肿瘤作用。然而,LXR同时激活脂质合成基因表达,导致肝脏脂质过度合成和积累,造成脂肪肝及
试验在工业、农业、工程和科学等领域无处不在。总的来说,试验大致可以分为两类:实体试验和计算机试验。在实体试验中,科学家进行实验室试验或进行现场观察。由于实体试验中总是存在随机误差,对于相同的输入变量试验人员可能获得不同的输出响应。随机误差的存在会增加数据分析和处理的复杂性。为了解决这个问题,实体试验往往遵循以下三个基本设计原则,即随机化、重复和分区组。当实体试验的成本很高、耗时很长,或者在实际环境
缺失数据在工农业生产,药物研发,流行病学,人口普查,民意测验等领域普遍存在.数据缺失会导致获得的样本信息减少,降低模型效率,增加模型复杂度,不利于进行数据分析和统计推断.依据不同的缺失机制,缺失数据被分为完全随机缺失,随机缺失和非随机缺失三种.前两种缺失机制与缺失数据本身无关,一般称为可忽略缺失,而最后一种缺失机制与缺失数据有关,称为不可忽略缺失.在不可忽略缺失数据情形下,参数可识别问题往往给估计
随着经济和社会的飞速发展,飞机对人类的影响越来越突出。现代飞机在商业,民用和军事领域承担着重要的任务;这对飞机的机动性,可靠性和控制精度提出了更高的要求。由于姿态控制系统是飞机的关键部件,并且在飞行稳定性中起着重要作用,因此姿态控制的研究是一项极具挑战性的工作。飞机是一个复杂且高度非线性的系统,但是传统的控制方法无法满足现代飞机的控制精度。为了提高飞机姿态控制的准确性,本文将抗扰控制,滑模控制和反
普通变形杆菌(Proteus vulgaris)为环境和临床中常见的条件致病菌,在特定条件下会引起胃肠感染、尿路交叉感染等疾病。环丙沙星等抗生素广泛用于治疗该类细菌所引发的感染,但也使得耐药细菌大量出现,严重影响临床治疗效果,危及人类生命健康。本实验室前期从南美白对虾肠道中分离得到一株携带有两个内源质粒的变形杆菌(Proteus),后经本研究鉴定为普通变形杆菌。本研究将该普通变形杆菌命名为P3M并
随着计算机性能和通信技术的快速发展,我们在工业生产、生物医学及现代计量经济学等诸多领域都会遇到各种各样复杂且高维的数据.为了挖掘潜藏在数据背后的信息,比如研究某些因素对我们感兴趣变量的影响,我们常常会借助各种回归模型建立起相关因素之间的桥梁,然后基于假定的模型去做相应的统计推断.为了便于解释相关模型的分析结果,所假定的模型需要尽量简单,这往往需要大量先验知识的参与.如果人们怀疑最初假定的模型,抑或
动物生态学(animal ecology)与动物学、生态学密切联系,是现代生态学的重要内容之一。数学和统计的思想与方法在动物生态学中有着广泛的应用,在该领域的发展过程中发挥了巨大的推动作用。动物个体识别(animal individual identification)是通过检验动物个体的唯一性标志,从而判断前后两次或多次被观测的个体是否属于同一个体。在动物生态数据收集过程中,动物个体识别技术的作
随着嵌入式系统、计算机科学和通信技术的飞速发展,多智能体系统的分布式协同控制问题近年来备受关注。同时,包容控制作为多智能体系统分布式协同控制的重要研究问题,因其在危险品处理、搜救、合作运输等领域的广泛应用而引起了人们的极大关注。此外,二阶动态模型可以用来模拟现实中更为实际和复杂的动态过程。本文主要研究了二阶动态多智能体系统的包容控制问题,主要研究成果总结如下:(1)在所有智能体只能间歇性地获取其邻
由缺血引发的组织损伤是造成心血管疾病的主要原因,如心肌梗塞和缺血再灌注等。组织缺血最初会造成组织供血不足,伴随物质及能量代谢的不平衡,最终造成了组织的损伤。对于缺血性疾病治疗的主要策略是恢复供血,包括血液再灌注以及血管网络的重新建立。然而,再灌注会造成组织的进一步损伤,即缺血再灌注损伤。造成缺血再灌注损伤的分子机理十分复杂,其中研究比较深入的是再灌注造成的氧自由基爆发,主要包括线粒体呼吸链产生的超