区间型符号数据的判别分析方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:nihao99520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的判别分析主要针对点数据,当需要处理海量数据时,其从整体上把握数据属性方面有所欠缺,符号数据分析方法通过“数据打包”,实现了从整体上把握海量数据内部之间的关系。本文在总结、整理现有区间型符号数据理论的基础上,以一般分布的区间型符号数据为研究对象,研究了三种区间型符号数据的判别方法。   首先,整理区间型符号数据的标准化问题;基于Hausdorff距离,推导待判区间型符号数据与各类别中点之间的距离。在此基础上,提出了区间符号数据的距离判别法,并给出具体算法步骤。第二,在现有文献基础上整理区间数的线性组合方法;研究区间型符号数据的方差分解,将其分解为组间变差与组内变差两部分。在此基础上,成功将传统线性判别法推广,给出一般分布区间符号数据的Fisher判别方法及算法步骤。第三,在现有中外文献基础上探讨符号数据的核密度估计,将非参数判别法推广,提出符号数据的最大似然法和Bayes判别法。最后,针对降水预测问题,在中国东北地区选取29个有代表性的城市为符号对象,以2010年5月4日的气温、云量、风速为指标变量,形成区间型符号数据,分别应用距离判别法和Fisher判别法预测5日是否有降水过程。三种方法各有利弊:距离判别方法对区间内数据点以及区间数整体的分布无限制,对问题具有普遍适应性,但却有信息量应用不足的缺陷;Fisher判别分析易于解释,应用广泛,但判别前需要已知区间数内部及整体的分布,成为其不足之处;基于核估计的非参数判别法能够避免需已知样本分布的缺点,但为了获得满意的总体密度估计,实际需要的样本量巨大,有时不利于实际应用。   本论文将传统判别分析方法拓展,提出和总结了适用于一般分区间型符号数据的判别分析方法,同时应用研究表明,这些判别方法具有可行性和实用性。  
其他文献
从20世纪90年代开始,在越来越多的行业中,时间成为竞争的关键因素。在库存管理中,对提前期加以控制是企业获得基于时间的竞争优势的主要手段,提前期的合理压缩将会给企业带来巨大的收益。更多的企业意识到,采购过程中不仅应重视与数量相关的订货批量决策,也应重视与时间相关的订货提前期决策。同时,由于市场全球化的高度发展,产品更新换代速度加快,影响企业运营的不确定性因素越来越多,模糊环境为研究库存管理中的不确
学位
2018年5月19日上午,由河南省作家协会、河南电影电视家协会、河南省文学院、广西博泰传媒有限公司、河南中飞影视传媒有限公司、电视剧《闺蜜同行》摄制组共同主办,登封市委
期刊
刘宏志:乔叶老师你好,首先祝贺你去年出版了新的长篇小说《藏珠记》.不过,我们的访谈,还是从你文学创作之路的开始谈起吧.你最早是写散文的,而且在散文写作上还取得了很大的
期刊
二十一世纪以来,竞争全球化的浪潮势不可挡,我国施工企业面临来自全球各施工企业激烈竞争的严峻挑战。电子商务作为21世纪最具竞争力的商务模式,越来越多的施工企业都希望通
与近些年来借玄幻题材书写浪漫情感的流行作品不同,乔叶的《藏珠记》试图以一个看似简要的故事为索引,去探究个体在意识到“有死性”所导致的生存境遇的荒诞之后,何以奋起反