面向枢纽现象的离群检测算法及应用

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:kashiyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用逆近邻查询进行离群挖掘,是检测离群数据的一个重要手段。但是随着数据集的急剧膨胀,逆近邻查询出现枢纽现象,这对算法的性能造成了较大影响。本文从离群检测性能出发,对逆近邻查询中出现的枢纽现象进行了深入的研究。其主要研究成果如下:(1)提出了面向枢纽现象的双向近邻离群检测算法,HPOD算法和HPOD2算法。该算法首先引入并重新定义了对象的影响空间,在影响空间中,同时兼顾了对象的k近邻和逆近邻的影响作用,有效提高了算法的准确性;其次,引入了启发式信息,不仅考虑对象的离群程度同时还考虑其k近邻的离群情况,显著降低了k的取值,从而减少了算法的计算量和运行时间;最后,采用真实数据集,实验验证了HPOD算法和HPOD2算法同传统的基于枢纽现象的离群挖掘算法相比具有更高的效率和准确性。(2)为了加快上述研究工作在高维数据中的挖掘效率,本文对算法进行了分析,提出了基于剪枝策略的离群检测算法,在不影响HPOD和HPOD2算法准确性的前提下,显著提高了算法的效率。最后采用人工数据集、UCI数据集和光谱数据集验证了基于剪枝策略的面向枢纽现象的离群检测算法可以有效减少在高维数据集中的计算代价,提高算法的效率。(3)在上述研究基础上,采用java语言,并结合图形化界面编程java GUI、以Intelli J IDEA作为开发工具,设计并实现了基于剪枝策略的天文光谱离群数据检测原型系统。从需求分析、结构体系及软件功能等几个方面进行了详细分析,系统运行结果显示,基于剪枝策略的天文光谱离群数据检测原型系统可有效发现天体光谱中的异常数据,为天体光谱数据的异常分析提供有效依据。
其他文献
“明股实债”是一种新型金融工具,由于其兼具债权投资和股权投资的特征,能够同时满足投融资双方的需求,成为许多企业在融资过程中使用的交易模式。“明股实债”在创新我国的投融资渠道的同时,也给监管带来了巨大的挑战。本文以H基金“明股实债”交易安排的涉税纠纷为切入点,通过对案例的分析,认为我国当前的税收法规中,对于股权投资和债权投资的区分规则不明确,导致诸如“明股实债”类的混合性投资的税法属性无法明晰。实务
本文聚焦于介子质量谱和强衰变性质的研究,研究的对象为粲偶素和底介子。本文目的在于加深对夸克模型的理解,探讨粲偶素和底介子的性质,分析强子态在介子谱中的位置安排并为
船舶结构强度是保障船舶安全性的重要组成部分,在当今船舶大型化的趋势下仍需保持重点关注,特别是碰撞/搁浅等各类事故层出不穷,对结构安全性造成严重威胁,并可能进一步导致人员生命、财产及环境的重大损失。技术的进步和行业内激烈的竞争又促使着对于船舶的经济性要求越来越高,为了充分利用材料,根据构件几何/材料屈服强度等随机性特征,开展船舶结构极限强度的统计学属性研究并进行结构可靠性分析显得尤为必要,这也对提高
城市轨道交通车辆是复杂的机电一体化系统,受电弓作为城市轨道交通车辆供电系统的重要环节,是实现电力传输的核心设备。如果受电弓在运行中发生故障,不仅会影响车辆受流,还常
本文以接受美学为理论基础,以张爱玲自译的《怨女》为研究对象,运用接受美学中的“本文的召唤结构”和“期待视野”两个重要理论观点探讨张爱玲的自译现象。首先,“本文的召
本报告以《中国智能汽车指数规程》英译为研究对象,分析翻译过程中的要点与难点,旨在探索此类信息型文本的英译原则与方法。德国功能主义翻译理论代表人物赖斯将文本功能分为
本文主要研究内容为以AKT电子厂为研究背景,研究SMT元件贴片生产线稼动率及生产线中MES模块的应用。首先对当前国内外稼动率及MES模块研究进行了介绍,可知当前国内针对SMT元件贴片生产线的稼动率研究大多集中于大型生产制造商,但结合当前国内SMT元件贴片商的研究背景来说中小型电子厂为元件贴片制造业的主力。中小型元件贴片电子厂具有灵活度高、产品可定制化的特点,可柔性制造也使得生产管理成本升高。多订单
在作物种植结构调整的背景下,土地使用、作物种植种类及其组成的转换改变着农作物害虫的食物来源和生存环境,常对田间害虫种群发生产生明显影响。我国华北地区以“冬小麦-夏玉米轮作”的耕作模式为主,近年来二点委夜蛾、亚洲玉米螟、桃蛀螟等重要农业害虫的发生随着种植结构调整有加重趋势,但其中大尺度生态调控机制尚不明确。本文从景观尺度上研究华北地区农田景观组成及其多样性对二点委夜蛾、亚洲玉米螟和桃蛀螟成虫发生密度
量子密钥能够为数据通信提供无条件的安全,随着全球范围安全通信需求的不断增加,需要为超远距离地面节点分发量子密钥,构建全球量子保密通信网。然而在超长距离和洲际量子通信中,光纤传输受限于传输距离和损耗,而自由空间量子密钥分发具有传输损耗低和覆盖范围广的特点,是未来实现全球量子通信网的有效途径。鉴于单颗量子卫星覆盖范围有限,需要构建面向量子密钥分发的卫星网络,如何利用和分配卫星资源进行密钥分发的问题亦亟
大豆(Glycine max(L.)Merr)是重要的粮油和经济作物。大豆白粉病是大豆真菌性病害之一,大豆白粉病可造成10-40%的产量损失。近年来有逐步扩大和加重的趋势。种植抗病品种是防治大豆白粉病最经济、有效、安全的途径。因此,对大豆种质资源进行抗白粉病鉴定为大豆育种提供抗病种质,同时采用全基因组关联分析方法进行抗病基因定位并对候选基因进行预测分析,可以有效推动大豆抗白粉病育种进程。本研究在温