【摘 要】
:
针对目前大部分离群点检测算法未考虑数据的局部信息,导致离群点检测的准确率低问题,提出一种新的基于聚类和局部信息的两阶段离群点检测算法.通过定义新的局部离群因子作为
【机 构】
:
白城师范学院计算机科学学院,中国科学院长春光学精密机械与物理研究所,吉林大学计算机科学与技术学院
【基金项目】
:
吉林省科技发展计划重点项目(批准号:20090304)
论文部分内容阅读
针对目前大部分离群点检测算法未考虑数据的局部信息,导致离群点检测的准确率低问题,提出一种新的基于聚类和局部信息的两阶段离群点检测算法.通过定义新的局部离群因子作为判断数据对象是否为离群点的衡量标准,改进了传统离群点检测算法的过程.实验结果表明,该算法在保持线性复杂度的同时,能更准确、有效地挖掘出数据集中的离群点.
其他文献
将可靠性引入到救援设施影响范围的评价中,运用GIS技术对路网数据进行建模,并以.NET+ArcEngine开发环境为例介绍如何对模型进行网络分析,找出最短路径,计算求援点相对于救援设施点的可靠性;在此基础上构建不规则三角网,采用内插的方法对基于可靠度的影响范围分级渲染;最后将上述成果与以时间为标准分级渲染的范围进行叠置与分析。这样即得出在规定时间内最可靠的影响范围,用该结果对救援设施的影响范围评价
随着时代的变化发展,国民的文化素质与审美观念在不断提高,人们越来越注重自身文化修养的提升,信息时代的来临,使得多种文化碰撞交流,社会对文化的接纳与包容度也在增强,人们
本文为一篇英汉翻译实践报告,翻译报告原文材料《跨时空犯罪》是美国科幻小说家亨利·毕姆·派珀“跨时空”系列之一的一本架空历史小说,该书将地球虚构为各个平行时空共存的
目的:比较男性单纯2型糖尿病(type 2 diabetes mellitus,T2DM)患者与合并有骨质疏松的T2DM患者的一般临床资料及生化指标;探究男性T2DM患者合并骨量异常的相关危险因素并进行分析;寻找能早期预测T2DM患者合并骨量异常的指标,减少患者放射检查频次,早期干预,选择合适的治疗方案,减缓骨质疏松的发生、发展。方法:随机选取2017年11月-2018年11月符合纳入和排除标准的
作为一名小学语文教师,如何引导学生掌握正确、高效的词汇学习方法十分重要。围绕农村小学语文词汇积累教学工作展开探索分析,旨在为相关的教育工作者提供些许的教学思路。
随着科学技术的发展与进步,人民的生活水平有了明显的提高,随之而来的社会问题也十分明显,其中交通车辆的大量增多带来的交通拥堵问题是十分严峻的。同时,各种传感器设备以及
汉语写作课程作为汉语学习的重要组成部分,因其自身的综合性和复杂性,成为来华留学生学习的重点和难点。汉语中级写作课程是为有一定汉语基础的留学生开设的专项技能课程,目的是提高其汉语写作能力。本文所探究的中级阶段留学生所指对象为正在学习《发展汉语中级系列教程》的留学生,他们的汉语词汇量达到2000—2500左右,基本符合新汉语水平考试(下简称“HSK”)五级大纲要求。HSK五级考试留学生写作部分的内容不