【摘 要】
:
数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不
论文部分内容阅读
数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要。K近邻算法(KNN)是基于统计的分类方法,是数据挖掘分类算法中比较常用的一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术的理论和应用研究方法之一。本文主要研究了K近邻分类算法。首先简要地介绍了数据挖掘中的各种分类算法,详细地阐述了K近邻算法的基本原理和应用领域,其次指出了K近邻算法的计算速度慢、分类准确度不高的原因,提出了两种新的改进方法。针对K近邻算法的计算量大的缺陷,构建了聚类算法与K近邻算法相结合的一种方法。将聚类中的K -均值和分类中的K近邻算法有机结合。有效地提高了分类算法的速度。针对分类准确度的问题,提出了一种新的距离权重设定方法。传统的KNN算法一般采用欧式距离公式度量两样本间的距离。由于在实际样本数据集合中每一个属性对样本的贡献作用是不尽相同的,通常采用加权欧式距离公式。本文提出一种新的计算权重的方法。实验表明,本文提出的算法有效地提高了分类准确度。最后,在总结全文的基础上,指出了有待进一步研究的方向。
其他文献
网络小说作为一种新兴的文学样式,在大学生中迅速的流行开来,对大学生思想政治教育产生了许多负面影响。它扭曲了大学生正在形成的正确的价值观和道德观、削弱了教育者主导作
<正> 我应美国红十字会血液部的邀请,于1984年7月,赴美国作输血专业为期一年的进修访问。在美期间,经过关方精心安排学习及参加学术活动,使我有条件较全面地了解美国当前的输
欧阳修在词作中有四百三十六处使用了颜色词语,其在语素、语法功能、美学效果等方面极具特色。本文通过对颜色词语的研究必将使读者更加全面地了解欧阳修词作的艺术特色。
目的 观察生物陶瓷药物载体应用于海水浸泡爆炸伤伤口的效果 ,探讨推迟初期外科处理时间的措施。 方法 健康大白兔 16只 ,造成后肢软组织爆炸伤合并海水浸泡 1h ,然后随机
<正>数学最明显的特征无外乎抽象枯燥,所以抽象严谨的数学语言显得晦涩难懂,读来难免索然无味.不过,当人们合理恰当地运用数学语言对事情和道理进行比喻时,简洁明了的数学描
分析了我国科学教育面临的困境及其内外部影响因素, 探讨了文化传统与科学教育的互动关系, 并从文化哲学的视域来审视科学教育中存在的问题
以碘作催化剂,无水苯为溶剂,六乙基亚磷酰三胺依次与羟乙基替加氟、1-芳硒基甘油及硫反应,得中间体硒代环甘油磷脂替加氟缀合物2a~2f.以无水N,N-二甲基甲酰胺(DMF)作溶剂,室温下
以二甲酰亚胺钾3a-3g与2-氯-5-氯甲基吡啶的N原子氧化后得到的2-氯-1-氧-5-氯甲基吡啶发生亲核取代反应,用传统和微波两种方法合成了7种未见文献报到的化合物N-(2-氯-1-氧.5-吡
规律是个奇妙的东西,世间万物无不在遵循着规律变化。口才教学亦应该遵循规律。中华口才是针对幼儿园小学阶段的少年儿童所设计的课程。它是根据不同年龄阶段儿童的认知特点,
目的:探讨超声对子宫肌瘤的诊断价值。方法:对20例B超诊断为子宫肌瘤且有手术结果证实的病例报告进行分析。结果:20例患者中浆膜下肌瘤6例,符合率为83.3%,肌壁间肌瘤10例,符