【摘 要】
:
k-近邻(KNN)算法是一种有效的多分类算法,它具有简单、稳定的特点,在数据挖掘领域得到了广泛的应用。但是它有两个主要缺点,一是算法的准确度与k值有很大关系,不同的k值会导
【机 构】
:
太原理工大学信息工程学院; 山西大学自动化系;
【基金项目】
:
国家自然科学基金资助项目(61402319、61403273);山西省自然科学基金项目(No.2014021022-4)
论文部分内容阅读
k-近邻(KNN)算法是一种有效的多分类算法,它具有简单、稳定的特点,在数据挖掘领域得到了广泛的应用。但是它有两个主要缺点,一是算法的准确度与k值有很大关系,不同的k值会导致准确率有很大的不同;二是它属于非增量式算法,随着数据量的增加,算法的分类速度会越来越慢,影响了它在海量数据分析中的应用。三支决策的主要思想是将整体分成三个独立的部分,引入了不承诺的决策选项,规避了错误接受或者错误拒绝的损失。本文把三支决策思想引入KNN算法,对边界域样本特殊处理,减小分类代价,提高了海量数据处理的正确性,同时对KNN算法进行改进,提出了一个基于KNN算法的增量式算法,提高了算法的快速性。
其他文献
自从中小学教育实行新课改以来,每个商家都在抓契机,寻找更好的发展机遇。因此也就出现了市面上林林总总的教辅图书。教辅类图书因具有出版周期较短、用量较大、市场风险小、回款有保证、成本低等特点,成为一些出版社获取利润的主要产品,成为出版社拉动经济增长的支柱性出版物。在这种情况下,一些教辅编辑为“抢饭碗、占市场”,在短期内“剪刀+浆糊”策划、编辑、出版大批的教辅图书,直接导致了教辅图书粗制滥造、质量低下现
抗生素(antibiotic)是指由微生物(包括细菌、真菌及放线菌属)产生,能抑制或杀灭其他微生物的物质,是20世纪最重要的医学发现之一。然而抗生素引起的副作用不容忽视,早在20世纪50年代
慢性盆腔炎病情顽固,部分为急性盆腔炎遗留的病理改变,并无病原体,抗生素治疗无明显效果,当机体抵抗力下降时,可急性发作。2003—11~2005—03,我们运用加味升带汤治疗慢性盆腔炎156
<正>本刊讯圣诞、新年、春节接踵而至,如何为孩子选购礼物也成为一个话题,亚马逊中国数据显示,人们喜欢通过书籍向孩子表达祝福以及期望。2014年12月少儿书在整体图书销量中
深化供销合作社综合改革要实现"五个突破":在深化社有企业改革上取得实质性突破;在当好农村商品流通的主力军上取得实质性突破;在基层社重组改造上取得实质性突破;在引领农民专