聚类分类算法研究及其应用

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:baby_say
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类和分类是当前计算机人工智能领域的研究热点之一。人们渴望快速而准确地获取并处理信息,可是互联网上数据不但数量庞大,而且结构各异。信息自动聚类和分类技术,成为充分利用互联网资源的有效途径。本文首先综述了现有的聚类和分类技术,分析了具有代表性的聚类和分类算法。随后从两个方面来改进现有的分类和聚类工作。第一,如何提高现有聚类算法对海量信息处理的能力。在这一方面本文提出了一种并行聚类算法,该算法构建在MapReduce并行框架上,使原本内存消耗大、计算复杂度高的聚类算法得以通过分布式计算框架直接应用于大规模数据聚类;第二,如何有效利用用户已标注信息和未标注数据来提高分类精度。在这一方面本文提出了一种基于图模型的半监督分类方法,这种分类方法不但利用已标注样本点的判别信息,而且整合了未标注样本的数据分布。实验证明,与传统支持向量机和线性判别分析等分类算法相比,这种分类方法大多数时候能获得更高分类精度。
其他文献
随着智能电器、移动手持设备和各种专用设备的广泛应用以及嵌入式处理器、嵌入式软硬件系统的发展,嵌入式技术已经成为当前的一项热门技术。特别是随着嵌入式技术在各种消费
范畴三段论推理是演绎推理的基础,也是哲学、逻辑学、心理学、认知科学和人工智能等所感兴趣的研究领域。推理形式上,心理学对范畴三段论推理的研究揭示出范畴三段论推理第一格
计算机网络技术的发展使得网上信息资源快速膨胀,并具备了传统信息所没有的海量、分布性、变化快、无结构化等特点。这些特点的出现向人们利用信息的能力提出了挑战。目前人们
膜系统的基本模型由膜结构组成,膜结构又由一些细胞膜构成,它们分层地嵌套在称为皮肤的主膜里,我们一般用广义表来表示膜结构。膜划分区域,并包含了一些物质在里面,每种物质通常不
近些年随着农业信息化的不断推进,越来越多的信息技术被引入到农业生产中去。如何实现水稻高产、稳产的目标,成为现代农业研究方向的一个重要课题。近几年物联网技术得到快速
在嵌入式系统飞速发展的今天,各种嵌入式系统正广泛应用于生产和生活的各个领域。面对嵌入式系统功能的复杂化,对性能要求、功耗要求的不断提高,越来越多的嵌入式应用需要基于异
随着计算机技术的发展,社会信息化程度的不断提高,计算机水平成为考核个人能力的一个重要标志,计算机考试也已经深入到每一个行业。尤其在教育行业中,传统手工阅卷已经逐渐走向计
移动Ad Hoc网络是一种不需要基础设施的多跳无线网络,网络中的节点既具有无线终端的收发功能又具有为其它节点转发信息的功能。网络中所有节点地位平等、功能相同,没有中心控
嵌入式系统的应用越来越广泛,随着嵌入式系统与网络的日益结合,在嵌入式实时操作系统中引入TCP/IP协议栈,以支持嵌入式设备接入网络,成为嵌入式领域重要的研究方向。作为嵌入
当前,嵌入式系统已经成为人们生活中的一部分。可以在很多应用中找到它们,如家用电器、工业设备、医疗设备、通信设备以及汽车应用等。有些嵌入式系统位于远离其使用者或操作者