基于J2EE的数据挖掘系统的构建及聚类技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:by_huang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和存储能力的提高,越来越多的数据被存储起来,而如何在这些海量的数据中寻找真正所需要的知识显得尤为重要。数据挖掘作为一个多学科的交叉学科,能够在海量数据中发现有用的模式和规则,是将数据转化为知识的重要手段。聚类技术作为数据挖掘的一个研究热点,可以作为独立工具发现数据结构,也可以作为其它方法的预处理手段以得到更好的聚类。本文利用J2EE技术构建了一个基于Web的数据挖掘系统,并研究了聚类技术中的K-Means算法和DBSCAN算法,取得的主要成果如下:针对当前对B/S结构数据挖掘系统的需求,有机的融合了当今比较流行且可用性很高的Spring Framework,Hibernate,JSF框架和技术,设计了具有良好人机界面的基于Web的数据挖掘系统;研究并实现了K-Means算法和DBSCAN算法,针对K-Means算法中初始质心的随机选择可能导致局部收敛的情况改进了K-Means算法,利用本文提出的方法计算初始质心能够获得较好的聚类;实现了系统中数据对象和挖掘结果的可视化,利于对数据和挖掘结果有一个直观的印象,方便观察数据结构获得领域知识和理解挖掘结果。本系统是跨平台、J2EE容器无关的,具有良好的可扩展性、易用性、可维护性和安全性的,具有高度模块化结构,实现了从大量的、不完全的、有噪声的、模糊的、随机的各种数据中提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识的功能。
其他文献
随着软件产业的不断发展,程序的规模越来越大,完全依靠手工进行测试的难度越来越大,这就需要一些辅助测试的自动化测试工具。自动化测试工具能够自动地分析项目的源程序,自动
人们对动态和无线网络环境中实现通信的需求日益增加,随着需求的增长,对网络性能提出了越来越高的要求。目前最流行的网络协议TCP笼统地认为所有丢包都是由拥塞造成的。TCP在
在"双创"新态势下,商学院是高校开展创新创业教育的主要主体。在对比国内外创新创业教育的基础上,从专业建设、课程体系、师资队伍、教学方式方法和人才培养模式等方面构建了
基于信号强度的无线局域网定位系统利用现有的无线局域网基础设施,为移动用户提供位置服务信息。同其它定位技术相比(如GPS、传感器网络等),基于信号强度的无线局域网定位系统部
随着互联网应用范围的不断扩大和计算机应用的逐年普及,人们的生活与互联网产生日益紧密的联系,计算机网络在为人们带来各种便利的同时,也存在很多的安全隐患。为了应对这些
[摘 要] 大学生创新能力的培养是社会发展的需要,关系到人才培养质量和国家发展动力。本文结合大学生创新训练项目的实践,论述了关于大学生创新能力培养的问题。基于多年指导创新训练项目的经验,分析了当今创新训练项目开展实施现状,提出了项目实践过程中所需要关注的环节和采取的措施,旨在切实提高大学生的创新能力,也为高校创新训练项目的开展提供借鉴。  [关键词] 高校创新训练项目;大学生创新能力;培养方法  
随着后PC时代的到来,嵌入式系统的应用范围日益广泛,同时Internet技术的应用也越来越普及。如何将Internet资源应用到嵌入式设备中,使人们可以方便地实现对嵌入式设备的远程监测