基于组件的数据挖掘工具的研究与实现

来源 :东华大学 | 被引量 : 2次 | 上传用户:hy1330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘,也称为数据库中的知识发现,是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程,是数据库技术、人工智能、机器学习、统计分析、模糊逻辑、模式识别、人工神经网络等多个学科相结合的产物,是当今研究的热点技术之一。数据挖掘与数据仓库的结合使得数据挖掘成为数据仓库应用中极为重要和相对独立的工具。基于组件的开发提供了一种灵活、高效的开发应用程序方法。在本文中,作者采用了组件化的思想,设计和实现了一个数据挖掘工具的原型系统,文章结构如下:(1)介绍了国内外可视化数据挖掘工具的研究背景、现状、意义,并对数据挖掘系统和相关技术的发展进行了分析与讨论;(2)分析了现阶段几个主流系统的优缺点,明确了系统的改进方向;分析了组件的实现技术;(3)描述了基于组件的数据挖掘系统的典型结构,设计了数据挖掘工具(DMTool)原型系统,包括该系统的设计原则与需求等:(4)对轻量级与重量级框架进行了综合比较,并给出数据挖掘工具原型系统技术框架选择标准,并给出了原型系统的JAVA语言编程实现。作者对本文描述的数据挖掘工具原型系统进行了仿真测试和分析,证明本文研究的技术路线和方法具有实用价值和参考性。
其他文献
Web服务是近年来蓬勃兴起的一种分布式计算模型,能够实现在不同平台、不同程序设计语言编写的应用程序或应用程序组件之间无缝的互操作。随着Web服务标准的完善和支持Web服务
嵌入式软件技术开发正面临着产品的功能要求越来越复杂,开发周期越来越短,系统硬件和软件平台的变化太快等方面的挑战;同时,问题有时不在于软件本身,而在于如何理解软件开发项目及
随着人类活动不断的改变着土地的用途,土地利用/土地覆被变化研究越来越重要。土地在不同的因素共同作用下,逐渐的改变为人类所需要的利用类型。改革开放以来,我国经济进入飞
Internet的快速增长,使web 应用成为目前最重要、最广泛的应用,需要更高性能的web 服务器提供更多用户的web 服务,因此,web 服务器面临着访问量急剧增加的压力,对其处理能力、响应
聚类是一种无监督的学习,其任务是按照给定的相似性将数据分组,使得同组数据彼此相似而不同组数据不相似。由于用来聚类的数据本身并没有类别信息,故而无法通过传统的“训练
随着我国社会经济的快速发展、城市化进程的推进、人口的大量流动,使得社会治安管理工作日趋复杂,治安状况得不到很好的改善。建立一个有效的社会治安管理视频监控系统覆盖城
随着计算机技术的日益成熟,硬件成本的迅速降低,各种结构复杂、功能强大的计算机系统被广泛应用到航空航天、交通运输、核电能源和医疗卫生等安全关键领域。一旦这些系统失效,将
本体——共享概念的明确的形式化规范说明,近年来受到信息科学领域学者的普遍亲睐,被广泛应用于知识工程、信息处理、自然语言理解及语义Web中。本体可以实现知识的共享和重
随着农业信息技术的快速发展,农业数据在快速积累和增加,对农业数据进行分类的需求也越来越多。如何将这些农业数据快速有效地转化为有价值的信息,是当前信息计算机技术领域