【摘 要】
:
伴随着信息产业的高速发展,当人们面对海量的数据信息时希望通过对数据进行更深层次的分析,以便挖掘出大量隐藏在数据背后的重要信息。但传统的数据管理方法不但无法发现数据
论文部分内容阅读
伴随着信息产业的高速发展,当人们面对海量的数据信息时希望通过对数据进行更深层次的分析,以便挖掘出大量隐藏在数据背后的重要信息。但传统的数据管理方法不但无法发现数据之间存在的联系和规则,而且也无法依据已有的数据来预测数据未来的发展趋势,这就直接导致了“数据爆炸”和“知识贫乏"这两种现象同时发生。于是人们不得不去寻找一种新的方法或技术来智能地、自动地和有效地将现有的数据转化处理为有用的信息和知识。Web数据挖掘技术就在这种大背景下应运而生并逐渐发展起来。本文分析了Web数据挖掘技术的研究现状,对不同的挖掘方法分析了它们的优缺点,得出Web数据挖掘技术的发展趋势,了解Web数据挖掘及其相关的基本概念和基本技术,为课题的研究奠定理论基石。通过研究模糊集理论和关联规则挖掘算法的基本概念、定义及方法,分析了现有的一些关联规则挖掘算法的优点和不足,针对单纯的关联规则挖掘算法在进行挖掘时容易产生划分边界过硬的问题,通过引入模糊集理论并利用模糊集理论的性质来软化边界,并在一种现有的挖掘加权频繁项集算法(Mining Weighted Frequent Itemsets,MWFI)的基础上进行改进,提出挖掘模糊加权频繁项集算法(Mining Fuzzy Weighted Frequent Itemsets,MFWFI)。通过设计实验来验证改进的可行性,并通过对实验结果数据的分析来评价MFWFI算法的性能。结果表明,改进算法不但比原算法的运行时间要短,而且随着记录数量的不断增大这种优势就更加的明显。
其他文献
随着社会的不断进步,科学技术的发展在当今社会已经显得越来越重要,科技的发展程度代表一个国家的综合实力。计算机视觉正是科学技术的一个重要领域,与人们的生活息息相关,是
近年来,随着计算机网络技术的迅猛发展,网络安全问题也越来越突出。入侵检测作为信息安全保障体系中不可缺少的重要环节,成为信息安全研究领域的热点之一。免疫系统与入侵检
无线Mesh网络(Wireless Mesh Networks,WMN)因能为最后一公里的宽带接入提供高性能和低成本的解决方案而越来越受到关注和发展。WMN是一种高速率、高容量的分布式网络,支持节
分布式光纤测温系统可以在一根光纤上同时监测多点的温度,并可以利用光时域反射技术对温度场进行空间定位。在许多特定的环境场合下,要求同时监测大量位置甚至是沿着长距离位
随着信息技术的快速发展,图像处理技术也越来越普遍。作为计算机视觉、心理学和神经生物学的交叉学科,图像显著性检测近些年引起了众多研究者们的兴趣,并取得了很大的研究进
遗传算法采用的是群体搜索技术,通过模拟自然界的进化规律,对当前的群体进行选择、交叉和变异等操作,生成一个新的群体并使群体向包含或者接近最优解的状态逐步靠近。由于其
肝脏是人体生命活动的最大内脏器官,是消化系统中最大的消化腺,是新陈代谢的重要器官,但是肝脏的脆弱性使得肝脏疾病的发病率非常高。据统计全国总人口的10%是乙肝病毒携带者
多种物品联合补充库存策略指对从同一供应商订购的多种物品进行联合订购决策,补充库存,以减少年总订购次数,获得数量折扣,节约库存控制费用,降低物品成本的一种库存控制策略。当一
视频监控作为现代城市的一种社会事务管理手段,在生活中得到了广泛地运用。传统的监控模式存在许多弊端,因此监控中的智能视频分析技术仍然有很大的进步空间。在智能视频分析
随着微电子和计算机技术的飞速发展,嵌入式系统被应用到众多领域。嵌入式已经成为整个信息产业中的耀眼明星,所以各大公司也都推出了适合各种应用的处理器来抢占嵌入式芯片市