基于负关联规则的Web使用挖掘的技术研究

来源 :山东轻工业学院 齐鲁工业大学 | 被引量 : 0次 | 上传用户:ioljok1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘中的重要内容之一,旨在发现大量数据中项集之间的关联或相关关系。将关联规则挖掘技术应用于Web使用挖掘中,可以更有效地组织和管理网站,找出站点用户感兴趣的页面,实时向这些用户推荐,以便满足用户的个性化的需求等。但是,目前大多研究人员在Web使用挖掘中仅仅涉及到了正关联规则挖掘,而较少涉及负关联规则。负关联规则可以发现项集之间的负关联关系,是对正关联规则挖掘技术的有效补充,将负关联规则挖掘技术应用于Web使用挖掘,就可以发现那些负相关的Web页面,从而提高Web使用挖掘的准确性。然而,如何把负关联规则应用于Web使用挖掘还是一个新问题,为此,本文对这一问题进行了讨论,并提出了一种基于正负关联规则的Web使用挖掘的方法。本文介绍了数据挖掘、Web数据挖掘和Web使用挖掘与它们的相关概念和技术,并进行了讨论,重点介绍了Web使用挖掘的关键技术、研究现状及研究难点,随后又介绍了正负关联规则,重点分析了负关联规则的相关技术及发展现状;研究了基于正关联规则(A=>B这种规则形式)的Web使用挖掘的相关技术,总结了研究现状;在前面分析的基础上,我们对于基于正关联规则的Web使用挖掘研究的比较多,而对基于负关联规则(形如A=>(?)B、(?)A=>B、(?)A=>(?)B的规则)的Web使用挖掘关注较少,事实上,同时挖掘出正负关联规则,可以提高Web使用挖掘的准确率,本文通过实验验证了其准确性,弥补了只研究基于正关联规则Web使用挖掘所带来的不足。
其他文献
电力的安全运营是其他行业正常运转的基本保障,为了保证电力供应,需要对电力供应相关的备品进行储备。电力行业的分散布局决定了备品分散在各个执行机构不能集中储备,由于没有面向全局的规划储备方案,备品大量重复储备,占用大量流动资金并消耗大量保管费用。同时由于设计时没有统一规划,使得备品信息成为‘数据孤岛’,备品储备信息无法共享,在应急维修中不能快速的找到相邻单位的空余设备来完成紧急任务。为了降低运营成本,
近年来,计算机犯罪一直是有增无减,严重影响到社会的安定,计算机取证是有效打击计算机犯罪的重要手段,其关键在于保证提取的电子证据具有法律认可的证明力。   与传统证据相比
语音合成技术是人机交互研究中比较重要的技术之一,并且已经应用到了社会生活的许多领域。语料库构建技术作为语音合成技术开发中的一个重要模块也受到研究人员的普遍关注。
当今社会随着人们生活水平的提高以及生活习惯、饮食习惯的改变,肿瘤的发病率和死亡率在不断上升,已成为威胁人类健康的最主要疾病。肿瘤早期的诊断和个性化治疗是减少肿瘤患
神经外科导航系统(Neurosurgery Navigation System)是现代影像技术、立体定向技术与先进的计算机技术相结合的产物,它的主要功能包括:在术前通过手术规划与模拟,可以减少手术
随着遥感影像的空间分辨率不断提高,传统的基于像素的信息提取技术已不能很好地提取影像中的土地信息,它产生的专题图中土地完整性差并且混分、错分现象严重,同时无法解决“同谱异物”与“同物异谱”的问题。根据高分辨率遥感影像的特点,本文以对象为最小的操作单元进行农村地区土地信息提取,对象通过影像分割得到。针对现有的对象分割技术在分割过程中出现的精度缺陷与自动化程度低等问题,提出了一种基于多特征数据融合与对象
GCC是GNU中的旗舰产品,也是开源世界的重量级产品,大多数开源产品都是基于这个编译器的。GCC是一个编译器的集合,其中的C++编译器就是G++。GCC采用前端、后端相结合的方式,前
剪接体内含子的发现已有30余年,但目前对其进化机制和进化动力学的了解很贫乏。学术界对内含子的进化问题一直存在争议,其中之一就是内含子得失率。内含子的进化研究方法常是用
无线传感器网络作为进化计算中崭新的一章,已经被证明了对诸多的领域,如国防安全、监控、环境监测、农业、以及医疗,起到了巨大的推动作用。由于它在物理世界以及数字世界之间的