基于ILP的多关系关联规则数据挖掘(MRDM)算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:joiner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于属性-值的学习方法的命题化算法是关联规则挖掘算法的的传统方法,即,每一个事实都以的(属性,值)元组形式表示。这种表示形式中,属性种类是固定的,每个属性有一个给定的值与之对应,所以数据集可以被看做关系数据库中的一个表或关系。表中的每一行对应于一个样例,而每一列对应于一个属性。实际情况是,关系数据库为了有效地组织和访问数据,数据表结构复杂,且以多关系的形式组织。关系数据库中的结构表达了位于不同关系中的元组间的联系,而这种联系体现了问题域中某些重要的背景知识和样例信息的结构内容。属性-值学习方法只适应单表无法直接利用这类联系及其蕴涵的信息内容,因而无法发现数据库中隐藏的复杂模式。虽然在理论上多个关系表可以转化到一个单表中,但事实上有许多实际问题无法避免。归纳逻辑程序设计(InductiveLogicProgramming,简记为ILP)是机器学习与逻辑程序设计的交叉领域,以ILP为基础的多关系数据挖掘,致力于发现关系数据库中涉及多个关系的复杂模式。多关系数据挖掘可以直接在多个关系表上分析数据而无需向单一数据表的转换。由于其模式表示语言采用了一阶谓词逻辑语言,与命题逻辑语言相比表达力更强,能够表达更复杂的模式并方便的利用背景(领域)知识,应用也更为广泛,基于ILP的多关系数据挖掘成为目前研究的热点。本文比较系统和完整的介绍和分析了多关系关联规则挖掘的理论基础和相关研究,主要工作如下:①综合前人的工作,根据相关的文献,综述了多关系关联规则相关概念、性质、挖掘方法、面临的主要问题;②研究了数据挖掘的经典算法Apriori和FP-增长、并根据相关文献,结合自身研究,分析了算法的提出、特点和算法步骤,并对的功能进行了分析。③研究了ILP技术的定义、形式化描述以及PROLOG语言的理论基础及运行机制。④分析了多关系关联规则代表性算法WARMR和FARMER,并分析其优缺点,并简单介绍了WARMR的拓展算法WARMeR。⑤通过实验平台,对经典算法Apriori进行了实现,并提出了改进措施,同时通过PROLOG实现了事实和规则的推理,分析了FARMER算法的实现基础,实现了WARMR算法,并挖掘出关联规则。
其他文献
我国是世界上最大的纺织品生产和出口国。过去对纺织品中纤维种类的鉴别往往依靠人工劳动,其操作步骤复杂,工作效率低,同时掺杂了人的主观因素,容易造成鉴别错误,所以,用计算
虚拟现实技术在这些年来的发展速度十分惊人,三维可视化技术被广泛地应在了许多的领域,例如计算机仿真。它能对真实世界进行三维模拟,使用户在获取信息方面变得更加轻松和直
随着我国高等教育的发展,大部分高校逐渐采用学分制教学管理模式。作为学校管理的重要环节,就业管理和服务必须与该模式相一致以协调发展。同时随着信息时代的到来和Internet
Gabor变换作为信号的一种联合时频分析工具,克服了傅里叶变换不能准确地描述一个信号的频率随时间变化情况的缺点。早在1946年,Dennis Gabor将作为傅里叶变换核的复指数函数
在康复医疗领域,现在主要以人工和机器人辅助训练两种康复方法,人工辅助训练是康复教练一对一的对病患进行康复训练的指导,但现实中往往医疗资源匮乏,机器人辅助方式又会有造
随着互联网的高速发展,其信息量和用户数也在飞速增长,人们逐渐步入了信息过载时代,信息过滤的推荐技术应运而生。近年来推荐技术在学术界成为研究热点,在工业界得到了广泛应
数据挖掘的提出和发展是最近十几年的事情,不过现实的需要使得其发展速度非常迅速。数据挖掘技术是通过计算机技术,在多个学科的知识和技术基础上,从大量的实际数据中,分析挖
PLC(Programmable Logic Controller)是一种工业自动控制设备。PLC运行语句表,然后利用I/O装置的输出电压信号控制外部机械或设备的操作。PLC具有适应面广、使用方便、可靠性高、抗干扰能力强、编程简单等特点。软件PLC提供了与硬PLC相同的功能。软PLC也提供了PC环境特有的各种优点。软PLC是一种基于PC机开发结构的控制系统。它具有在功能、可靠性、速度、故障查找等方
张铃教授和张钹院士在深入剖析了人工神经网络的机理后,提出构造性学习理论和方法,获得了成功。构造性机器学习方法是利用球形映射将神经元变换成对有限空间划分的分类器,正
近年来,随着计算机科技的迅猛发展,计算机科技中的各种新技术、新理论、新算法不断涌现,涉及范围越来越广,作为图像的识别、运算与处理基础的图像配准技术也在快速发展中。对两幅