论文部分内容阅读
数据挖掘技术是20世纪90年代中期兴起的一种新的信息处理技术,其主要特点是对数据库中的大量业务数据进行抽取、转换、分析,从中提取辅助商业决策的信息。数据挖掘能够从海量的商业交易信息数据中发现一些未知的、有价值的规律,帮助企业有意识地将这些规律利用到企业管理中去,从而提高企业管理效率,增强企业竞争力。 关联规则的发现是数据挖掘中的一项重要任务。关联规则表示数据库中一组对象之间某种关联关系的规则,其简单表现形式是:X(?)Y,X称为规则的前提,Y是规则的结果。对于一个关联规则通常用两个标准来衡量,支持度(support)和置信度(confidence)。挖掘关联规则就是找到这样的规则:它的支持度和置信度分别大于事先指定的最小支持度和最小置信度指标。挖掘过程最主要的一步是找出所有的频繁项目集,这些频繁项目集的支持率不低于预先设定的最小值,Apriori算法是一种经典的寻找频繁项集的算法。 期货交易,是商品交换的一种高级形式。随着市场经济的发展和成熟,作为一种现代投资手段在当今世界经济中的地位和作用正日益加剧。期货公司在经营活动中每天需要对客户的期货交易进行结算,积累了大量的期货交易数据,充分利用这些期货交易数据,挖掘出这些信息背后隐藏着的一些关联规则,以帮助期货公司在客户开发,交易指导,风险控制等方面做的更好,是一项极有意义的工作。但由于中国期货市场发展的不完善、期货公司的能力有限、交易数据的保密性等种种因素,目前在公开资料中基本找不到这方面的研究成果。 本文着眼于数据挖掘技术在期货交易中的应用,主要研究期货交易信息中的关联规则挖掘,主要工作包括: 1、研究了经典的Apriori算法,从提高算法效率的角度从两个方面对算法进行了改进,第一:减少需要扫描的交易数据;第二:减少生成候选项集的时间。 2、对期货公司交易结算系统中大量的期货交易信息进行了分析,选取了最能反映客户交易状况、对期货公司管理起主要作用的客户资金、手续费、风险度和盈亏等四个主要指标。并根据指标的具体含义、在期货交易中的作用方法以及期货公司的一般习惯对指标进行了处理与分类,使之更符合期货公司管理的实际需求。 3、根据改进的算法,结合期货公司管理的实际需求,设计了基于关联规则的期货交