基于MapReduce的并行模糊规则分类算法研究及应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ygp313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是模式识别和机器学习的重要研究内容之一,现已经广泛应用到了工业、商业和科研等领域。基于模糊规则的分类算法有着分类精度高、分类结果具有语义性、可解释性、容易被用户理解等优点。并行计算的出现能够极其有效的解决当前大数据环境下的传统单个计算机在面对大规模数据集时所表现出的耗费时间长,效率低下,甚至内存溢出无法处理的问题。由Google提出的MapReduce模型是一个易于开发的,可以并行处理海量数据的编程模型。它能够降低并行程序设计的复杂度,用户只需要简单设计自身要解决的并行计算任务,大大节省了设计时间,效率极高。本文提出了一种基于MapReduce模型的并行模糊规则分类算法。该算法运用并行计算的方式来提取模糊规则,并构建模糊规则分类器,使其既具有模糊系统处理不确定性方面的优势,又有MapReduce模型并行计算的能力。在实验研究部分,本文将该并行算法应用到期货自动交易平台—交易开拓者(TradeBlazer,TB)以及印刷厂的标签印刷生产任务中,主要内容如下:(1)将提出的并行算法应用在期货交易上,从期货数据中提取模糊规则,将得到的模糊规则转换为TB公式,形成交易策略,并将其应用到自动交易平台TB中,通过其在模拟交易时的盈亏状况来评判该模糊规则的可用性。实验结果表明该算法能够较有效地减少数据处理时间,具有比较好的可扩展性,所提取的模糊规则在期货交易中具有较好的收益,这也验证了该规则的可用性和有效性。提取的规则具有较好的语义性,对于投资者进行决策具有一定的指导意义,同时该方法也为期货程序化交易提供了一种新的思路。(2)将该并行算法应用到传统印刷工业的生产过程中,为标签印刷生产中的每个订单进行智能排产。利用本文所提出的算法对车间管理者根据经验为每台机器分配任务的历史数据进行模糊规则提取,构建模糊规则分类器,并根据分类器的分类结果将新的订单任务按照工序合理的安排到相应的机器上进行加工。实验结果表明该算法很好的提高了数据处理速度,提取的规则具有较好的语义表示,能够在一定程度上替代生产管理者进行订单任务分配,提高了工业印刷生产的生产效率。
其他文献
针对东海平湖油田的特点,确定了该油田A3水平井合理的完井方法是:割缝衬管先期完井和金属纤维防砂筛管后期防砂.针对割缝衬管完井方法,进行了完井参数、单根割缝衬管长度、完
薪酬管理是企业人力资源管理体系的重要组成部分,是现代企业管理制度中不可欠缺的一部分,它直接关系到一个企业能否够健康的发展。试从薪酬管理内容等角度浅析电力企业薪酬管
<正>自主创新是驱动一个国家和地区持续发展的主要动力。近年来,河南省将建设"创新型河南"作为建设资源节约型、环境友好型社会的重要支撑,将提高自主创新能力、建设创新型省
利用气相色谱-质谱法对西安市城郊典型蔬菜基地32个地下水和6个地表水样品中的多环芳烃(PAHs)进行测定,并对其分布特征、来源及健康风险进行了研究。结果表明,西安城郊地下水
<正>马克思主义认为工会是工人阶级反对资产阶级斗争发展到一定阶段的产物,是工人阶级在斗争中经历了多次失败以后而找出的"一种新的反抗形式",是同资本主义发展、阶级矛盾激
政府在在环境保护领域中具有高度责任。本文通过对相关理论的研究和对我国现行地方政府环境保护绩效考核制度的分析,总结出我国当前地方政府在环境保护工作中的问题,在环保绩
分散式污水处理作为城市集中式污水处理的有益补充,可以有效地实现处在城乡过渡地带大学校园生活污水的“零排放”。然而一些大学的决策者对污水处理工程发挥效益的认识仅限
<正>合唱是一种典型的集体艺术,整齐、统一、均衡的合唱,能培养合唱队员集体主义精神,同时,它对训练合唱队员的平衡能力、协作能力、控制能力,以及对各种音乐风格的了解有着
<正>源昌凯宾斯基大酒店工程于2009年初开工建设,用地面积13463.4m2,总建筑面积75035.78m2,其中地下室建筑面积21182.247m2,总建筑高198m,地上47层,地下2层。酒店按国际白金
提出了新增探明储量有无经济可采储量的判别方法。在此基础上,通过建立已开发油田技术可采储量经济转化率与油藏空气渗透率的相关关系式和图版,根据储层的空气渗透率,计算新增探