论文部分内容阅读
随着互联网技术的快速发展,人类的生活质量不断提高。于此同时,所产生的信息数据也在以指数级的速度增长。在这样的情况下,大数据的概念孕育而生,意味着我们可以采用它所提供的理论与技术来处理海量数据,为人民群众提供更好的服务,同时促进市场经济的快速发展与升级。现在很多科学领域中问题的求解已发展成为大数据的处理,例如气象数据挖掘与气象预测、互联网文本文件和搜索索引处理、天文学研究、基因重组、军事侦察以及大规模应急设施选址问题求解等。在这些领域中有相当一部分问题可以采用遗传算法进行求解,然而因为要处理的数据信息规模要比以往处理的数据量规模大的多,传统的遗传算法求解这些问题的方法和技术已不能满足现在的要求。云计算的出现为大数据处理提供了新的生机,其中Hadoop成为大数据处理很好的解决方案。针对大数据环境下可用遗传算法求解的这些问题,在云计算环境下研究遗传算法有着深远的意义。为适应社会发展需要,许多科研专家进行相关理论研究与学习,提出了在云计算环境下用遗传算法求解大数据问题的思想和方法理论。然而这些思想和方法理论的研究还处于前沿阶段,需要进一步的实践去改进和完善这些理论。因此,在云计算环境下进一步研究遗传算法求解大数据问题的相关理论和方法,具有重大的应用价值和现实意义。本文首先查阅了国内外现有遗传算法在Hadoop云计算平台上的实现原理、实现模型以及对应各自的实现。总结出现有遗传算法在Hadoop上的实现策略主要分为纵向策略与横向策略。然后深入研究和分析现有纵向策略的遗传算法实现模型和横向策略的遗传算法实现模型、设计原则以及实现所采用的技术方案。最后分析纵向策略和横向策略的遗传算法实现模型各自的优缺点。在此基础上针对各自的不足,提出了论文改进的遗传算法在Hadoop上的实现模型,进行了详细设计,给出了通用的实现步骤;设计了改进的实现模型各阶段交互所采用的数据结构;搭建小型Hadoop云计算平台作为实验平台,通过实验数据验证本论文提出的改进遗传算法在Hadoop平台上的实现模型;通过实验结果分析表明本论文改进的遗传算法在Hadoop上的实现模型是正确的,且是有效的,达到了论文研究的预期目的。最后将本论文改进的遗传算法在Hadoop上实现模型应用于应急设施选址问题的求解,进一步验证本论文改进模型的正确性,以及其在工程应用中的价值和现实意义。