论文部分内容阅读
目前,大数据的营销目标为全新的海量数据作为基本,利用互联网技术进行拓展的方式。在大数据发展其营销方式过程中,主要是以互联网为基础,其中依赖更多的是平台中的大数据采集及其分析与预测能力,从而能够更好的为企业的广告投放针对性和准确性提供支持,以此为品牌企业客户带来高额利润。简而言之,大数据营销就是利用互联网技术,在最佳时间与最佳位置利用最佳的一种载体和科学化的方式与手段进行投放。本论文研究目的主要基于构建一种基于Hadoop的大数据集群,利用大数据技术对银行数据营销进行管理和开发利用进行研究。本工程硕士论文的主要工作有:第一,结合已有的大型商业银行客户营销服务管理业务,基于商业银行提出的客户营销服务作为实际的业务需求驱动,调研与分析银行客户营销服务信息化管理存在的问题及相应的解决方案,并总结与分析国内外关于银行客户营销管理的发展现状,提出论文的研究方向及具体研究内容。第二,对大数据中的关键性概念及相关的核心技术进行了分析,主要对Hadoop分布式平台和网络爬虫有关技术的实现原理进行了阐述。重点分析了HDFS分布式文件系统、MapReduce分布式计算引擎和Hive分布式数据仓库等。第三,对基于Hadoop分布式架构的银行客户营销服务管理平台的可行性分析、功能性分析、总体性设计和主要功能模块方面的设计进行了阐述。主要包括数据营销管理子系统、网络爬虫子系统及大数据分析子系统等三个方面。网络爬虫子系统包含了多线程的模块、爬虫的主要模块设计、HTTP模块的下载、抽取的每一个模块以及连接、主题的相关度判断模块等。并且对其中的开发过程中的环境、相关的依赖的软件和硬件等情况进行了分析研究。第四,最后,在系统实现基础上对基于Hadoop分布式平台大数据的银行客户数据营销管理系统进行了性能测试、安全性测试、系统运行测试等分析。