论文部分内容阅读
数据挖掘是通过对大量数据进行选择、探索和建模的过程,发现事先未知的规则和联系,得到对数据库拥有者而言清晰并且有用的结果。它的研究成果已广泛应用于金融、物流、医疗保健、零售、制造业、工程与科学等行业,给它们带来个巨额的利润和长足的发展。网络在现代社会无处不在,有具体的、有抽象的,总之在社会的各个领域影响着人们的生活。因此,本课题将对数据挖掘技术在各种网络上的应用方面进行研究,本文的研究内容主要包括以下几个方面:首先,我们对在地图上形成的网络进行了研究。借助深圳赛格导航科技股份有限公司数据库中私家车主的GPS数据,我们成功还原了由私家车主停车点所形成的网络。然后我们提出自己的数据挖掘方法,通过网络点之间的关系进行了分析,提出了判定住所准则、判定兴趣点准则和车主消费兴趣指数等基于GPS经纬度特征量的分析方法。并通过SAS软件运行中心聚类算法验证了选取GPS经纬度作为特征量的正确性。通过分析成功探索出私家车主的消费倾向,为公司带来了新的利润增长点。其次,我们对烟草物流项目中物流网络进行了研究。根据客户提出的实际需求,形成了一个多仓库、多送货点、多种产品的复杂物流网络。本人通过分析实际情况,设计出了带复杂约束条件的数学模型并通过遗传算法完成复杂网络的计算。同时根据客户的反馈信息,即时修改优化数学模型,使数学模型完全符合客户需求和客观条件。从而,成功的把数据挖掘方法应用到相对复杂和抽象的网络中。最后,我们对复杂拓扑网络转换为时间序列的问题进行了初步的研究。可视图法是一种将时间序列转换为复杂网络的快速计算方法。在文中,本人利用可视图法的思想,提出逆可视图法,实现复杂网络拓扑结构转换为时间序列的逆过程,在二者对应关系的研究中取得了初步研究成果。