目标营销的数据挖掘模型和技术的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:gj12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机和Web技术为电子商务提供了一个巨大的信息平台。该平台为商家和顾客提供了便利的手段来发布和获得相关信息,使得电子商务发展迅速。同时,随着其规模的不断扩大,信息的日益膨胀,产生了信息过载的问题。对于顾客来说,很难在短时间内从商家发布的大量的产品信息中发现或找到自己感兴趣的产品;对于商家来说,也很难在如此大的市场中以尽可能小的成本找到自己产品的顾客群。目标营销策略正是为了解决此问题而提出来的。 目标营销涉及到两个对象:顾客和产品。这就引出两种目标营销策略:面向顾客的目标营销和面向产品的目标营销。面向顾客的目标营销主要是向所给定的顾客推荐该顾客最有可能购买的产品。面向产品的目标营销主要是选出最有可能购买所给定产品的顾客。如何利用计算机技术来建立目标营销系统成为工业界和学术界的热点问题。特别地,数据挖掘技术为建立目标营销系统提供了新的技术和方法;建立有效和高效的目标营销系统为数据挖掘领域提出了新的挑战。 本文将信息检索的方法和研究结果应用和扩展到目标营销系统中来研究顾客和产品的关系,并利用顾客信息、产品信息和交易信息来建立目标营销的数据挖掘模型和技术。具体研究内容如下: 1.本文提出了使用线性模型来识别目标营销系统中具有市场值的顾客或者产品。该模型假设顾客或者产品可以使用有限的属性来表示,以此为基础建立线性市场值函数来对顾客或者产品进行排序。在该模型中的线性市场值函数是顾客或者产品各个属性的效用函数的线性组合。 2.目标营销的基本任务之一为分析顾客和产品之间的关系。基于信息检索和度量理论的结果,本文提出了一个统一框架模型来分析目标营销系统中顾客和产品的关系。在该框架模型中,顾客对产品的喜好使用偏好关系来定性的表示,顾客和产品之间的关联使用市场值函数来定量的表示和度量。本文进一步讨论了此框架下的四个模型。这四个模型分别表示了顾客组与产品组之间的关系、顾客组与单个产品之间的关系、单个顾客与产品组之间的关系以及单个顾客与单个产品之间的关系。依据这四个模型,本文讨论了面向顾客的目标营销和面向产品的目标营销策略。此外,在此框架下,本文基于可获得的顾客信息、产品信息以及交易信息建立了线性和双线性的市场值函数。实验结果表明所提出的方法是有效的。 3.本文将概率推理模型应用到目标营销系统中。在概率推理模型中,顾客和产品被表示成两个命题,使用命题间的蕴涵关系来讨论顾客与产品之间的关系。从精确度和召回率两方面来分析目标营销系统中顾客和产品的关系。讨论了概率推理模型在顾客信息、产品信息以及交易信息已知的情况下的应用。 基于上面三个方面的研究内容,本文的主要贡献在于: 1.本文提出了线性模型来识别具有潜在市场值的顾客和产品。与基于规则的数据挖掘方法相比,线性模型不使用分类的方法,而是采用对顾客或者产品进行排序来识别具有潜在市场值的顾客和产品:与基于概率的方法相比,线性模型能提供属性权重和属性值的效用值等有用的信息。 2.本文提出了目标营销系统的统一框架模型。一方面,在目前国内外的研究中,面向顾客的目标营销系统和面向产品的目标营销系统是作为独立的内容分开进行研究的。本文提出的模型整合了面向顾客的目标营销系统和面向产品的目标营销系统。另一方面,目前国内外的研究注重于目标营销系统的具体算法和实验,缺少一个在概念层次上的统一框架模型来分析和总结现有的算法,并对进一步的工作进行指导。本文则以顾客偏好关系为基础在概念层次上研究顾客和产品之间的关系,并建立了目标营销系统统一框架模型。该模型具有一定的通用性,它不仅从概念层次上囊括了现有的目标营销算法模型,而且扩展了目标营销系统中新的研究方向。此外,本文提出的框架模型充分利用了顾客信息、产品信息和交易信息,弥补了现行大多方法中只使用交易信息的缺陷。 3.本文将概率推理模型扩展到目标营销问题中。在该模型中,从精确度和召回率方面来分析目标营销中顾客和产品的关系。根据所获得的信息不同,朴素贝叶斯方法和潜在语义模型等可以被认为是该概率推理模型的特例。
其他文献
密钥生成是密钥管理的研究内容,密钥安全是一切安全密码系统的基础,在执行密码协议前必须先生成密钥。为了进行分布式计算等操作,我们需要提高密钥生成的效率,基于椭圆曲线密码系
移动自组网络,又称为移动Ad Hoc网络,因其无需预设网络设施、可快速组网、抗毁性强的特性,使其成为数字战场通信的首选。然而由于移动自组网的固有特性,使得这种网络更容易遭到安
为了解决搜索引擎中的语义不匹配问题,本文在总结信息检索中查询扩展技术基础上,将基于词表的查询扩展技术引入到主题搜索引擎中。由于主题搜索引擎处理的是Web页面集,主题词库
传统的Internet网络基于TCP/IP协议,基于TCP/IP协议的数据访问需要底层的物理链路具有持续的端到端连接,往返延时短,数据传输速率对称,误码率低。随着移动设备和无线网络技术的发
随着互联网的快速发展,网络信息量呈现出快速增长的趋势。人们当前所面临的问题是,如何从当前的海量数据中获取有价值的信息。奇异值分解(SVD)技术在信息分析应用方面表现出强大
由于数据流的不可预测性、突发性、大量性和持续性,而系统资源的有限性,使得在运行过程中数据流系统常出现过载的问题,这样必然会造成处理延迟,不能满足实时性要求。在此种情
随着21世纪科技的不断发展,人类已经逐步跨入了信息时代。计算机及其网络技术的兴起并且进入建筑领域,给人类的居住方式带来了一场革命。特别是近年来现代高科技和信息技术的不
无线局域网(WLAN)由于具有安装便捷、使用灵活及易于扩展等优点,逐渐在变动频繁以及不便布线的环境中成为最佳的网络部署方案,广泛应用于学校、机场及流动办公等场合。而性能良
对等网络(peer to peer)是一种用于信息共享的网络架构,在这种架构中,各节点既是网络服务提供者-服务器,又是网络服务申请者-工作站,即每台计算机都具有相同的功能,无主从之分。由
基于内容的图像检索是当前多媒体技术和人工智能的热点课题之一,它直接对图像内容(如图像的颜色、形状、纹理、背景等)进行分析,并对图像特征进行合理的描述,使得检索与分类