基于WEB日志挖掘的用户兴趣模式研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:falaong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的发展催生了全新的商业模式——电子商务,由于电子商务企业的竞争只在于鼠标的点击之间,因此如何获取并维持更多的网络用户成为了各电子商务企业之间竞争的焦点。对于电子商务网站能做的就是更加深入地了解用户的兴趣,而数据来源就是Web服务器日志。通过对Web日志进行分析和研究可以找到用户感兴趣的内容从而为用户提供个性化服务;同时对网站商品进行关联分析可以找出潜在的存在关联关系的商品,从而进行“捆绑式”销售;还可以根据页面聚类分析为网站的结构调整提供依据。本文主要是针对收集的Web服务器日志数据进行分析,找到一种新的用户对所访问Web页面的兴趣度量方法,在此基础上建立一个页面兴趣矩阵,然后通过对页面兴趣矩阵进行聚类分析,得到页面聚类和用户聚类进而为网站设计提供可行的参考。由于Web日志数据通常是大量和冗余的,日志中的页面之间关系又是模糊和不确定的,为此,本文采用模糊聚类方法进行Web日志的分析研究,主要工作如下:(1)概述了Web日志挖掘的发展和技术及其理论基础。(2)在深入研究Web日志预处理技术的基础上,通过对Web日志数据进行数据分析,提出一个新的页面兴趣度量方法。(3)提出了一个二次权值离散化的模糊聚类算法,在模糊聚类的基础上改进权值,提高了页面与页面(用户与用户)之间的关联度,文中对算法具体操作作了详细的描述,并辅以实例计算。(4)在上述工作的基础上,同时结合各种关键技术,设计了一个Web日志挖掘系统,主要功能包括数据导入,数据清洗,关键词Top10图表显示以及页面聚类和用户聚类等功能,为网站结构调整提供可行的参考。
其他文献
创新是一个国家的灵魂。占企业绝大多数的中小企业是市场经济最活跃的组成部分,中小企业技术创新能力的提高,对于我国经济的发展至关重要。当今市场竞争日益激烈,中小企业创新能力薄弱,已成为经济发展的桎梏。中小企业开放式创新是企业充分利用有限的创新资源弥补自身不足,提高企业自主创新能力的有效途径之一,也是构建中国未来经济核心竞争力的手段之一。本文以研究我国中小企业开放式创新为主题,探索了外部创新源与中小企业
备件资源配置是提高售后服务绩效十分有效的工具。通过分析企业售后服务系统中的质保数据可以较为准确地获取备件可靠性信息,如平均故障间隔时间(MTBF)。本文以备件响应性和经济性为目标,综合考虑零备件使用中的MTBF等,构建基于质保数据的备件分类、预测以及库存控制模型对备件库存控制策略进行优化。引入支持向量机(SVM),创新备件管理模式。利用S公司的质保数据进行算例研究,以达到一定现实约束前提条件下提高
本文通过华北科技男排队员运动损伤的现状调查,对华北科技学院男排球队员运动损伤的预防措施和其损伤类型、损伤程度、损伤性质有了较为全面的了解,这对提高运动成绩,预防运
随着“以人为本”的理念深入民心以及服务型政府建设的提出,政府网站在线服务功能的建设和完善势在必行。近几年来,信息服务领域中体验经济已逐步发展,但如何更好地为用户提
作为历史上的真实人物李靖,他有勇有谋,功勋卓著.在历代小说、戏曲中,李靖的故事多有记载.笔者选取了李靖行雨的故事进行研究,探讨文学作品中李靖行雨的故事,及其故事背后折
在经济全球化、制造集群化、信息化的发展趋势下,复杂产品的研制面临着严峻的挑战。复杂产品制造业是国民经济和国家安全的基础,因此,提高复杂产品制造业的竞争力对一国的经济发