【摘 要】
:
本文首先对Web日志挖掘的发展现状及存在的问题进行了系统性阐述,按Web日志挖掘的流程及相关技术进行了介绍和探讨。重点分析和研究了Web日志数据预处理、聚类分析技术以及算
论文部分内容阅读
本文首先对Web日志挖掘的发展现状及存在的问题进行了系统性阐述,按Web日志挖掘的流程及相关技术进行了介绍和探讨。重点分析和研究了Web日志数据预处理、聚类分析技术以及算法等Web日志挖掘关键技术。本文较为详细地阐述了模糊聚类理论、自组织神经网络算法的基本原理。并分别就模糊多重矩阵、自组织神经网络训练和聚类算法等问题加以讨论。研究Web用户访问模式挖掘,一般都是利用单一算法,考虑用户访问页面的单一属性,使用户访问模式结果具有一定的片面性、不合理性。以此为依据,为了更好地提高Web用户访问模式挖掘的准确率,降低挖掘用户访问模式的运行时间,本文提出一种基于多重模糊矩阵_SOFM的Web用户访问模式挖掘算法,在综合考虑用户访问Web页面的多种评价因素的情况下,构造多重模糊矩阵,较好的融合多个关联SOFM神经网络对多重评价因素进行学习训练,更加准确的、科学的挖掘WEB用户访问模式,同时通过自组织神经网络实现模糊矩阵的降维操作,加快模型的运行速度,增加模型的抗干扰、抗噪声功能。实验结果表明,本文提出的多重模糊矩阵_SOFM的Web用户访问模式挖掘模型,一定程度上提高了WEB用户访问模式挖掘的精确度和运行效率,是一种良好的WEB用户访问模式挖掘方法。最后,对本文取得的成果以及不足进行了总结,并对下一步的研究工作进行了展望。
其他文献
随着网络技术的发展,网络用户与网络中流量飞速增加,需要连接网络的分布式路由器具有更快的转发速率,而IP报文在路由器FPGA (Field-Programmable Gate Array,现场可编程门阵
视频传感器网络(Video Sensor Networks)是一种由具有计算、存储和通信能力的视频传感器节点组成的分布式感知网络。节点定位是视频传感器网络进行目标识别、监控、跟踪等众
车牌自动识别系统是实现交通管理智能化的重要环节之一,研究车牌自动识别技术具有重要的实用价值。车牌自动识别系统一般包括车牌定位、字符分割和字符识别三部分。本文主要
信息检索是从信息集合中找出与用户需求相关的信息。本体作为一种表示知识的形式,具有良好的概念层次结构,支持推理功能,因此基于本体的信息检索能给检索服务性能带来极大的
随着微博用户数量的快速增长,微博的炒作现象也越来越严重。“网络水军”和“网络推手”等利用微博散布谣言及虚假信息,严重干扰了网络秩序。目前,在对微博炒作的研究方面,主
随着遥感卫星技术的发展应用,遥感图像在日常生活和军事上具有重要作用。多光谱图像具有较高的光谱分辨率,光谱信息丰富,但由于物理器件的限制,空间分辨率较低,而全色图像具
号码携带系统主要是为了提供这样一种服务,用户可以随意更换手机服务的运营商,但是原拥有的手机号码不用改变。对于运营商内部的从2G到3G的携号转网可以通过自身的升级实现,
自然景物模拟在计算机图形学占有非常重要的地位,而且自然景观的三维模拟在电脑游戏、电影特效、虚拟现实等领域中使用得越来越频繁。虚拟模拟常用的方法有分形几何方法、纹
本文介绍了作者在跨函数分析研究方面所做的工作,包括跨函数分析技术的设计与实现以及对现有DTSJava(Defect Testing System for Java)系统的改进,将跨函数分析模块与区间运
P2P网络和SIP协议都是目前互联网技术的研究热点。SIP协议凭借其简单、易于扩展等诸多长处得到了越来越多的应用,但是现有的SIP系统大多都存在“单点失效”和“性能瓶颈”等