基于概念格的Web使用日志挖掘及其在个人化技术中的应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:wangxin3163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新信息、新产品、新服务每天都在不断被推上web,同时,用户的种类、数量和关注点也在增加。一方面,用户已经疲于以“大海捞针”的方式搜寻信息,另一方面web网上的服务商也在不断设法获取用户的兴趣爱好,以填补用户和网站之间的信息鸿沟。个人化技术就是基于这种需要产生的。 传统个人化技术(如CF技术、基于内容过滤技术)中存在着一些限制,如处理大数据量的能力差、依赖于用户的登记信息,产生的用户使用视图是静态的、不能获取web对象之间丰富的语义联系等。为解决传统技术中出现的这些问题,一些研究提出将web使用日志的挖掘应用到个人化技术中。Web使用记录的挖掘虽然有诸多的优点,却不能适应用户的使用信息较难获取及站点内容经常变化的情况。为了使个人化系统更有效,我们需要将web使用记录的挖掘与web内容挖掘集成到同一个结构中,由推荐引擎以统一的方式使用他们。 本文提出了一个基于关联规则挖掘的个人化技术,它使用概念格(concept lattice)作为存储频繁页面集的数据结构。我们将讨论如何利用这个结构实时地为当前用户产生推荐集,以及这个结构与web语义内容相结合的优势。 将概念格作为存储频繁页面集的数据结构,一方面是由于概念格关于两个集合之间关系的描述有助于发现页面集合基于用户使用而产生的语义关联。另一方面,概念格与当前流行的web本体语言只有同构性,可以方便地将站点的内容信息与用户的使用信息结合到同一个挖掘结构中。
其他文献
对于建立在数据仓库之上的决策支持系统,数据的正确性对避免错误的决策是至关重要的,错误的数据将会导致"垃圾进,垃圾出".因此在构建数据仓库时,必须对各种异质数据源进行数
针对Internet和Web媒体的不可预见性所导致的Web应用测试上的困难,该文在对现有的Web应用测试工具和相关测试方法研究的基础上,提出了一种Web应用的自支化测试系统的ROTS.文
随着多媒体技术和计算机技术飞速发展,多媒体CAI广泛应用在现代化教育中,已成为重要的教学手段之一.又由于网络技术和通信技术的进一步发展,将CAI与计算机网络相结合,这就是
该文在研究了现有入侵检测系统和代理技术的基础上,提出一种基于移动代理的入侵检测系统模型,利用移动代理的移动性、灵活性、适应性、跨平台性、代码可重用等特性以克服目前
该论文所设计的应用服务器完全遵循SUN公司的J2EE规范标准,支持多种工业标准和界面引擎,各功能模块均以组件的形式给出,具有良好的可扩展性和与其它产品的兼容性.由于采用JAV
该文在考察了国外相关技术的基础上,设计了基于GPS的车辆监控系统,它由车载GPS信号接收/控制终端(简称车载终端)、通讯网络和监控中心组成,并经比较,选取GSM数字蜂窝移动通信
工作流技术是进入90年代以后计算机领域的一个新的研究热点,使用工作流技术构建的信息管理系统可以充分支持BPR,具有很好的灵活性、良好的可扩展能力等特点。所以对工作流管理