论文部分内容阅读
新信息、新产品、新服务每天都在不断被推上web,同时,用户的种类、数量和关注点也在增加。一方面,用户已经疲于以“大海捞针”的方式搜寻信息,另一方面web网上的服务商也在不断设法获取用户的兴趣爱好,以填补用户和网站之间的信息鸿沟。个人化技术就是基于这种需要产生的。 传统个人化技术(如CF技术、基于内容过滤技术)中存在着一些限制,如处理大数据量的能力差、依赖于用户的登记信息,产生的用户使用视图是静态的、不能获取web对象之间丰富的语义联系等。为解决传统技术中出现的这些问题,一些研究提出将web使用日志的挖掘应用到个人化技术中。Web使用记录的挖掘虽然有诸多的优点,却不能适应用户的使用信息较难获取及站点内容经常变化的情况。为了使个人化系统更有效,我们需要将web使用记录的挖掘与web内容挖掘集成到同一个结构中,由推荐引擎以统一的方式使用他们。 本文提出了一个基于关联规则挖掘的个人化技术,它使用概念格(concept lattice)作为存储频繁页面集的数据结构。我们将讨论如何利用这个结构实时地为当前用户产生推荐集,以及这个结构与web语义内容相结合的优势。 将概念格作为存储频繁页面集的数据结构,一方面是由于概念格关于两个集合之间关系的描述有助于发现页面集合基于用户使用而产生的语义关联。另一方面,概念格与当前流行的web本体语言只有同构性,可以方便地将站点的内容信息与用户的使用信息结合到同一个挖掘结构中。