基于WEB日志挖掘的个性化服务相关技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:quan777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息量“爆炸式”地增长,传统被动的网络信息提供方式越来越难以满足用户需求,出现了所谓“信息过载”和“信息迷航”问题。个性化服务是顺应用户个性化需求的产物,能够将用户感兴趣的信息主动推荐给用户,并且随着用户需求的不断变化而发展。个性化服务已成为未来信息服务发展的趋势。 Web日志中含有用户请求页面的地址、页面停留时间和页面访问顺序等信息,通过Web日志挖掘可以自动获得相关页面、相似用户群体和用户访问模式等信息,从而能降低用户负担,实现主动地信息推荐。Web日志挖掘已经成为实现个性化服务的基础和必要条件。本文主要对基于Web日志挖掘的个性化服务相关技术进行了研究。 首先,研究了个性化服务中的用户模型。在分析传统向量空间模型表示法的不足基础上,提出基于目录结构的向量空间模型表示法,结合手工定制建模和自动用户建模提出了交互式用户建模,聚类分析中,改进了凝聚层次聚类方法,提高了其执行效率。其次,给出了在本文提出的用户模型基础上个性化混合推荐的算法及实现,实验分析表明混合推荐具有基于内容推荐和协作推荐的优点,有更好的推荐性能。最后,实现了基于目录结构的个性化推荐系统原型,并通过实验分析证明了该系统的可行性和有效性。
其他文献
在逆向工程应用中,由于样件局部遮挡或者测量手段的限制,通过测量所获得的原始点云数据往往存在数据缺失而形成孔洞。因而在孔洞点云数据的曲面重构中,需要对孔洞进行修补以
随着互联网的飞速发展及企业信息化水平的提高,数据的产生量和积累量呈指数增长,如何利用好、管理好海量数据,已成为影响企业决策,驱动价值增长的重要环节。MapReduce模型作为大
RFID(Radio Frequency Identification)射频识别技术,是一种非接触式的自动识别技术,它通过射频信号自动识别目标物体并获取目标数据信息,识别工作无须人工干预,可在各种恶劣
中文命名实体的语义关系抽取是关系抽取的一个重要研究方向。由于中文文本具有不同于英文文本的一些特有的语法特点,中文命名实体的语义关系抽取研究发展一直较为缓慢。中文
维基百科,作为最著名的Web 2.0应用之一,在大批志愿者的协作编辑下,逐渐成为世界上最大的免费在线百科全书。维基百科中的内容和文章组织方式使其成为一个方便的在线知识门户
频域分析又称谱分析,主要研究信号在频率域中的各种特征。而功率谱的分析与估计在许多工程应用中是十分重要的。本论文探究了几个概率性能和稳定分布重尾的指数评估,这是定期变
核酸序列分析是生物信息学应用中的一个重要方面。生物信息绝大部分以基因的形式贮存在DNA分子中,这些信息以不同的核苷酸排列顺序编码在DNA分子上,如果核苷酸的排列顺序发生改
高层体系结构HLA是目前分布交互仿真领域最新的通用技术框架,有关HLA的研究和应用是目前分布交互仿真的主流。HLA解决了仿真领域的两个关键问题:仿真应用之间的互操作性和模
信息安全是信息科学领域的基础,数字签名技术是信息安全领域的重要技术。数字签名技术能够保证信息的可认证性、完整性和不可否认性,在电子商务和在线交易繁荣发展的今天已经
意见文摘作为自然语言处理和意见挖掘领域的一个研究热点,其目标是将散落在不同意见文本中的各种意见信息聚集在一起,进而产生精简的文本摘要。意见文摘不仅在问答系统、意见