【摘 要】
:
互联网和电子商务的发展,产生了大量的数据,从而导致网络资源的信息过载。当搜索引擎技术已经无法解决信息过载问题时,推荐系统应运而生。常见的推荐系统有:协同过滤推荐、基
论文部分内容阅读
互联网和电子商务的发展,产生了大量的数据,从而导致网络资源的信息过载。当搜索引擎技术已经无法解决信息过载问题时,推荐系统应运而生。常见的推荐系统有:协同过滤推荐、基于内容的推荐和基于图的推荐,但它们都存在数据稀疏和计算量大的问题,使得推荐结果不准确和实时性差。针对这些问题进行深入研究,主要工作和贡献如下:首先,针对传统K-means算法随机选择初始聚类中心,极易造成聚类结果不准确的问题,提出了一种基于最小方差和最大化最小距离的思想改进K-means算法初始聚类中心的选择方法。接着提出了一种基于用户信任关系和评分偏好的新方法度量用户之间的相似度,从而在一定程度上解决了推荐系统在计算用户相似度时面临的数据稀疏问题。其次,提出了一种改进K-means聚类的推荐方法IKC(Improved K-means Clustering Recommendation Method)。利用基于信任关系的用户相似度代替K-means算法中对象之间的欧式距离;接着用改进的K-means算法对用户进行聚类划分,把相似度较高的用户聚集到同一个子类中,然后用Top-N算法生成推荐列表。在MovieLens(1M)和Epinions数据集上的实验表明:基于IKC算法的推荐方法在相同数据集下不同数据稀疏度的平均绝对误差和均分根误差两项指标都较其他四种比较算法小,解决了数据稀疏问题;且IKC算法在相同的数据集上的执行效率也较其他四种比较算法高,解决了计算量大的问题。所以IKC算法在推荐系统的准确性和实时性方面都有很大的提高。
其他文献
近年来,随着网络技术和多媒体信息处理技术的高速发展,如何在网络环境中传输信息时保证准确的消息来源,保护多媒体信息的完整性和真实性,是当前迫切需要解决的问题之一。目前,多媒
随着数字视频的日益普及,视频编码技术显得尤为重要。帧内编码作为视频编码技术中最主要环节之一,其重要性可想而知。然而虽然近年来GPU(Graphics Processing Unit,图形处理
虹膜识别是近些年以来兴起的生物特征识别技术,已经被广泛应用在社会生活的多个领域,这种技术具有很强的生命力。本论文中,在对已经存在的虹膜定位、虹膜特征提取和特征匹配
随着计算机技术的快速发展,计算机的运算能力和计算速度都有了飞速的提高,计算模式也从基于主机的集中式到基于网络连接的分布式。计算机的应用也从最初的数值计算转向了数据
随着计算机网络的高速普及,IPv6网络已经逐渐进入了我们的视线,针对IPv6网络的攻击方法也日益增多,在众多的攻击方式中最为突出的就是针对IPv6网络传输数据的拦截、监听、篡
试验靶场对飞行中的导弹进行跟踪测量,获取数据,进行处理和分析。为了准确的测量数据,在导弹试验的发射场区和航区配置有很多的测量控制设施,并且测控站和参试的仪器大都在一些山头和视野比较开阔的海边高地。靶场环境是各种仪器,设备集中的环境,各种干扰和噪声也大量存在。对这些测量设备进行频率稳定性测量,确保参试仪器的可靠性是非常重要的工作。针对野外靶场环境对频率测量的机动、快速、自动化特殊要求,本文研究用连续
随着社会生产和经济的发展,多目标优化问题越来越受到广泛关注。现实世界中的许多优化问题都涉及到多个目标的同时优化,而且多个目标之间往往是相互矛盾的。与单目标优化问题不
无线传感器网络结合了计算技术、网络技术和无线通信技术,是一种新型信息获取和处理的技术,已经广泛应用到经济和军事各个领域。无线传感器网络主要特性有能量有限、计算存储
针对当前自然计算模型中普遍存在的全局与局域搜索过程之间的平衡问题,本文通过借鉴自然界下雨及雨滴受重力影响沿地形垂直径向局部流动的动态过程;探讨了一种雨滴计算模型的
随着无线传感器网络在各个领域的快速发展和广泛应用,当前大多数网络协议已不能满足很多领域对节点低能耗及低延时的要求。因此如何提高传感器节点能效,成为当前迫切需要解决的