【摘 要】
:
推荐系统可以在海量数据中迅速发现用户喜欢的信息,已广泛应用于很多领域。传统的推荐系统根据预测评分的高低将推荐状态分为“推荐”或“不推荐”,这种二支的分类忽略了推荐过程中产生的成本问题;其次,传统的推荐系统没有充分挖掘和利用评分数据的价值,使推荐受到数据稀疏性的影响,难以学习用户的偏好;另外,在传统的推荐系统中,只关注项目与项目之间的相似性关联,即正关联,而忽略了项目与项目之间的负关联。形式概念分析
论文部分内容阅读
推荐系统可以在海量数据中迅速发现用户喜欢的信息,已广泛应用于很多领域。传统的推荐系统根据预测评分的高低将推荐状态分为“推荐”或“不推荐”,这种二支的分类忽略了推荐过程中产生的成本问题;其次,传统的推荐系统没有充分挖掘和利用评分数据的价值,使推荐受到数据稀疏性的影响,难以学习用户的偏好;另外,在传统的推荐系统中,只关注项目与项目之间的相似性关联,即正关联,而忽略了项目与项目之间的负关联。形式概念分析在数据分析方面有独特的优势,基于形式概念分析的推荐算法不仅可以建立项目间的相关性,还缓解了数据稀疏性的问题,提高了算法的推荐质量。然而形式概念分析忽略了对象集和属性集的负关联。三支概念分析理论是形式概念分析理论的扩展,除了具有形式概念分析的优势外,还能表达对象集和属性集之间“共同不具有”的关系。基于三支概念分析的推荐算法不仅能从评分数据信息中充分挖掘项目之间的正关联和负关联,降低数据稀疏性的影响,还关注了成本问题,以三支分类的方式降低了推荐成本。本文基于三支概念分析理论,对推荐算法进行研究,重点研究了成本敏感的推荐算法。首先研究了以评分信息表为依据的三支近似概念格的构造,以及三支近似概念格中的正负关联规则提取方法,并给出了基于三支概念分析的关联规则提取算法3ARM;在此基础上,进一步结合三支决策思想,研究了总体推荐成本最优的推荐方法,提出了基于三支概念分析的推荐算法3WRE。主要内容如下:(1)根据评分数值的大小将评分信息表转化为不完备形式背景,表示了真实情况中用户对项目的喜欢、不喜欢和不确定的三种态度;结合三支建格算法Cb O3C和三支近似建格算法Norris_OE的优势,构建三支近似概念格。在三支近似概念格上,研究关联规则的提取方法,提出了3ARM算法。该算法利用三支近似概念格中闭项集的特性以及三支近似概念之间的偏序关系,可以从三支近似概念的父子关系和兄弟关系中提取出正关联规则和负关联规则。(2)在基于关联规则的推荐中,一般直接将规则的后件作为推荐的结果,或利用规则的支持度和置信度简单地计算用户对项目的喜好程度。本文提出的3WRE算法同时考虑了项集之间的正相关和负相关,以相关正关联规则和负关联规则的支持度和置信度计算用户对项目的喜好程度。3WRE算法引入了三支决策的思想,根据各情况下产生的推荐成本,计算出能使总体推荐成本最小的各决策域划分阈值,以用户对项目的喜好程度和划分阈值的大小关系决定相应的推荐行为:“即时推荐”,“不推荐”或“待定”,最终完成对目标用户的推荐。文章最后利用经典的数据集Movie Lens进行实验。首先,对基于三支概念分析的关联规则提取算法3ARM进行实验,并与FARM算法和FISM算法进行对比。实验结果表明:3ARM算法可以在更少的时间内同时提取出相对完整且冗余较小的正关联规则和负关联规则。然后,对3WRE算法进行实验分析,分别从准确率、召回率、覆盖率和平均推荐成本四个角度与协同过滤算法、基于内容的推荐算法、基于形式概念分析的推荐算法、基于三支决策的推荐算法进行对比。实验结果表明:相对于以上算法,3WRE算法具有更高的准确率、召回率和覆盖率以及更低的平均推荐成本。
其他文献
目前,开关电源凭借其功耗低、尺寸小、稳压范围宽等优点被广泛应用于各种电子设备中,是当今电子技术领域不可缺少的一种电源方式,但其也存在着功率因数低、可靠性不高的弊端,而这些也是现代电力电子技术需要致力于研究的重要课题。为了改进其不足之处,本文设计了一个前端带功率因数校正的交错并联双管正激变换器,论文主要研究工作如下:(1)本文介绍了减小谐波电流分量对于提高功率因数,实现“绿色电网”的重要意义,阐述了
随着互联网的普及以及信息技术的快速发展,隐写术和隐写分析引起了信息安全领域的广泛关注。隐写术的主要目的是将秘密信息隐藏于其他信息载体中并进行传输;相对应地,隐写分析是对隐藏信息进行成功检测。传统的隐写分析方法一般包括特征提取和分类器训练两个步骤。在这两个步骤中,特征表达是关键,对检测性能起到决定性作用。在过去十几年的研究中,特征表达主要依赖于人工设计,其基本思想是找到隐写操作前后信息载体中具有明显
高热流密度和狭小散热空间导致的散热问题是高性能电子设备技术进步和发展面临的瓶颈之一,为了保证电子设备工作的可靠性和稳定性,高效可靠的散热方案设计尤为重要。液冷散热器如冷板具有冷却效率高、均匀性好、便于维护等优点,为电子设备高效散热提供了有力手段。冷却通道的拓扑结构往往决定了散热器性能的好坏,而传统设计中多以经验设计为主,存在设计周期长、随机性大等缺点,将拓扑优化方法应用于通道结构设计,提高了设计自
器官分割是医学图像中的一个关键任务,也是计算机辅助诊断(CAD)、诊断干预和疾病的治疗康复计划等任务的基础。在一些放射治疗计划中,需要提前将医学影像中的目标器官精准的勾勒出来。器官标注过程需要大量的人工且非常繁琐,故极易引入人为错误。多器官分割是指使用同一个模型同时分割多个器官,这比单个的器官分割更具有挑战性。一方面,不同器官之间大小差异较大,导致数据驱动的深度学习模型容易忽视包含体素较少的小器官
由于未来移动通信网络容量需求不断提升,学术界对各种可以支持大容量通信的技术展开了深入的研究。其中,多输入多输出(Multiple Input Multiple Output,MIMO)技术被认为是最具潜力的技术之一。然而,MIMO技术的应用仍然面临许多问题,尤其难以为接收端提供一种高效的检测算法。尽管最大似然(Maximum Likelihood,ML)检测已经能够获取理论上最低的误码率,但是其计
随着汽车起重机的不断发展,其在工程项目中的应用也越来越多。由于起重机在吊装时,需要人为的控制与决策吊装过程,所以会不可避免的出现操作失误或方案规划不合理等情况。针对以上问题,本文提出了多任务路径规划算法与吊装规划算法来辅助吊装人员进行吊装的作业。目前阶段汽车起重机在吊装时主要是人工操作,但在其他很多领域,已经开始使用深度强化学习来实现无人操作。作为大国重器,汽车起重机的吊装也正在向智能化方向发展,
糖尿病是一种严重损害人类健康的慢性疾病,可以使用便携式血糖仪监测血糖来诊治糖尿病。在便携式血糖仪芯片中,Flash控制器提供了CPU访问Flash存储器时所需要的时序控制电路。本文结合Flash存储器的特点,设计并实现了一款基于血糖检测SoC系统的Flash控制器。与传统Flash控制器相比,该Flash控制器实现了不同的程序下载方式,包括ICP下载模式、SWD下载模式以及SSP自编程模式,SWD
传统的卫星导航系统通常只能为用户提供导航服务,而卫星导航、通信一体化系统可以同时为用户提供导航定位服务和数据通信服务。相对于传统的导航系统而言,导航通信一体化的系统为用户提供的服务更加全面,卫星移动通信与导航功能相结合也成为当今一个热点的研究方向。到目前为止,几乎所有主流的卫星导航系统均在L频段部署了信号,L频段共存的信号较多,信号间的干扰问题日益严重,寻求新的频段来开展卫星导航业务非常重要。国际
频扫天线相较于相控阵天线,在满足扫描范围的条件下,节省了多个T/R组件,具有成本低、结构简单、容易实现小型化等优点;但频扫天线实现宽角度扫描时传输损耗也较大,两者相互矛盾。针对目前无人机“黑飞”对国家和社会安全带来严重威胁的问题,本文设计了一款用于“低慢小”目标监视雷达的宽角度频扫天线并生产加工出来用于实际工程,实现了对目标角度的测量。介绍了频扫阵列天线的基本理论和波导缝隙天线的辐射原理、多种辐射