多样性与公平性驱动的推荐技术研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:gulangxian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
各类项目的日趋丰富引发了如何向用户进行精准呈现、进而提供智能服务的问题。推荐聚焦用户和推荐项目的最佳匹配,是解决上述问题的有效机制。但不断变化的用户需求,不仅衍生了诸如推荐多样性、推荐公平性等推荐语义,同时对推荐技术提出了新要求和新挑战。本文针对基于用户行为信息的相似度计算存在可改进空间、推荐结果中的多样性呈现不足、推荐公平性语义的不确定性等问题,根据场景分别提出了基于用户行为的相似度计算优化方法、基于隐马尔可夫模型的多样化推荐算法以及融合多种项目属性及推荐频率等因素且覆盖具体推荐公平性语义的推荐算法。本文的主要贡献点如下:
  (1)针对用户相似度对推荐有效性的重要影响,充分分析了基于用户行为信息进行相似度计算过程存在的优化空间,提出了一种相似度计算的优化方法,该方法能够综合用户的历史“行为”和项目属性,引入最大熵并融合用户“行为”,获取用户间相似度,提升了推荐的准确度。
  (2)针对现有的多样化推荐没有充分考虑用户隐含行为信息与类别之间的关系,提出了一种多样化推荐算法。该算法引入用户行为状态转移,并与项目类别相结合更新用户间相似度计算,同时将隐马尔可夫模型融入推荐,根据类别为用户推荐多样化项目。建议的方法采用隐马尔可夫模型对用户行为进行有效建模,并兼顾了项目类别信息,在保障推荐准确度的基础上提高了推荐的多样化。
  (3)针对常规推荐中长尾项目在推荐列表中难以呈现的问题,提出了一种基于协同过滤与多元线性回归的公平性推荐算法。该算法结合项目评分、推荐频率、项目微观因素等,实现推荐多样化和推荐公平性两者之间的平衡。其基于用户类别紧密度和融入微观因素的多元线性回归获取项目得分,同时考虑项目推荐频率,有效减少了高流行度项目的推荐权重,提升了长尾项目被推荐的权重,从而实现推荐公平性。
  通过设计大量实验,将本文建议方法与传统方法在真实数据集上进行验证、对比分析,得到的实验结果充分表明本文提出方法的有效性。
其他文献
土地资源是人类生存和发展的重要基石。随着全球经济的发展,城市人口迅速增长,城市规模也在不断扩大,生产用地、生活用地的扩张与生态空间用地之间的矛盾愈来愈烈。以石河子市为例的绿洲城市地区“三生空间”时空分异评价研究不仅对石河子市的国土配置优化有着重要意义,也对天山北坡经济带的可持续发展提供借鉴,因此选取石河子市为研究对象。通过参考国内外的相关研究,本文选择了2000年、2010年和2015年三期遥感影
学位
区域土地利用演变是一个复杂的多因素综合作用下的非线性变化过程。在当前土地供需矛盾日益加剧、土地资源利用问题逐渐凸显的关键阶段,对土地利用变化的研究具有重要的理论与现实意义。土地利用变化模型正是深入理解区域土地利用的动态演变过程、特点以及未来变化趋势的有力工具。本文以典型干旱区绿洲——叶尔羌河流域为研究区,基于景观生态学理论及方法,以1980年、1990年、2000年、2010年及2015年五期研究
学位
冰雪覆被是干旱区景观格局的重要组成类型,同时也是区域宝贵的固态水资源存储形式。近年来,受全球变化态势不断加剧以及人类活动干扰强度增加等因素的影响,新疆山区的冰雪覆被面积急剧退缩,直接导致了该区域水资源储备的大幅波动,干旱区绿洲景观格局也剧烈演变。这对于整个新疆地区的可持续发展及生态系统稳定是一个严峻的考验。因此,深入了解冰雪覆被景观的变化规律及特点,研究冰雪覆被变化与人为干扰间的耦合机制,探讨不同
学位
背景与目的:  非酒精性脂肪肝病(Non-alcoholicfattyliverdisease,NAFLD)是一种以肝脏脂质蓄积增加为主要临床表现,除长期饮酒或其它明确原因以外引起的慢性应激代谢性肝病。随着人们生活水平的提高和生活方式及饮食结构的转变,目前NAFLD已成为全球第一大慢性肝病。NAFLD与肝硬化、肝癌、心脑血管疾病及其它系统肿瘤密切相关,但由于它病程长、临床表现轻、筛查与诊断手段复杂
组织蛋白酶B(cathepsin B, CTSB)属于木瓜蛋白酶样半胱氨酸蛋白酶家族的一类水解酶,广泛存在于从病毒到哺乳动物和人等生物体内。CTSB催化作用是由半胱氨酸、组氨酸和天冬酰胺三个保守氨基酸组成的催化中心实现。CTSB的结构由信号肽(signal sequence)、前体肽(prosequence)和成熟序列(mature sequence)组成。在成熟序列中,CTSB具有一段额外的插入
过氧化物酶(Peroxidase,POD)是一类广泛存在于细菌,真菌,植物和动物中的氧化还原酶,可利用过氧化氢来介导多种无机和有机底物的氧化。大多POD是单一多肽链与含Fe(Ⅲ)-原卟啉IX辅基构成的血红素蛋白,多肽链分子须与血红素结合才构成全酶,血红素辅基是POD电子传递的载体。III类POD是来源于植物的分泌型过氧化物酶,在胞质中合成后可以转运至细胞壁或液泡,参与多种生理功能,如机体内毒性过氧
在众多的环境内分泌干扰物中,类固醇雌激素是已知的最有效的内分泌干扰物质物质,且其具有污染范围广,致畸性强和难降解的特点。水生生态系统中类固醇激素的出现和持续存在已成为危害公众健康的一个重要问题。微生物降解是环境中类固醇激素清除的主要途径,然而国内外对微生物降解类固醇激素的代谢途径及机制的研究还很少。前期研究已经表明来自海洋红球菌P14(Rhodococcussp.P14)能以多种类固醇激素为唯一碳
学位
广东省纺织品进出口股份有限公司(以下简称"广东省纺")是广东省丝绸纺织集团有限公司所属二级子集团,是一家集贸易、设计、生产、服务为一体的科工贸相结合的现代化企业。广东省纺作为中国最早从事纺织品服装出口的企业之一,有60多年纺织品服装出口的经验积累和在国际纺织品服装市场上的良好声誉。公司注册资本为1.3亿元,主要经营纺织品服装的进出口业务,2018年进出口总额3.3
学位
P2P汽车共享服务逐渐受到大众追捧,同时也吸引了来自学术界和企业界的关注。由于没有官方的定价标准,因此汽车共享服务中最重要的问题之一是预测汽车租赁价格。价格预测模型可以作为中间的定价模型,来避免过多的讨价还价过程。由于P2P的去中心化特点,预测出价格区间更为合适。  解决价格区间预测问题的传统方法是通过分类算法解决回归问题,但它的三个弊端限制了此方法直接应用于 P2P 共享汽车服务的价格预测,分别