【摘 要】
:
随着大数据时代的到来,各大互联网公司对数据越来越重视,各大国内外的电商网站的实际需求是推进推荐算法研究的动力。国内外的电商网站和社交网络,最常见的推荐算法是根据用
论文部分内容阅读
随着大数据时代的到来,各大互联网公司对数据越来越重视,各大国内外的电商网站的实际需求是推进推荐算法研究的动力。国内外的电商网站和社交网络,最常见的推荐算法是根据用户的历史行为数据来推荐用户可能会购买的或者感兴趣的商品或者话题。协同过滤作为目前推进系统中应用最为广泛的算法,也是未来推荐系统的重点研究对象和推荐系统的发展方向。其优势在于能通过用户-商品的评分矩阵来挖掘出用户的隐藏特征,并且其处理复杂信息的能力能够使其很好的适用于实际应用环境。针对协同过滤存在如数据稀疏性、冷启动等问题。本文结合商品的评论信息来进一步改进算法,标签生成采用抽取关键词来完成,进一步通过改进的自动编码器从标签中挖掘出商品特征矩阵,填充好原始矩阵后,依据上下文语义划分子群组,最后利用预测结果好的子矩阵来产生近似矩阵从而得到预测结果。具体如下:针对评论语料随意性、无结构、口语化等特点,现有的标签提取的方法从评论短文本中提取出的标签存在标签冗余、语义不独立等问题。因此改进了K-means聚类的标签生成方法,该方法保证语义独立的同时依据其每个聚类中标签分数值来选取商品标签。实验结果表明改进的方法保证标签相互独立的同时保证了标签准确性。针对单层自编码器挖掘隐藏、克服数据稀疏性能力不足的问题。本文将稀疏自编码器和边缘降噪自编码器组合为稀疏边缘降噪自编码器。同时具有着两种编码器的特点,稀疏边缘降噪自编码器即能够对数据输入的噪声干扰有比较好的鲁棒性,也能克服边缘降噪自编码器的计算难度大和消耗时间长的难点。针对传统的协同过滤方法存在稀疏性、冷启动问题,论文利用评论文本信息和上下文信息来缓解数据稀疏性和冷启动的问题。具体改进了基于改进子群组的协同过滤推荐方法,论文着重研究评论文本和上下文信息对推荐的作用,所以将商品标签表征为标签向量,通过自动编码器进一步提取隐藏特征,最后通过子群组划分后的潜在信息的迁徙来进一步预测评分矩阵。实验结果表明所提方法有效的利用了商品标签和上下文信息,提高了推荐精度。
其他文献
背景与目的:炎症反应在缺血性脑损伤的发生发展过程中扮演重要的角色。血栓素A2受体(Thromboxane A2 receptor,TXA2R)在体内分布广泛,在多个反应中发挥作用,如炎症反应、免疫
现今,合成5,6-二羟基吲哚的主要方法为化学合成法,其中4,5-二羟基-2,β-二硝基苯乙烯是合成反应中的重要原料,而将其硝基还原成氨基是合成5,6-二羟基吲哚的重要步骤之一。而
目的:通过分析比较病例组和对照组中白细胞介素-33(Interleukin-33,IL-33)单核苷酸多态性(Single nucleotide polymorphism,SNP)rs4742170的基因型及等位基因频率的分布差异,探讨青海地区藏族人群中IL-33基因多态性与脑梗死的相关性。方法:依据排除标准及入组标准,纳入41例藏族脑梗死患者及46例藏族体检健康的人群,并征得所有研究对象同意后,
本文对穿孔井破坏的进行了数值模拟。首先,通过采用边界元素的方法求解弹性平衡方程,来确定井表面附近的岩石和射孔的应力-应变状态。其次,基于断裂标准估计所得的应力-应变
与漂洗鱼肉相比,不漂洗鱼肉不仅可以最大限度保持鱼肉中的营养物质,而且可以减少生产用水,从而降低污水处理成本。鱼肉在贮藏过程中极易发生氧化,从而导致其品质劣变。本课题
与集成电路芯片相比,集成光子芯片具有能耗低、速度快和带宽大等优点,在信息等领域得到了极大的关注。在集成光子芯片中,集成光波导和光学微谐振腔是最主要的器件单元。集成
有关早商文化的研究一直是学术界关注的热点问题之一。豫北地区处于中原腹地,是夏族和商族重要活动区域之一,也是夏文化和商文化互相交流的重要地区之一。豫北地区一般而言是
随着社会经济和科学技术的发展,人们对空间地理信息的要求越来越高,而空间地理信息的质量与空间地理信息数据的准确性又是息息相关的,空间地理信息数据的获取则来源于测绘仪
随着我国经济高速发展,工业水平不断提高,环境污染问题也日益严重,特别是水体环境的污染已经开始严重影响动植物和人类的健康。随着环保意识的提高和相关法律法规的颁布,我国
重大科研项目主要是进行重大、基础性研究工作,解决构成国民经济和社会发展进程中的障碍的问题,由于基础性问题的公共属性,重大科研项目主要由国家出资资助,体现了国家战略意