基于评论文本的评分预测深度推荐模型的研究及应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:lxt63
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统的出现缓解了信息过载所带来的一系列不便问题,为用户提供精准的信息推荐。但是数据稀疏性、冷启动等问题仍然对推荐系统的性能产生了极大的限制。随着新热点深度学习技术的崛起,文本处理技术也迎来了新突破。研究人员开始利用文本处理技术将评论文本向量化表示并利用评论文本的信息实现推荐,这在一定程度上缓解了数据稀疏性问题。以此为契机,基于评论文本的深度推荐模型受到了极大的关注,而如何从评论文本中挖掘出更多有价值的信息以提升推荐模型的性能成为了研究的热点。本文以评论文本为主要研究对象,探讨基于评论文本的评分预测深度推荐模型。首先将新提出的双重注意力层融入基于卷积神经网络的文本处理器优化模型的特征提取能力;然后使用改进的基于细粒度文本的方面类别识别器结合方面类别情感分析器生成方面类别情感信息,并将情感信息运用于原模型提升评分预测效果;最后设计并实现了电商原型系统。本文的具体研究工作如下:(1)针对现存主流的基于评论文本的评分预测深度推荐模型未能充分考虑评论文本在不同层面的重要度信息对模型效果的影响,提出一种新的评分预测深度推荐模型DATCo NN。该模型在主流文本处理器的基础上进行改进,一方面在词向量处理过程中融入融合上下文信息的词级别注意力层,利用卷积神经网络强化单词之间的耦合性,突出重要度更高的单词;另一方面在整合用户和项目向量矩阵的过程中嵌合融入时间因子的评论级别注意力层,引入人脑遗忘规律的概念,将时间因子融入注意力机制拟合实际推荐场景下用户对项目的兴趣程度随时间变化的情况,降低无用评论对建模效果的影响。实验结果表明,改进后的模型能够很好的挖掘词级别和评论级别的重要度信息,有效改善模型的特征提取能力。(2)利用深度学习技术对评论文本进行特征提取实质上是一个抽象的过程,无法提取评论文本评论对象的具象化信息以及用户对评论对象的情感倾向。而将外部标注的方面类别信息引入模型对评论文本的方面类别及情感极性进行定义能够很好的弥补这一方面的不足。但是,如何针对评论文本前后表意不同的问题准确识别其方面类别以及如何将方面类别情感信息运用于推荐模型是此方案难点。针对上述难点问题,在原模型的基础上进一步优化,提出一种改进的评分预测深度推荐模型ADATCo NN。一方面,模型依照标点符号和依存句法关系将评论文本切分为子句片段并将方面类别转移到更为契合的子句片段中,利用上述细粒度文本的方面类别信息训练识别器,缓解评论文本前后片段表意不同所导致的方面类别冲突;另一方面,将方面类别信息以及情感分析器ATAE生成的情感极性融入用户偏好及项目属性向量,同时利用方面类别识别过程中的损失优化推荐模型损失函数的结构,使模型能够捕捉方面类别属性并准确把握用户的情感导向。实验结果表明,改进模型ADATCo NN能够很好的将用户情感信息融入推荐模型,提升评分预测的准确性。(3)在上述研究的基础上,本文设计并实现了电商原型系统。系统采用目前主流的技术架构,实现了电商平台的主要功能,并将本文研究的推荐模型封装起来为用户提供商品推荐功能,很好的展现了本文提出的推荐模型的使用价值。
其他文献
交通运输业的蓬勃发展依托于道路工程建设,水泥混凝土因其强度高、耐久性好等诸多优势成为道路工程建设中使用量最大的工程结构材料。此外,在我国镍铁渣是一种大宗的工业固体废弃物,堆存量超过6000万吨,且每年新增约2000万吨,但其利用率仍处于较低水平,大量堆存的镍铁渣对环境造成污染,相关问题迫切需要得到解决。基于以上原因,本课题以风冷镍铁渣为主要原料、硅酸盐水泥为辅助原料,制备高掺量镍铁渣路用混凝土,以
建筑业作为我国国民经济的支柱产业,同时也是典型的高危行业。其中,建筑施工活动作为典型高危生产作业活动,施工安全事故发生率也一直处于居高不下的状态,形势严峻,造成了众多的负面影响,必须加以高度重视以减少施工安全事故的发生。大量的事故案例与相应的研究表明:建筑工人的不安全行为及物的不安全状态是造成施工安全事故的重要原因,其中施工作业人员行为操作直接影响危险事故的发生。进一步调研发现,施工作业人员中存在
随着我国人口老龄化现象日益严重,脑卒中已成为导致我国人民寿命折损的第一原因。据《中国脑卒中防治报告2019》的数据显示,我国每年因卒中致死人数约有190万。因此,脑卒的防治已成为我国亟待解决的问题。然而,目前对于脑卒中的诊断主要依赖于医师经验和专业医学检查,由于我国医疗水平还存在地域性的差异,一些医院还缺乏高质量的诊疗手段,使得患者不能及时得到良好的医疗救治。随着计算机技术的飞速发展,人工智能为脑
ZnO是一种直接带隙半导体,意味着它的CBM最低值和VBM的最高值处于同一位置,可以让电子跃迁时耗能极小,高达60me V的激子束缚能、优秀的化学和热稳定性、原材料低廉特点的存在被认为是继氮化镓之后制备LED、透明电极、发光器件等光电器件最有前景的材料。由于ZnO本身有存有掺杂非对称性难题,ZnO在光电应用上的突破并不明显,主要是呈n型导电的本征ZnO随着自然生长,氧空位(Vo),锌间隙(Zni)
近些年具有广泛应用前景的网络控制系统(NCSs)伴随着通信技术的不断进步,受到了极大的关注并取得了快速的发展。然而机遇与挑战共存,网络控制系统具有安装维护方便、低成本、高可靠性和资源共享等优点,但是通过网络传输控制信号也带来了通信时延、数据包丢失、错序、网络拥塞、随机干扰等问题,给控制系统的稳定分析和综合设计带来了诸多挑战。为了达到节约通信网络带宽和计算等资源的目的,诸多学者提出在网络控制系统中引
人脸表情作为一种非自然语言以及最重要的外貌特征,在人与人面对面沟通中起到了至关重要的作用,此外人脸表情中所蕴含的丰富信息在情感和教育等相关领域也有着关键的作用。在高校教师与学生之间的情感交流,感知学生的情绪和学习状态,引入人脸表情分类技术对学生的面部表情进行信息捕获就显得尤为重要。现有人脸表情分类算法在面部表情的特征提取、特征降维以及表情图像分类等方面有实际意义价值。在图像分类技术的基础上,首先,
近年来,精准医疗和疾病的早期检测备受人们的关注,生物样本的检测需求也急剧增加。但生物样本检测成分通常浓度较低,传统的检测手段往往耗时且操作复杂,因此急需开发出更方便快捷的新型检测手段。电化学生物传感器操作简便、快速、灵敏度高,可克服传统检测手段的不足,实现对复杂样本的快速检测。纳米材料的电子转移效率高,可将纳米材料与电化学传感器相结合构建灵敏度更高的传感器用于生物样本的检测。因此,本文分别用磁性F
汽车减速箱作为汽车传动系统能耗的主要部件,其传动效率在整车中占重要地位,而降低减速箱功率损耗、优化减速箱的传动结构,对提高减速箱使用寿命与能源使用率有着重大意义。研究发现,齿轮搅油损失在减速箱损耗中占有较大比重,但对于齿轮搅油损失的研究多集中于转速、齿轮与润滑油参数以及温度等方面;箱体几何结构亦为一重要影响因素,却少有说明此因素与齿轮搅油损失关系的研究。本文采用MPS流体仿真与实验结合研究的方法,
行人再识别在智能视频监控、智能安保等领域发挥着巨大的作用,在计算机视觉领域已经成为了一个研究热点,近年来受到了大量学者的关注。优秀的行人再识别模型可以抽取出高鲁棒性的行人特征,使得行人分类更加准确,进而有益于完成监控与安保等任务。受限于行人再识别数据集中样本数量与样本类别的不足,许多在现有行人再识别数据集上训练出的模型容易过拟合。生成对抗网络可以通过拟合原始数据集分布从而生成全新的样本,因此,使用
摩擦磨损试验机作为材料摩擦研究的重要组成部分,它的工况形式、测量结构等因素对试验结果起着关键作用。目前国内高校与企业研制的环-块摩擦磨损试验机的运动与接触模式大多是恒定不变的,工作参数在试验中缺少变化。而诸如柱塞、轴承和轮辋之类运动器件工作时的摩擦形式一般都比较复杂,其所受载荷、接触方式、温度等参数往往会经历动态的变化过程,若使用这类传统试验机进行测试的话,其结果对于最终的工程应用可参考价值有限,