【摘 要】
:
随着互联网的快速发展,信息资源的规模迅猛增长,信息过载成为了当今社会的一个主要问题。由于用户从海量信息中提取有用的信息变得越发困难,针对个人的智能化推荐技术应运而
论文部分内容阅读
随着互联网的快速发展,信息资源的规模迅猛增长,信息过载成为了当今社会的一个主要问题。由于用户从海量信息中提取有用的信息变得越发困难,针对个人的智能化推荐技术应运而生。鉴于个性化的推荐系统具有主动服务、个性化程度高和用户驱动等优点,推荐技术成为了学术界和工业界的研究热点。树模型是一种按规则对样本进行划分的预测模型,随着用户量和信息资源的进一步扩大,针对特征维度过高、正负交互样本不平衡和模型过拟合等问题,本文进行了深入细致的研究,主要成果包括:(1)基于商品的历史数据,本文提出了一种层次化的商品预测模型。而为了实现对商品数据进行有效的表示,提出了基于时空特性的商品表征方法。针对数据表征的高维问题,基于Bagging思想,在特征空间构建了一种层次化的GBDT集成模型,解决了 GBDT高方差的问题,提高了模型的预测性能,实验结果验证了本文所提模型的有效性;(2)针对商品数据中正负交互样本不平衡的问题,本文提出了一种个性化的去偏DART集成模型。为了对用户的个性化画像进行描述,利用决策树的稀疏编码方法得到用户的个性化表征。进一步,利用下采样构建多个基DART决策树模型,通过集成的方法生成强学习器,避免了过拟合问题,改善了模型的预测性能;(3)对于DART模型中Dropout方法没有充分考虑到决策树之间重要性的问题,本文提出了一种基于重要性排序的DART模型。通过采用决策树的错误率作为重要性排序准则,使得模型训练过程中趋于拟合残差较大的方向进行改善,提高了模型的泛化能力,通过实验验证了所提模型的预测性能。
其他文献
协同过滤推荐技术在Netflix百万大奖赛中脱颖而出后,已成为推荐系统发展史上发展最快、应用最广的一类算法,但是它们仍然受到数据稀疏性和冷启动问题的严重影响。研究发现引
本文针对光照不均匀图像进行增强算法研究。因Retinex算法与传统增强算法相比,在动态范围压缩、颜色保真和细节增强等多个方面的优点,因此本文对Retinex算法进行深入研究,并
基于法布里-珀罗(Fabry-Perot,F-P)结构的光纤光栅功能型器件是近年来受到颇多关注的具有重要应用前景的光纤器件,F-P结构光纤光栅器件的突出特点是功能多,形式多变,组成F-P腔的
数据挖掘是应用一定的算法发现隐藏在数据中事先未知的、用户感兴趣的知识的过程。网络信息化时代,数据爆炸式增长,传统的串行算法在处理海量数据时,效率很低,如何提高海量数
随着信息家电产业的快速发展,具有自动控制功能和网络交互功能的智能家电[1]正逐渐取代传统家电。未来智能家电将与嵌入式产品进一步融合,并且引入图形化的操作系统。与此同
CT技术是一种在医学、工业、军事、航天等领域广泛使用的技术。随着平板探测器的出现,锥束CT重建成为了当下研究的热点。锥束CT重建与平行束和扇束重建相比,具有投影数据采集快
随着数字化、网络化以及大数据的推广,存储测试也朝着大容量、多通道、多接口形式以及分布式的方向发展。为此本课题设计了基于闪存阵列的数据汇集系统,并提出系统设计方案。系
本文综述了光传送网(OTN)在国内外的技术发展和应用情况,对OTN的相关理论进行了深入研究。通过分析,OTN电交叉设备适用于电力通信系统,基于ODUk的SNCP保护与光复用段1+1保护技术
作为一种生物认证技术,说话人识别依靠着低成本、高安全性以及方便性等独特的优势,越来越受到研究人员的青睐,而在所有的与说话人识别相关的算法中,支持向量机算法由于其适合解决