基于大众分类的互联网对象概要建立与对象关系的深入探究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ljmworkshop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入web 2.0时代,互联网产品的内容可由用户主导而生成,用户协作的应用场景越来越普及,大众分类便是用户协作应用中的杀手级应用。在大众分类系统中,用户可以自由、简单地用标签标记其感兴趣的资源。此过程中,用户、标签和资源三者之间存在三种关系:标签与资源之间的标记作用力,即标签是对资源内容的描述;标签与用户之间的标记反作用力,即标签是对用户喜好的描述;以及用户和资源之间的互为因果关系,即用户的某一爱好与其所标记的资源的内容是一致的。现有工作中,用户-资源间的互为因果关系尚未被使用,本文第一次发掘了这一关系,并进行了实验检验。本文首先利用大众分类中的用户-标签、资源-标签关系为互联网对象(用户和资源)生成概要,并根据用户-资源关系对用户概要进行扩充;然后,将大众分类标签空间中的全部标签根据语义关系进行结构化;接着,以梳理出的标签结构为工具,以对象概要为输入,输出对象之间的相似度;最后,根据相似度排序,为互联网用户进行资源推荐。为对标签进行结构化,本文提出了一种提出的基于统计学理论进行语义包含关系提取算法(Confidence and Support Based Semantic Relation Extraction,CSSRE)。为对互联网用户进行资源推荐,本文提出了基于标签结构的推荐算法(Tag Semantic Hierarchy Based Recommendation,TASHR)。实验部分对本文所提出的标签结构化算法CSSRE、资源推荐算法TASHR进行了验证,并对本文所提出的用户-资源间存在互为因果关系的假设进行了检验。对于标签结构化,本文实现了一个现有算法,将此算法与CSSRE进行对比。对于资源推荐,本文实现了两种算法作为对照,一是将问题形式化为文本处理后使用的浅层语义分析算法,二是工程上较为广泛使用的协同过滤算法,实验对比了使用三种算法进行资源推荐的F1值。对于用户-资源间互为因果关系的假设检验,本文首先对数据集进行了用户概要扩充,之后再次使用三种推荐算法为用户进行资源推荐并计算推荐指标F1值,最后分别对三种算法在扩充前和扩充后的F1值进行对比。实验结果表明:关于标签的结构化,CSSRE较现有的算法可以更清晰地界定标签之间的语义包含关系;对于推荐算法,TASHR在所讨论的场景下具有最为优秀的表现;对于用户-资源间互为因果关系的假设检验,TASHR算法在扩充后较扩充前将F1提高了约10%。
其他文献
随着现代通信技术的飞速发展,作为数字信号处理(Digital Signal Processing,DSP)基本组成单元的有限脉冲响应(Finite Impulse Response,FIR)滤波器,因其易于实现、稳定和线性相位
目的比较美学区单颗牙即刻种植后即刻修复与延期修复的临床效果。方法选取2016年6月至2018年7月在郑州大学第一附属医院口腔种植科接受美学区单颗牙即刻种植的患者40例,随机
移动数据的快速增长和智能手机的普及,为克服全球带宽短缺带来前所未有的挑战。毫米波技术被广泛认为是能够继续满足消费者对增加无线数据容量需求的关键技术之一。具有国际
2017年,我国的专利权质押融资额达到七百二十亿人民币,知识产权的市场价值显著提高。随着我国的专利保有量的显著增加,下一阶段的重要任务就是专利的运用。专利权质押融资是
心脏肥大细胞分泌的糜酶是近年发现的一种糜蛋白样的丝氨酸蛋白酶,广泛分布于心肌间质。临床研究显示,糜酶促进了动脉粥样硬化和动脉瘤患者的动脉中血管紧张素2的生成,从而加
LTE-A作为当前移动通信技术的主流,为用户提供了丰富的多媒体业务体验,但随着数据量的爆发式增长,使得网络问题变得复杂多变。运营商需要通过空口监测分析仪对LTE-A网络进行实时监测,实现故障的准确定位、用户数据统计以及网络优化,从而达到提升用户体验的目的,因此对LTE-A空口监测分析仪的研发显得尤为重要。本文依托于国家科技重大专项“新一代宽带无线移动通信网”,结合LTE-A系统协议标准与现有信道估
颜色科学领域的发展随着时代的进步也在不断的向前迈步,随着显示设备和成像技术的快速发展,颜色信息可以任意在媒体设备上呈现出来,但由于各种媒体设备的颜色呈现机理不同,因
稀有细胞是一类人体中含量极少的细胞,其来源包括从癌症组织逸逃的循环肿瘤细胞,从胎盘进入母亲体内的循环胎儿细胞,和外周血干细胞等。它们往往具有重要的临床价值。基于稀
水下无线传感器网络是通过在水下部署大量的传感器节点,针对目标区域进行实时的监测,将对用户有用的信息进行采集,经过汇聚节点将信息发送至处理器,最后利用可视化功能展现给
并联机构具有机构简单、反应迅速等优点,广泛应用于包装等领域。将其应用在磨削加工生产流水线时,传统磨削机器人的操作繁琐、工作空间狭小、体积庞大等缺点,使之在服务企业