基于非确定二元关系的相似偏好客户群体识别方法

来源 :东华大学 | 被引量 : 0次 | 上传用户:gongjinjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的发展,基于社交网络的服务和应用越来越丰富。在为用户提供便利的服务和应用的同时,服务和应用的提供方也积累了大量的用户信息,这些信息具备了大数据特征。服务方如何利用这些信息为用户提供精准、高质量的服务是提升自身竞争力面临的问题。用户群体划分是解决该问题的重要手段,用户偏好是划分用户群体的基础依据,聚类是划分的主要操作。为了解决在大数据环境下用户群体划分的效率问题,本文从非确定性二元关系的角度,提出一种新的解决方法,该方法可以在保证精确性的基础上,大大提升识别偏好相似群体的时间效率。
  本文主要研究内容如下:
  (1)对课题的复杂性进行论证,判断该问题是否是可计算的,如果是可计算的,那么进一步论证求解该问题的复杂性,如果是不可计算的,则论证寻求近似解的可行性。课题复杂性的研究主要分为两部分,一是证明用户偏好相似问题的复杂性,二是识别偏好相似群体问题的复杂性。对于这两个问题复杂性,本文通过分别设计两个图灵机得以论证;
  (2)研究适合于偏好相似关系的非确定性二元关系模型及其性质,本文提出一种新的满足封闭性和完备性模型,并且证明本文研究的偏好相似非确定二元关系满足自反性、对称性以及相对传递性,然后根据用户的历史数据集,通过K近邻算法,初步确定偏好相似关系,预先设置一个相似度阈值T,若计算出的用户之间的相似度超过阈值T,则判定为两个用户之间满足偏好相似关系,否则为不满足。通过该方法即可找出与目标用户偏好最相似的K个用户,最后结合偏好相似关系的性质,对每个用户初步确定的偏好相似关系进行再计算和扩充,从而生成最小的偏好相似团;
  (3)以最小的偏好相似团为基础,通过改善fast unfolding算法识别出完整的偏好相似群体,将最小团代替fast unfolding算法的第一阶段执行的结果,接着通过计算模块度增量将最小团进行合并,为了避免fast unfolding算法在用户数量发生变化时使得原始的偏好群体产生碎片化,本文还针对系统内用户变化主要是用户增加的情况,对fast unfolding算法进行扩展,提出一种动态识别偏好群体的增量算法。
  最后本文对所提方法进行实验,并且对实验结果进行了详细的阐述,结果表明本文所提算法在识别时间和精确度上的有效性。
其他文献
学位
为探究废气再循环(EGR)对柴油机颗粒结构特征与氧化活性的影响规律,采集了不同废气浓度条件下F-T柴油、生物柴油和柴油三种燃料的燃烧颗粒,运用粒径谱仪(EEPS)、透射电镜(TEM)、热重(TGA)等方法,探究了颗粒物的结构特征与氧化活性。结果显示,随着废气浓度的增加,颗粒物平均粒径、分形维数(Df)、基本粒子的层面间距(d)和微晶曲率(Tf)升高,微晶尺寸(La)、氧化特征温度和表观活化能(Ea
目的分析血浆皮质醇(COR)、肾素(REN)水平与老年慢性肾脏病(CKD)3~5期患者主要不良心血管事件(MACE)的关系。方法回顾性分析2014年10月至2017年11月在东南大学附属中大医院江北院区确诊的老年CKD3~5期且未行肾脏替代治疗的215例患者临床资料,采用化学发光法检测血浆去甲肾上腺素(NE)、REN和COR水平,采用免疫比浊法检测血浆C反应蛋白(CRP)水平,根据患者随访过程中是
作为我国传统文化中的重要构成,民间游戏对于幼儿的成长与发展具有积极意义。幼儿教育需要充分利用各种文化资源,民间游戏是非常重要的素材。幼儿认知世界最主要的方法就是游戏,民间游戏是非常好的补充。民间游戏基本源于劳动及现实生活,其中的歌谣、儿歌等体现了各地区的语言、习惯和生活作息,所以幼儿教育中使用民间游戏具有非常好的效果,能够很好地改善幼儿的学习效果、活动质量。
随着信息技术的快速发展,互联网数据规模呈爆炸式增长,各类数据中心在全球范围内纷纷落地。数据的泛滥使得单一数据中心的计算能力显得较为乏力,企业开始通过建立和连接多个数据中心来收集和处理数据,地理分布式数据中心已经逐渐成为支撑大规模数据应用的重要平台。随着数据中心规模数量的与日俱增,其巨额的能耗与碳排放问题也愈演愈烈,以风能、光伏发电为代表的新型清洁可再生能源,其分布范围广、利用价值高、污染小,成为了
平衡时间洞察力是个体对过去、现在和未来的整体积极认知,根据情境特点表现出适应性时间取向的能力。大量研究表明平衡时间洞察力对于心理健康的维持具有重要作用,然而二者之间的作用机制尚不清楚。本研究以1432名(M=29.04,SD=14.38)成年人为被试,探究平衡时间洞察力与心理健康的关系,并检验情绪调节策略的中介效应。结果发现:(1)平衡时间洞察力与主观幸福感正相关,与焦虑负相关。(2)平衡时间洞察
近年来,随着多媒体技术、计算机网络与通信技术的的快速发展,传统的监控系统也不断向着新的发展方向进行着不断的更新与发展。进而随着嵌入式技术的出现以及人们对降低监控系统成本和提高可靠性的迫切需求,基于嵌入式系统的网络视频监控系统将成为新的研发热点。本文的目的是把嵌入式技术与计算机网络技术相结合,构造一个性能稳定且具有较强处理能力的数字化远程视频监控系统。该监控系统以嵌入式Linux系统平台作为服务器端
基于汉江干流春季水华发生前后的水文水质和水生态监测数据,采用Pearson相关性检验、分位数回归、随机森林模型方法,筛选出与藻类细胞密度相关性较大的重要环境因子,模拟预测了叶绿素a的浓度,并分析了可调控的环境因子阈值。由于藻类密度仅在水华发生后进行监测,无法体现水华的生消过程,可选取叶绿素a来表征浮游植物的生物量。研究发现叶绿素a分别与气温、流量因子呈显著的正相关和负相关关系,藻类暴发与气温和流量
目的了解甲状腺癌术后患者对随访的需求并分析其影响因素,为构建甲状腺癌术后患者的随访管理体系提供参考依据。方法采用便利抽样的方法对2所三级甲等医院2020年3–4月期间的甲状腺癌术后患者的随访需求、恢复、焦虑及压力情况进行问卷调查,分别采用自行设计的随访需求问卷、15项恢复质量量表(QoR-15)、广泛性焦虑量表(GAD-7)和压力知觉量表(PSS-4)进行评分,分值越高分别表示需求程度越高、恢复质