社交网络中代表性人物子集抽取问题研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:wgsgdy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从社交网络中抽取不同性质的子集是社交网络领域中一项重要的研究内容。在已有工作中,该研究课题大致分为两种:基于用户属性特征进行抽取;或基于网络拓扑结构特征进行抽取。但是,从单一角度抽取的子集往往不足以代表原集,因为在抽取的过程中只保留了部分特征。针对该问题,本文提出了新的解决方案。在抽取子集的过程中综合考虑了用户属性特征及拓扑结构特征,以确保抽取结果与原始数据集尽可能相似。具体工作如下:(1)本文针对社交网络抽取子集的相关工作进行了深入研究,并形式化地定义了从社交网络中抽取代表性子集问题,证明了该问题属于NP难问题。本文提出了代表性子集抽取框架K Sampling(KS),先根据用户属性特征进行聚类,以获得属性特征差异化的聚类簇。设计了融合属性特征和拓扑结构特征指标的目标函数,基于已划分的聚类簇使用启发式贪心算法进行采样。实验表明KS框架相对于其他代表性子集抽取方法有较好的表现。(2)基于KS框架,本文提出了优化版的抽取框架Affinity Propagation Community Detection Sampling(ACS)。其中包含了改进版的Affinity Propagation聚类算法,该聚类算法同时根据属性和拓扑结构特征划分用户。对聚类后由于属性相似而拓扑结构差异较大的误差点进行偏移,并在每个簇内利用社区发现算法来区分用户的拓扑结构。并利用深度优先搜索算法进一步完善交互关系稀疏用户合并为新的社区。最后,ACS框架根据目标函数使用带有剪枝的启发式贪心算法进行采样。实验证明框架具有较好的性能,且抽取的子集具有较高的代表性。综上,本文对社交网络中同时根据属性和拓扑结构特征抽取代表性子集问题进行了研究,并提出了相应的解决方案,对相关研究工作具有一定的参考价值。
其他文献
本文研究一类合作狩猎的HollingⅡ型捕食者-食饵扩散模型的动力学性态.对于局部模型,研究非负平衡点的稳定性,以及正平衡点处产生的Hopf分支、鞍-结分支和Bogdanov-Takens分
随着物联网技术的快速发展,作为物联网技术的重要基石,无线传感器网络(Wireless Sensor Network,WSN)凭借自组织,大规模以及拓扑动态化的特点,近年来在很多领域得到广泛的应
随着自旋-轨道耦合在超冷原子系统中的实现,玻色-爱因斯坦凝聚受到了更多的关注。众所周知,玻色-爱因斯坦凝聚体在不同的外部囚禁势中会呈现出很多不同的动力学现象,例如,谐
目的:探讨体素内不相干运动(Intravoxel Incoherent Motion,IVIM)成像及扩散峰度成像(Diffusion Kurtosis Imaging,DKI)相关参数在宫颈癌新辅助化疗(Neoadjuvant Chemoradiot
核酸、生物酶、蛋白质以及生物小分子等参与许多重要的生物学过程,生物分子的检测平台受到了越来越多的关注。光学生物传感器由于具有灵敏度高、检测限低、特异性好和准确度
本文主要研究交错扩散对三类捕食模型的影响.主要工作归纳如下(1)第一章研究齐次Neumann边界条件下交错扩散对具有保护区域的Ivlev型捕食模型的影响,其中交错扩散表示食饵躲
表面活性剂特有的两亲分子结构,使其能够在不同表界面上吸附以及在本体溶液中自组装形成多种胶体。表面活性剂分子结构的变化会导致表界面上吸附以及在本体溶液中自组装体系
自上世纪80年代至今,中美两国在电影产业的合作不断拓展和深入,相关翻译研究也随之展开,但大多数集中于译制片和字幕翻译。近年来,随着中美合作电影的数量不断上升,合作深化,
电子信息、无线通信、微处理器等技术的快速发展,推动了无线传感网络的普及和应用,其相关理论和应用研究受到人们的广泛关注。无线传感器网络由多个具备一定通信、存储和数据
二十一世纪以来,环境污染日益加重,严重影响了人类的生产生活。在最近的二十年里,中国政府采取了一系列措施来应对环境污染,排污权交易产生作用是要求政府利用基于市场化的污