基于SCAN的情感社区划分算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:xlr9900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区聚类算法也叫图聚类算法,一直以来都是数据挖掘领域研究的热门话题。如最大模块化算法、SCAN算法,都可以从复杂的结构图中将联系紧密的社区结构有效剥离开来。在大数据爆发的今天,这些算法仍能解决社区划分的问题。该类算法的研究对于商业应用中的导购推荐、话题的舆论导向等等有着非凡的意义。然而,针对某一个物品或者某一服务,人们会有不同的情感,通过这类算法所得到的社区结构并不能真正反映现实生活中的社交关系。所以,基于社交关系网中的情感因素,又有了情感社区划分算法。但是,现有基于最大模块化方式来解决情感社区划分问题的算法,存在以下几个方面的问题:(1)模块化算法的复杂度极高,它已经被证明是一个NP难问题,虽然引入情感因素后,模块化算法被转化为能够有效求解的半定规划问题,但其时间复杂度仍然很高;(2)情感的不可传递性会导致聚类偏差,在情感社区中,如果有N个点在结构上是紧密的,且相邻节点之间的情感差值并不大,那么分类结果可能会将结构图中两个情感并不一致的点进行聚类;(3)模块化的划分结果往往会十分离散,因为模块化的划分方法并不能识别社区间的连接点和离群点,连接点和离群点由于结构上和子社区都不存在密切关系,所以这些点都会被划分为单独的情感子社区。针对上述问题,本文提出了一种新的基于SCAN的情感社区划分算法,简称为SPEC。SCAN是一种在线性时间复杂度下就能完成聚类的社区划分算法。利用该算法来解决情感社区划分问题时,不仅能减少时间复杂度,还能有效识别社区间的特殊点。SPEC算法具有以下优势:(1)通过计算情感区间合理解决情感值的不可传递问题,使每个情感子社区中的点都能保证其情感极性是一致的,避免了聚类偏差;(2)利用情感区间将社区间的连接点和离群点进行聚类,避免划分结果离散;(3)大大减小了情感社区划分算法的时间成本。本文对SPEC算法进行了大量的实验,实验表明,该算法的划分结果正确,且比现有的情感社区划分算法具有更好的性能。
其他文献
近年来,近眼显示领域不断发展,能够在真实环境中叠加虚拟信息的增强现实型显示设备逐渐成为越来越多专家学者研究的一个热点方向,而为了满足人们对头戴显示设备尺寸小、重量轻等诉求,基于全息光波导技术实现增强现实显示的光学模组得到了迅速发展,这种模组将全息光栅与透明波导材料相结合,在实现增强现实显示功能的同时,减少光学元件数量,有效减小了设备的尺寸和重量。然而,大多数采用全息光波导技术的增强现实型产品,都是
求解线性方程组的需求无处不在,基本上涵盖了人类活动的所有定量领域,包括工业和科学领域。求解线性系统是数值线性代数的核心问题之一,在计算机科学,科学计算,优化,信号处理,工程,数值分析,计算机视觉,机器学习和许多其他领域中都发挥着重要作用。求解线性系统的迭代算法由于计算效率高和用于大型线性系统时存储量少而越来越受关注。目前已有多种求解线性系统的随机迭代算法,其中Strohmer和Vershynin提
视网膜眼底图像的动静脉分割技术能够辅助医生更好地诊断各种全身性疾病或者心血管疾病,是一种具有重要意义的计算机辅助诊断技术。传统的视网膜眼底动静脉分割方法一般包含两个步骤:首先将血管从眼底图像上分割出来,接着在血管分割的基础上进行动静脉的分类。然而,这种方法的最终结果,会受到第一步,也就是血管分割效果的影响,且整个过程耗时较长。近年来,一些基于深度学习的分割方法实现了端到端的视网膜动静脉分割,可直接
小样本学习的主要目标在于使模型能够从少量(比如:一个或数个)带标注的新类别数据中进行快速学习,进而能够对新类别数据进行分类和识别并且具有较好的泛化能力。然而,这一目标的实现非常有挑战性,其原因主要有两点:(1)特征退化问题。对只有少量标注数据的新类别,缺少好的特征表达。模型很难从少量样本中学习出一个好的特征表示。(2)分类器学习问题。少量标注数据通常无法精确地表达真实的数据分布,因此,即使有较好的
随着人本主义在各研究领域的深入发展,街道空间的设计评价研究逐渐形成从客体物质空间到人的主观空间感知的关注转向,并且伴随着科学技术的进步和多学科交叉研究的结合为这一研究转向提供了动力。人作为空间使用的主体,以人在空间中的行为感知为分析切入点,通过自下而上的分析方式有助于相关领域的研究者能够切实掌握实际使用者的评价反馈,为街道空间的精细化研究提供客观依据。本文选取鼓浪屿龙头路的历史道路作为研究对象,通
全息术是一种能让观察者感受到图像立体感的技术。目前对于全息术的研究多集中于计算全息术,即使用计算机制作全息图。计算全息术能够脱离实际的光学实验环境需求,还能对现实中不存在的物体的全息图进行生成。计算全息图经过再现后可以得到强度图案,但由于强度图案损失了相位信息,导致其逆向传播的过程难以实现。本论文通过深度学习算法,利用卷积神经网络在图像处理方面的独特优势,设计并实现了基于深度学习的计算全息图生成系
目前用于硅基太阳能电池的太阳能级硅铸锭主要有两种切割方式,一种是传统的砂线切割法,另一种是新型的金刚石线切割法。后者由于切出的硅片质量好、切割过程效率高,逐渐成为主流的切割方法。但在切割过程中约有40%高纯硅变成切割粉废料,并造成环境污染。将这些废料中的高纯硅进行有效回收再利用成为亟待解决的问题。本论文采用两步法烧结和冶金法两种工艺对切割粉进行回收与纯化,系统地研究了切割粉的回收过程中的烧结机理与
磁共振成像(magnetic resonance imaging,MRI)凭借其无电离辐射的特性以及良好的软组织分辨能力自提出以来就受到了广泛的关注并得到了飞速的发展。然而,目前的磁共振成像多为定性的参数加权成像,仪器、脉冲序列的不同都会造成成像结果的差异,这制约着磁共振成像更深层次的应用。磁共振定量参数成像可以有效解决这一问题,但常规的定量参数成像需要较长的采样时间来完成多次数据采集,导致其对运
随着检察机关司法责任制改革以及检察机关内部机构改革后“捕诉一体”办案模式的实行,检察机关内部权力“下放”程度进一步加大,检察官的主体地位日益凸显,权力不断增强。这使检察机关在履行法律监督等一系列职能的同时也面临着如何防范自身恣意和滥权的问题,因而有必要不断探索完善检察机关的内部监督机制,以减少甚至杜绝检察机关内部的执法失范问题,但有一点必须明确,即加强检察机关内部监督时,必须以坚持检察官办案主体地
基于LED(Light-Emitting Diode)的固态照明技术是21世纪最具发展前景的一项新兴高技术行业。但是LED在热学特性方面仍具有诸多挑战,因此探究可靠的LED结温测试方法一直是LED领域的热门话题。目前常用的LED结温测试方法分为接触式和非接触式两种。前者容易影响LED工作状态,后者大多只能获取区域内的平均温度。本文针对上述需求,提出了一种基于显微高光谱反射光法的LED二维结温检测技