基于层次提取—局部聚类的社区挖掘算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:nlqysb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系,其中联系较为紧密的团体称为社区,处在同一社区中的个体更易于受到社区内其他人的影响,而社区挖掘技术就是挖掘网络中存在的社区。然而大多数社区挖掘算法都是面向中小型网络,当处理结点数千万级甚至上亿级的网络时,耗费巨大时间和资源,因而无法应用。针对大型社会网络社区结点和边数量巨大、社区结构复杂,普通社区挖掘算法挖掘效率低的问题,本文提出层次提取-局部聚类的社区挖掘算法。首先提出局部聚类算法,即提取社区中某一结点度较高的结点为核心结点及某一邻接结点,分别对两结点提取所有的邻接结点,通过对这些结点中公共结点数量来判断这两个结点是否属于同一社区,通过该方法依次以社区内其他未被访问结点为核心结点再进行判定,直至社区内不存在未被访问结点,重复该过程直至社区划分完全;然后在该算法的基础上进行改进,提出多层扩展及无环结点移除的改进思想,并通过实验分析验证可行性;最后将该算法应用在大型社会网络的社区挖掘中,对大型的社会网络核心结点提取,采用层次提取的方法,减少了算法结点扫描次数,并通过实验对算法的可行性进行了验证。实验结果表明该算法能有效的实现社区划分,并且有着较低的时间复杂度和较高的划分精度,并且可以通过对阈值的调整,自由控制挖掘社区的大小及质量。
其他文献
短波语音通信环境下飞机类型识别是非合作通信相关方向一个新课题,无论是在民用领域还是在军用领域都有着广阔的应用前景,对国家安全非常有意义。利用短波语音通信环境下飞机驾
GPGPU的主要目标是利用GPU强大的并行计算能力进行通用目的的计算。为了支持通用计算,GPU的结构也开始针对通用计算优化,但GPU固有的SIMD工作方式依然是限制其性能发挥的巨大障
随着Internet的快速发展与深入研究,新一代网络技术及其应用已经对软件的形态、方法和运行环境提出了挑战。传统的封闭、静态的运行环境已经难以适应新的软件技术的发展。如何
定位问题是无线传感器网络(Wireless Sensor Networks,WSNs)研究中的基础性问题之一。在无线传感器网络中,确定所发生事件在监测环境的具体位置是十分重要的,众多学者对无线传感器
基于共享地址空间的多线程是有效利用多核资源的重要方式。并发线程对一些共享数据的竞争,成为影响应用性能瓶颈之一。严重的共享地址空间竞争,限制了大量的多线程程序的性能
量子信息科学是信息科学与量子力学结合的一门新兴交叉科学。量子信息科学采用量子比特来表示量子态。遗传算法是模仿生物自然选择和遗传机理,构造一种随机化搜索的人工智能算
软件系统在长期不间断的运行过程中,会产生一系列能够导致软件性能下降的现象,例如系统内存泄露、舍入误差的积累、未释放的文件锁以及大量的存储空间碎片等,这种现象被称为软件
随着全球信息化的不断发展,对地理信息系统(GIS)的应用也越来越广泛,例如电力GIS系统等。如今的GIS系统,不仅需要处理二维空间的数据,还要对三维或者更高维空间的数据进行处
伴随着科技的发展,大量的手持可摄像电子设备已经走进到广大群众的日常生活中,人们虽然在享受方便,快捷,丰富的各种多媒体信息,但是同时也感受到了对多媒体信息处理的各种困
随着信息技术的迅猛发展,人们可以通过互联网从世界各地接收和发送信息,而信息交换过程中的一个突出问题就是数据格式的异构性,这将极大地阻碍对信息进行有效地使用。XML的出现