面向不确定图的社区发现与搜索算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:Chanco
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为建模大规模网络的通用数据结构一直以来受到了学术界的广泛关注,比如交通网络、社交网络、生物网络、协作网络和通信网络等都可以抽象为图。由于数据采集和处理过程中随时可能出现的噪声和误差,这将会导致图数据具有不确定性。于是,最近学术界开始关注不确定图中的社区挖掘问题。不确定图是在确定图的基础上增加了概率维度,它能够表达更丰富的语义并且能更好的表示数据本身固有的不确定性。但是由于不确定图中概率维度的增加,这也会导致确定图中的研究成果不能直接应用于不确定图。基于以上背景,本文重点研究不确定图中基于k-median和k-center聚类的社区发现问题以及不确定图中考虑节点影响力的社区搜索问题。针对不确定图中基于k-median和k-center聚类的社区发现问题,本文分析了这些问题的难度,并提出了比现有研究具有更佳近似比保证的算法。具体来说,本文所提算法为k-median问题提供(1-1/e)近似比保证,为k-center问题提供(OPTkc)近似比保证,其中OPTkc是k-center的最优目标函数值。此外,本文所提算法还结合了几种优化方法,可显著提高其实际运行效率。大量的实验结果表明,本文所提算法在运行效率和返回解的质量上均明显优于现有方法。针对不确定图中考虑节点影响力的社区搜索问题,目前关于这方面的研究都只考虑到了在确定图中的情况。本文基于(k,η)-core的概念提出了一种新颖的社区模型,称为influential(k,η)-commiunity。基于这个新的社区模型,本文提出了一个在线搜索算法SearchIC。大量的实验结果表明,本文所提算法比现有的在线搜索算法在运行速度上要快好几个数量级。
其他文献
无线通信的核心问题是信息传输的效率与可靠性。信道编码技术是解决可靠性问题的重要手段之一。因为具有灵活的码本结构设计、线性复杂度的编码算法、并行化的译码结构和接近
在自然界中几乎不会发现纯净的氢气,必须通过各种化学方法从其他化合物中制备。生产方式多样是氢能的主要优势之一,因为它增加了能源安全性并减少了对某些原材料的依赖性。不
随着半导体外延和芯片技术的快速发展,紫外LED的技术与应用已成为产业的研究热点。本课题结合地方特色产业,主要针对近紫外LED在鞋服皮革照明与建材领域的光催化去甲醛方面的
图像分割是根据不同应用需要将图像分割成若干个具有独特性质且互不重叠的区域,进而将感兴趣区域与背景分离的过程,由于图像的多样性和复杂性,图像分割一直是图像理解和计算
我国的耐磨钢球生产技术水平相对较为落后,生产的磨球普遍存在着质量差、寿命短的问题,极大地加剧了矿业消耗。因此,制备高性能的磨球,具有十分重要的经济价值和社会意义。针
图像检索是计算机视觉的一个重要分支领域。图像检索的一般流程是,首先提取训练集中图像的特征,然后提取待检索图像的特征,接着计算待检索图像特征和训练集中图像特征的相似
当前新型恶意代码数量和种类日益增多,对网络空间安全提出了新的挑战。基于特征码等传统的恶意代码检测技术,其检测形式单一,难以检测新型恶意代码。基于常规机器学习的检测
近年来国内致密砂岩油藏在水平井、体积压裂与“工厂化”作业等技术的支持下,得到了有效的开发利用,但对致密砂岩储层孔隙结构特征的研究和致密砂岩油藏水驱油效率影响因素的
在深部资源开采工程和地下空间拓展工程中,岩柱的稳定性问题一直是实际工程开展所面临的一项难题。由于深部岩体处于“三高一扰动”的特殊地质力学环境,天然或人造岩体发生失
随着人类长非编码RNA和疾病关系研究不断深入,出现了预测长非编码RNA-疾病关系的方法。引入被证实的长非编码RNA和疾病的关系组建关系网络,科研人员使用网络表示学习获得节点