标签零模型及子图分布算法应用研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:f1f1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图挖掘是数据挖掘的一个重要研究领域。随着对结构化数据分析需求的大量增加,图挖掘中的图分类问题已经成为数据挖掘领域中的重要研究课题。目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上。随着信息技术的发展,在情报学、入侵检测、社会网络等领域中子图分布算法将有广泛的应用前景。子图分布算法亟待解决的问题是如何提取更多有效的分类特征,进而提高图分类的准确性,本文在分析了用于图分类的子图分布算法研究现状的基础上,根据存在的问题进行了如下研究。首先,针对Graphlet模型计算的子图分布用于图分类时,因忽略图中顶点标签,导致分类特征过少而影响图分类准确性的问题,本文基于零模型提出了标签零模型,增加图中顶点标签特征,并证明标签零模型用于图分类的有效性。同时,为量化标签子图的分布信息,确定采样量。引用信息熵的概念,提出了信息提取比,并给出可信度计算方法。根据信息提取比间接确定样本量,作为算法终止条件。其次,针对直接计算标签子图分布,需要反复多次进行图同构测试,导致时间复杂度较高的问题,在标签零模型基础上提出了两个算法,其中为了减少图搜索提出了用于构建图索引的BGLI算法,并基于BGLI算法提出了计算标签子图分布的ESGS算法,并在Spark上实现。最后,通过实验验证了标签零模型用于图分类的有效性,以及可根据信息提取比间接确定样本量减少不必要计算,并对基于标签零模型的ESGS算法提取的子图进行图向量化后作为分类特征用于图分类的准确性进行了实验验证。
其他文献
随着“互联网+”时代的到来,各行各业呈现出对软件系统的复杂需求,导致软件系统规模的扩大、软件结构复杂性的提高,进而使得软件系统在稳定性、可靠性等方面受到威胁。本文通
卟啉类化合物是一类具有高度共轭体系的大环分子,广泛存在于自然界和生物体中,在紫外-可见光范围内有很强的吸收,目前已被广泛用于光能转换、光催化、光动力疗法和荧光检测器等领域。就卟啉基材料(包括共价聚合物和金属有机骨架材料)的光催应用而言,迄今为止,已经有大量的报道。但是,鲜少有不对称A3B型卟啉及其配合物用于光催化反应的报道。一、合成了一系列外围带有螯合基团(吡啶二羧酸)的卟啉,并将其中不对称A3B
不同于其他的人工光源,LED光源技术的光电转换效率高、寿命长、耗能低优势使得LED照明产品不仅使用能耗成本低,其整体产品周期的综合成本也远低于其它光源产品而具有极其优异经济竞争优势,促使照明级LED作为人工光源在农业生产中的使用越来越普及和广泛。LED光源技术的革命性意义在于可以对其发出的光质进行调控,也就是说我们可按植物生长发育需求的差异性调制不同的发光光谱,实现按需用光。而人工光照作为农业生产
随着社会发展对导航精度、抗干扰等性能期望的提高,导航系统单独工作时产生的弊端愈发明显,因而能够充分发挥子系统优势的组合导航系统逐渐成为导航研究的主流方向。目前由于
近年来,随着我国电气化铁路的迅速发展,牵引供电系统的谐波问题也越来越得到广泛的关注。而进行谐波治理或监测评估需要的大量的现场测试数据,往往受限于现场谐波监测装置有
烤燃条件下炸药反应剧烈程度是评价炸药热安全性的重要指标。目前,国内对炸药烤燃反应剧烈程度的研究,仅限于定性分析上,对定量评价还缺乏研究。本文进行了多种混合炸药烤燃
在目前的GPS高精度定位中,为了最大程度上降低各种误差源对于定位结果的影响,通常都是采用载波相位差分定位的方法,载波相位差分定位模型主要由函数模型和随机模型构成。在建
接触网系统是铁路牵引供电系统中唯一无备用设备的部分,其性能直接影响铁路运营安全。与一般土木工程结构不同,接触网系统是由悬挂结构与支撑结构连接而成的大跨度结构,且悬
回归预测可以寻找事物之间可能隐含的关系,从而对事物的情况或发展做出预测,在社会科学和自然科学等领域有着广泛的应用,其中风力发电功率预测是回归预测的一个重要应用领域
随着国内人工成本的增加,从事危化品包装行业的操作工人招工难的问题日益凸显,现将半自动化生产模式转化成全自动生产模式市场需求日益迫切,而危化品充填和计量后的贴标和缝合装置在危化品大袋包装中是不可缺少的一环,故用机器替代人工,开发出一种可以给包装袋贴标和缝合装置的是市场的迫切需求。首先基于危化品大袋包装的技术特点,提出了危化品大袋包装可行的工艺路线,并从中也分析得出了缝合与供标装置的工艺流程,以及实现