基于站点关系网络的开源情报析取系统的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:luocaohuozi12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,黑灰产业已经步入了商业化运作模式,部分黑灰产运营站点提供了隐私数据的获取途径、刷单方法、空包方案等理论和技术支持,这类信息极易对互联网公司的业务和品牌形象产生不良影响。为了了解和掌握这类站点的信息,为挖掘黑灰产站点工作提供支持,设计与实现站点级的情报系统具有重要的立论意义和应用价值。针对这一需求,本文以链接关系为切入点,从已知黑灰产站点出发,寻找与其关联的站点,并对这些站点进行内容评估和行为评估,设计并实现了一套基于站点关系网络的开源情报析取系统。为了制定了合理的开源情报析取方案,本文对开源情报析取的概念和一般性流程进行了分析和研究,提取了数据获取、加工、分析三个核心环节。引用关系网络分析理论,本文设计了基于站点关系网络的开源情报析取模型,首先,将网络数据抽象为图结构,接着,导入图结构分析方法,抽取其中的社区,然后,为社区中的每一个节点建立影响力模型,并根据历史记录形成影响力时间序列趋势,最后,制定情报输出规则,输出可能存在威胁的站点。为了满足主题和关联两个方面的聚类需求,本文在模块度算法的基础上,提出了一种基于站点主题相似度与网络拓扑结构的社区发现算法,综合权衡节点的主题倾向和关联关系,结合贪心算法的思想,检测网络中的社区结构。在上述研究的基础上,本文明确系统框架逻辑和数据抽象,设计并实现了基于站点关系网络的开源情报析取系统,其中包括数据获取、主题特征抽取、关系网络构建、站点影响力趋势分析等核心功能模块:系统首先采集网络上的相关基础数据,然后,抽取数据中可以描述主题属性的关键词,再从关联和倾向两个角度出发构建关系网络,对关系网络进行社区划分,帮助分析站点特性,最后建立时间序列模型拟合关系网络中的数据变化,达到输出站点级情报的目的。综上所述,本文通过对站点关系网络的深入分析,设计并实现了开源情报析取系统,测试和应用结果表明,本系统可以从开源数据中挖掘黑灰产站点,可行性良好,能够一定程度上满足企业需求,达到了预期效果。
其他文献
生物多样性与生态系统多功能性(biodiversity and ecosystem multifunctionality,BEMF)之间的关系是目前生态学研究的一个热点,其中,生态系统多功能性(EMF)的测度方法是研究
目的:卵巢癌的化疗耐药性是导致其临床疗效欠佳的重要因素之一,故明确其耐药的分子机制,并且探寻有效逆转卵巢癌耐药的分子靶点以及研制耐药逆转剂成为目前卵巢癌研究的热点
目的本研究旨在探讨金属硫蛋白(metallothioneins, MTs)在低氧诱导甲状腺乳头状癌(Papillary thyroid carcinoma, PTC)侵袭转移中的作用及分子机制。方法 使用5%O2的低氧培养
和弦,在任何一种音乐风格、任何一种乐器中都是必不可少的。键盘乐器在演奏流行音乐时,和弦同样是不可或缺的,本文通过和弦代号、终止式和几个较经典的和弦、和声进行来研究
工业加热炉炉温都比较高,所以传热的方式以辐射为主,基于加热炉辐射传热的节能理论,综述分析了炉内装强辐射元件、炉内衬喷涂辐射涂料、在辐射室装反射板、优化改造加热炉等
生物技术是近年发展起来的挥发性有机废气净化新技术。文章介绍了国内外这方面的应用进展、主要处理工艺设备及其性能特征。概述了生物滴滤塔处理挥发性有机废气的影响因素的
在白求恩精神的内涵里处处体现着白求恩的医学人文思想,白求恩医学人文思想的形成渊源是,家庭教养与基督教文化熏陶埋下了其思想最初的萌芽、医学教育与专业训练赋予其思想以
第一部分NLS在PMI,定位及其与importin a相互作用机制研究目的通过间接免疫荧光技术验证PNL、PML(NLS-)胞内定位,以及通过间接免疫荧光技术和免疫共沉淀技术验证PML/PML(NLS-
我国的能源结构可以用"富煤、贫油、少气"来概括,短期内以煤炭为主导的能源结构不会发生根本性变化。而煤炭消耗占比最大的就是火力发电,虽然今年停建、缓建了一批火力发电机
审美能力的培养是初中美术欣赏教学的重要任务,初中阶段又是培养学生审美能力的关键时期。因此,教师在初中美术“欣赏·评述”课中要运用描述、分析、解释、评价等美术欣赏方