【摘 要】
:
目前各界对于社会网络舆情的分析备受关注,对于网络舆情分析技术也是多元化的,其中常用的社会网络发现聚类方法有GN算法(Girvan-Newman Algorithm)。GN算法的优点是发现社区
论文部分内容阅读
目前各界对于社会网络舆情的分析备受关注,对于网络舆情分析技术也是多元化的,其中常用的社会网络发现聚类方法有GN算法(Girvan-Newman Algorithm)。GN算法的优点是发现社区的准确度高,算法结构简单,鲁棒性强。但是GN算法仍然存在问题,该算法在发现社区结构时的时间复杂度高,计算效率慢。针对该问题本文提出对现有的GN算法进行并行化改进,以此来提高对社会网络舆情分析时发现社团的速度,使得在实际应用中能够快速准确的发现社团,确定社团结构。本文首先对传统GN算法的计算过程进行分析,发现算法在计算边介数值时是串行进行的,即算法在循环过程中一次只计算网络中一个节点的广度遍历图所生成的节点与边之间的关系结构。该结构为接下来在扫描点到点之间的最短路径时所记录的边介数值提供了先验条件。通过对并行化计算理论的研究与GN算法相结合,得出GN算法的可并行性。其次,建立算法的并行计算模型,描述舆情网络中各个节点之间的关系,分析节点与边的联系,并基于此模型设计出并行化的GN算法。再次,引入Hadoop平台,通过Hadoop下的MapReduce并行机制与算法进行结合,使其在多机的模型下分别计算网络中的各个节点,从而实现降低算法时间复杂度的目的,在不降低算法准确度的前提下提高舆情网络中的社团发现的速度。最后,通过实验结果对其并行化效果进行分析,并与传统GN算法所计算的结果进行比较,得出结论。经实验结果得出,算法并行计算下的准确度与串行的计算结果一样,在不减低算法准确度的前提下加快了舆情网络社区的发现速度。最终,经过改进后算法的时间复杂度有明显的降低,并且可以在工程实例中运行,这为监控社会网络舆情提供了方便,为社会的和谐和安定提供了帮助。
其他文献
女大学生是大学生中情感较为丰富、细腻的群体,对感恩教育有着自己深刻的理解。目前,女大学生感恩状况整体乐观,但缺失现象依然存在;知易行难,认识与行动难以统一;感恩行为被
[目的]观察语言沟通技巧在儿童心理护理中的应用效果。[方法]将86例行伤口治疗的患儿随机分为对照组和观察组各43例,对照组给予常规心理护理,观察组在常规护理的基础上应用语
[目的]分析和探讨积极心理学理论在精神分裂症临床康复中的护理效果。[方法]选取本院收治的90例精神分裂症病人,通过随机数字表法分为对照组和观察组各45例,两组病人均给予精
国务院于2014年8月10日发布的《关于加快发展现代保险服务业的若干意见》(以下简称“新国十条”)引发了杜会的广泛关注和行业的热议。“新国十条”给整个保险行业明晰了两大
<正>很多人以为,飞机失事时只能听天由命。但航空界专业人士称,飞机失事无人生还的情况,一般是发生空中爆炸或事故发生在开阔水域。在飞机起飞或着陆时发生意外情况,只要掌握
运用SWOT方法,对我国临终关怀事业进行系统分析,认为发展我国临终关怀事业的优势:符合中国人死亡趋同、低成本高效益且发展空间大;劣势:政府和社会支持有限、服务机构和服务
以河北省公共服务绩效为研究对象,从文化教育、医疗卫生、科学技术、公共就业、公共设施以及公共环境六个方面,对河北省11个城市选取10个指标,构建了河北省公共服务绩效评价
转职能、转方式、转作风,是当前纪检监察机关重要任务,对于纪检监察工作回归主责主业,集中精力履行党章赋予的职责具有重要意义。高校对于"三转"工作认识还不够统一,思路还不
探讨了豫北地区园林植物病虫害发生的原因,并就其中典型的病虫害防治工作作出说明,以期实现人与环境之间的和谐共存,并为城市的现代化建设提供保障.
目的:探讨门诊输液室护患沟通中存在的缺陷,找出影响护患沟通的薄弱之处,为进一步提高护患沟通做出努力。方法:采用调查问卷的方法在门诊输液室发放自行设计的问卷表50份,向2