基于网络基因理论的特定群体发现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yuggmacc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,其在人们生产生活中所占的比例逐渐增高,互联网用户的规模也在逐年扩大,尤其是社交网络应用,汇聚了几乎互联网中的绝大多数用户,人们的社交生活也逐渐从现实世界转向虚拟的网络世界,呈现一种虚实映射的局面。在社交网络中因为一些相同或相似的内在因素,例如兴趣,立场,而有组织地聚集在一起的集合叫做群体,群体内的个体可进行互动和信息共享,进而相互产生影响。而社交网络群体的发现对于现实世界的工作有着相当大的意义,一方面群体发现可广泛应用与商业应用中,尤其是在检索,传播,推荐等方面,可以提供有力的支撑;另一方面,由于当今的群体依托于虚拟的互联网技术,所以互联网中汇聚了大量以恶意行为为目的聚集的群体,比如舆论水军,谣言群体,这些群体以同样的恶意目的聚集,有着同样的行为模式,严重影响甚至危害互联网安全以及现实世界的安全,对于这类群体需要及时有效地发现并进行管控。因此特定群体的发现是一项极有现实意义的课题。由于互联网中的用户背后往往是由现实世界的个体进行操纵的,因此互联网用户在网络中的行为通常具有现实用户的行为特征,通过挖掘,这些特征可唯一表征互联网中的某个主体,借鉴生物学中的基因概念,产生网络基因的理论。我们的课题就是在网络基因理论的基础上进行特定群体的发现。网络基因的组成结构中最核心的是网络基因单元,其能决定网络主体的性状,能够表征网络实体某一方面的本质特征,因此在群体发现的研究中主要用到了网络基因单元,本课题所涉及到的基因单元有话题基因单元,立场基因单元等。在网络上对同一话题持相同或相似立场的网络主体属于同一群体,当发现的网络主体的数量达到一定程度时则表示发现一个群体,因此本文需要从主体发表的网络推文中提取出话题基因单元与立场基因单元。通过LSA等方法进行话题的抽取,根据TF-IDF和余弦向量描述话题基因单元之间的相似度,从而进行话题的合并,通过情感分析的方法进行立场基因单元的抽取。在发现的群体基础之上,本文进一步进行关键人物的识别,通过抽取话题影响力基因单元和个人影响力基因单元,综合两个指标来进行关键人物,即有较大影响力的网络主体的识别。
其他文献
径向基(RBF)神经网络是一种典型的前馈型网络,因为其只有一个隐含层的简单构造,较快的学习速度,不容易陷入局部最小化,具有良好的泛化能力等优点在很多领域都体现出了优越性。粒子群优化算法(PSO)作为一种智能搜索算法,有较强的全局收敛能力和鲁棒性,且模型简单,没有遗传算法中的遗传操作,常被应用于RBF神经网络的参数寻优中。本文主要研究对象为PSO-RBF神经网络算法,在PSO算法改进方面选择收敛的惯
质谱是一种通用的检测手段,它可以提供离子的质荷比和结构信息。且质谱同时具备高灵敏度,适于定性定量分析,易于小型化等优点。然而在分析复杂样品分析时,由于基质效应的存在,如果复杂样品未经预处理或者分离过程,实际样品中低丰度的组分很难被检测出来。但是小体积或低浓度的样品很难经受复杂的预处理或分离过程。因此,急需一个简化的且效率高的分离方法。在液相条件下,液相色谱和毛细管电泳可以和质谱进行联用用于复杂样品
近年来,移动设备产品的增加使得无线通信的服务需求呈现出了爆炸性地增长。高效、灵活地利用好频带资源,是解决好无线通信服务供给与用户需求的关键性因素,这驱动着无线通信
混凝土是我国工业与民用建筑等工程领域采用最为广泛的建筑材料之一,随着混凝土建筑使用年限的增加,其结构和材料耐久性问题越来越引起国内外诸多学者的关注。抗冻性作为衡量混凝土耐久性的一项重要指标,国内外学者提出了许多理论,并做了大量实验研究,包括干湿循环、盐腐蚀和冻融破坏等环境耦合作用下的混凝土试件各项性能研究,但是关于钢筋混凝土构件在荷载、复合盐及冻融循环作用下受压承载力损伤的研究较少。冻融破坏已经成
《中华人民共和国城乡规划法》是统领我国城乡规划与建设领域的一部法律.尤其是该法第六十八条的制定具有突破性和创造性,该条确立了行政机关自行强制拆除违法建设的“新模式
精神疾病公众污名是指个体对精神疾病的负面态度,通常包括负面的认识、消极的情感体验以及由此产生的歧视行为,它会使精神疾病患者被贴上诸如“神经病”、“疯子”等耻辱性标
数控加工中,刀具轨迹的速度规划对曲面的加工质量有着重要影响。当前主流速度优化算法只考虑沿进给方向的优化,而忽视了加工速度在刀位点曲面(简称CL曲面)横向的一致性优化,继而可能导致加减速区间沿横向的错落分布,最终影响曲面的加工质量。针对上述情况,本文提出了一种在三轴数控加工中,基于CL曲面的速度横向优化算法。算法核心包含以下三步骤:CL曲面横向信息的重构,CL曲面特征线的构造,以及横向一致的轨迹速度
经济快速发展诱发了更多出行需求,城市内交通拥堵问题日益严重。智能交通系统被认为是缓解拥堵提高效率的有效方法之一。交通预测技术能够为智能交通系统实现交通信息发布与
深度学习引起的人工智能热潮,激发了研究者们通过深度学习探索问答系统的热情。问答系统作为人机交互的重要方式,能够让机器通过人类语言与人进行交流。由于现实世界的信息通
视觉跟踪是计算机视觉领域的热点话题,旨在只通过给定视频第一帧目标所在的位置和尺寸在后续帧中准确找出目标所在位置和大小。近年来,基于相关判别模型的视觉跟踪算法由于其