微博热点事件跟踪与视觉总结方法研究与实现

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:zjp_22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博服务平台的快速发展,使用微博的用户数也越来越多。人们基于此传播和获取与热点事件相关的信息,这些微博的内容高度相似,信息质量参差不齐,亟需相关技术将其梳理。给定一个与热点事件相关的微博和内嵌图片集合,本文旨在检测并跟踪其主要子事件的发展,并为每个子事件选择代表性的图片。本文将事件跟踪转化为聚类跟踪,跟踪聚类随时间的发展模式。本文中将微博流建模为动态投递网络,将事件跟踪建模为在动态投递网络上的增量聚类跟踪,对基于密度的聚类算法DBSCAN进行改进,提出CDBSCAN聚类算法,使其适用于增量聚类。有一些研究是基于单点更新的增量聚类算法,为了提高效率本文采用批量更新的增量聚类算法。经过固定的时间间隔,在每一个时刻依次进行基于批量删除更新和批量添加更新的增量聚类算法,同时记录聚类的发展模式,然后基于此记录推算出在相邻时刻的聚类之间的发展模式。通过实验表明,该方法可以有效地检测出主要子事件,能够跟踪聚类发展的完整生命周期。在事件跟踪领域同时使用文本和图片的研究比较少,作者提出视觉总结算法为事件选择有代表性的图片。首先根据图片的属性过滤噪声图片,然后基于颜色直方图和边缘方向直方图用SVM训练一个噪声图片分类器,利用分类器进一步过滤噪声图片。对同一个文本聚类内部的图片使用CDBSCAN聚类,选择每一个图片聚类里面优先级最高的图片,对选择出来的图片基于热度排序。通过实验表明选择的图片与事件密切相关,有助于用户理解事件。实现了一个基于微博热点事件跟踪和视觉总结的系统。采用批量更新的增量聚类算法实现聚类跟踪,对每个事件使用视觉总结的方法选择代表性的图片。
其他文献
基于多视角的唇动的身份识别技术,是多视角人脸识别和正面唇动身份识别的生物特征识别技术的延伸和组合。说话时的唇动信息,既体现了说话人嘴唇的固有生理特点,也反映了运动
水面倒影图像是非常常见的一种自然景观图像。目前对水面倒影图像的研究多集中在如何拍摄、制作虚拟现实的实现上,而基于视觉的对水面倒影图像理解和检测方面国内外都未开展
学位
随着信息化时代的到来,人类对信息的需求越来越丰富。作为诸多计算机研究中最为活跃领域之一的视频编码技术也随着应用要求的改变而不断发展。传统视频压缩编码标准,如MPEG-X系
随着信息化技术的迅猛发展和国际化市场竞争的日趋激烈,企业的全球化与信息化已成为必然趋势,各企业之间的业务协作越来越频繁,也越来越复杂。然而由于各个伙伴企业的模型在
BT是一种P2P协议,以集中式结构为基础的应用层协议。该协议及其软件自出现以来,因其强大的文件共享功能而备受欢迎。BT在带来便利的同时,也带来许多问题,如占用网络带宽、传
ARM Cortex-A15系列处理器是当前最新的嵌入式ARM SoC,该系列处理器首次集成了Mali-T600系列的移动GPU,该系列GPU率先支持OpenCL计算框架,可以利用GPGPU (General-Purpose co
数据库是信息系统的核心,集中存放着大量重要而又敏感的数据,是最吸引攻击者的目标,一旦数据被黑客窃取或者是破坏,其损失难以估量。传统的数据隔离技术不能有效地防护黑客的
随着计算机和网络的飞速发展,我们已经进入了数据信息爆炸式增长的时代,如何从海量的非结构化信息中提取真正满足用户需求的信息,已经成为一个越来越重要的研究课题。自然语
跟踪视频中的运动目标是计算机视觉领域中富有挑战性的课题之一,在视觉导航、安全监控等领域有着广阔的应用前景。开发鲁棒的跟踪算法也具有重要的理论意义。文献中广泛使用的