论文部分内容阅读
近年来,随着多媒体技术以及网络技术的快速发展,多媒体数据急剧增加。由于视频的低层特征与人类思维中的语义概念之间存在语义鸿沟,基于语义概念的视频检测技术已成为多媒体分析领域的研究热点,它可为海量视频的检索与管理提供有效手段。其中,视频事件可以定义为不同的视频对象在一段时间内的相互作用,它蕴含了视频的主要语义内容。因此,研究快速有效的视频事件语义检测方法至关重要。
本文首先简要地介绍了课题研究的背景及意义,然后分析了视频事件语义检测的研究现状。在此基础上,本文提出了基于概率超图的视频事件语义检测方法、基于半监督增量学习的概率超图语义模型的构建方法以及相应的原型系统的开发,主要工作如下:
(1)提出了基于概率超图的视频事件语义检测方法。该方法首先将颜色、纹理、形状等底层视觉特征进行融合;然后定义视频段的亲密度函数并利用亲密度的信息构建概率超图模型,其中每条超边对应一种事件语义;采用随机游走过程来预测视频段属于每条超边的概率;最后结合阈值采用条件概率模型对视频段进行事件语义分类。实验结果表明该方法使多语义事件检测的查全率和查准率得到了提高。
(2)提出了基于半监督增量学习的概率超图语义模型的构建方法及基于此模型的识别检测。该方法在概率超图的基础上结合半监督学习及增量学习的机制实现一种新的概率超图模型的构建方法;采用方法(1)中提出的视频事件语义检测方法对视频段进行分类识别;最后通过实验比较验证该方法的有效性。
(3)为了验证上述方法的有效性和可用性,本文采用面向对象和模块化设计的方法,以VisualC++6.0和Matlab7.0为开发工具,实现基于概率超图的视频事件语义检测的原型系统。该原型系统主要包括:视频入库及预处理子系统、视频事件语义建模子系统、视频事件检测子系统。