论文部分内容阅读
随着视频事件描述的发展,基于文本的描述方式与基于内容的描述方式由于其存在的缺陷,已经不再适用于描述交通监控视频中发生的事件。本文的研究内容是交通视频中事件的描述与识别,其是针对视频的无结构性提出的,旨在提供对视频内容的层次化表达。目标是针对交通监控视频内容按照语义关系,利用深度学习、本体论、逻辑描述语言等处理手段,组织成可供计算机和人能理解的信息。具体的研究内容如下:首先,针对视频内容的无结构性的特点,设计了一种新型的丰富语义模型,即视频事件结构化描述模型(VSD)。该模型提取了视频中的对象、属性及关系等信息,构成视频本体,能够有效地描述视频内容,以减少低级别语义(特征)和高级别语义(事件)之间的差距。对于交通视频本体的实际创建过程,提出了利用Protege软件和从数据库转换两种构建方法,并对从关系数据库到领域本体的转换过程进行了详细分析。实验借助于Protege工具,进行了交通视频事件结构化描述模型的实现,这为下文事件描述研究提供实例创建。最后将此描述模型利用相关规则进行评分,直观地展示了所提出模型的优越性。其次,在对象描述方面,研究了模式识别和描述逻辑两个领域,即从交通对象识别检测和对象关系映射推理两个方面来进行对象语义表示。在视频对象识别检测研究过程中,探索了卷积神经网络的结构特点,提出了一个适用于交通对象识别的网络结构,对其进行参数优化,结合R-CNN对象检测方法,在实验中得到了良好的检测效果;在对象关系映射的研究中,给出了视频事件结构化描述模型中对象空间关系的具体定义(包括RCC空间拓扑关系和井字形空间方向关系),并利用本体逻辑语言进行对象关系描述。最后引入了对象一致性推理算法,用于进一步推测交通对象之间的语义关系。最后,结合视频事件结构化描述模型和对象映射的方式,提出了基于场景上下文的事件描述方法。即预先设定了交通视频中的空间、时间、特殊值上下文,利用其与目标对象的关系提取视频中每一帧的语义信息。以此为基础,在交通事件识别上引入了事件单元概念,提出了基于贝叶斯分类器和有限状态自动机的事件识别方法,用于实现简单与复杂交通事件的识别。实验中证明了所提出的事件描述方法和识别方法的可行性。