论文部分内容阅读
近些年,网络信息技术飞快的发展,使得视频信息量呈急剧膨胀之态。这对于视频快速检索来说,具有相当大的挑战。为了提升检索视频的效率,可利用视频场景分类技术提高视频检测效率来达到快速视频检索的目的。本文对场景分类中场景关键帧的空间位置信息及其划分、场景多特征提取及融合、场景分类进行了研究,主要内容及创新点如下:(1)视频场景平均关键帧划分。视频的关键帧包含了丰富的视频场景信息,因此可用关键帧集合来表示一段视频流的主要内容。对于场景识别而言,场景的空间位置信息对于场景识别至关重要。考虑到关键帧图像内部的各场景之间存在的相互空间位置关系以及不同场景对于场景识别的贡献程度不同,将视频场景关键帧进行了划分,划分出感兴趣区域(ROI)、次感兴趣区域(SROI)以及不感兴趣区域(NOI)。通过对场景平均关键帧进行划分,这在极大程度上剔除了对场景识别无效的内容,同时也保证了所识别场景内容的完整性和相关性。(2)视频多特征提取及融合。场景识别率与其描述特征有关。在场景识别过程中,若仅使用唯一的特征去描述场景信息,会使得描述量与真实量之间存在较大的偏差。提取场景的多种特征可以有效的解决场景描述偏差问题。颜色特征、纹理特征是有效的场景描述特征。实验中提取了平均关键帧的灰度共生矩阵及“色调积”特征,并将这两种特征进行加权并行融合,得到视频场景的综合特征。(3)提出阈值判定分类算法。将特征阈值作为衡量视频场景之间相似度的一个标准。对于相似场景来说,其场景内容的描述量具有强一致性。实验中采用LDA分类法和K-最近邻分类法作为对比实验。实验结果表明,阈值判定分类算法实验准确率较高,准确率达到80%,比LDA分类法以及KNN分类法的实验准确率分别高出11.25%和5%。并且阈值判定分类法的分类结果稳定性强,是一种鲁棒性强的分类器。