论文部分内容阅读
随着互联网的发展,各种智能设备、工具的层出不穷,人们能够越来越容易地向互联网上传各种数据或者通过其获取数据。这其中,视频数据成为了人们重点关注的数据之一,然而,视频数据也具有数据量大、内容丰富(包含图像、声音、文字等)、时序性等特点,这些特点给视频的存储、搜索等带来了极大的挑战。面对众多少则十几秒、多则几个小时甚至更长的视频,电影视频成为人们平时生活中不可缺少的一部分,用户需要在短时间内找到自己感兴趣的电影,他们希望通过浏览几张图片或者十几秒的视频片段便能了解一个两小时的电影的主旨,从而确定是否要观看该电影的全部内容。根据用户的需求,视频总结算法成为解决这种需求的有效途径。然而,目前的大部分视频总结算法都是将一段长视频进行笼统的概括,或从头至尾提取关键帧,或对视频进行时间上的压缩,重点不突出,并且基本没有专门针对于电影视频的视频总结算法,电影的视频总结(电影预告片提取)还处于人工提取的阶段,这个过程需要花费大量的人力和时间。本文的目的就是提出一种视频总结算法能够自动地提取电影视频的预告片,总结的视频内容不是对视频内容从头至尾的笼统概括,而是有重点地将视频内容吸引人的部分总结出来,从而达到短时间内突出视频主旨、吸引观众的目标。本文首先提出了一种集成半监督学习算法的框架,将半监督分类算法和半监督聚类算法结合起来,使用“一致性假设”的构想,分类算法和聚类算法互相弥补不足,使分类器最终的预测结果更加可信。然后将少量的电影官方预告片和这些预告片相对应的电影作为已知数据,将少量的已知数据和大量的未知视频数据放入提出的半监督分类框架中,输出未知视频中预测为电影预告片的部分,最后将预测为电影预告片的部分连接成一个流畅的视频片段。本文首先将提出的半监督学习框架在大量的数据上进行了实验,证明了其能够获得很好的分类效果,并且具有鲁棒性;随后在多个电影视频上进行视频总结算法实验,将最终提取出来的总结视频与官方电影预告片作对比,与人工选取的视频片段具有较高的相似性。本文不仅提出了一种简单的集成半监督分类框架,还首次将其应用在的自动提取电影预告片中,获得了良好的实验结果。此视频总结算法的提出为视频应用上层的视频搜索、视频推荐奠定了良好的基础,也对未来的视频总结算法研究具有重要意义。