【摘 要】
:
随着信息技术以及多媒体技术的蓬勃发展,数字视频的数量飞速增长,急需新的技术对其进行分析与处理。在视频的分析过程中,首先需要对视频场景进行分割以提取元数据。另外,视频的审核也是短板之一,需要一种方法对视频中的暴力内容进行检测。本文提出了一种使用深度神经网络-隐马尔科夫模型、滑动窗口以及多模态的视频场景分割算法。该算法首先提取镜头的视觉、音频和字幕特征;之后利用深度神经网络-隐马尔科夫模型来推断镜头所
论文部分内容阅读
随着信息技术以及多媒体技术的蓬勃发展,数字视频的数量飞速增长,急需新的技术对其进行分析与处理。在视频的分析过程中,首先需要对视频场景进行分割以提取元数据。另外,视频的审核也是短板之一,需要一种方法对视频中的暴力内容进行检测。本文提出了一种使用深度神经网络-隐马尔科夫模型、滑动窗口以及多模态的视频场景分割算法。该算法首先提取镜头的视觉、音频和字幕特征;之后利用深度神经网络-隐马尔科夫模型来推断镜头所表达的语义元素;最后使用滑动窗口算法来进行场景分割。此外还分别试用设计了前期和后期融合策略进行多模态的融合。该算法在BBC数据集上进行了实验,结果表明,与最新技术相比,该算法可以获得更高的平均FCO分数,达到了更好的效果。本文提出了一种暴力内容检测算法。该算法充分利用视频的多模态特征,尝试将一种模态的输入特征映射到另一种模态的高级语义中去,从而实现高级语义上的多模态相互融合。实验证明,该算法的结果优于单模态检测算法以及未融合检测算法。本文设计了一套原型系统。结合了上述两种算法,可以对上传的视频进行场景分割或者暴力内容检测。
其他文献
随着移动互联网的繁荣发展,移动应用在人们生活中占据了重要的位置。然而一类恶意软件会在用户不知情的情况下申请Android系统的各种权限,使得用户的个人隐私暴露在危险之中。我们通过基于深度神经网络的自然语言处理方式,即个人信息泄露检测模型,来识别出Android隐私政策中的申明权限,再与Android应用实际使用权限进行对比,从一致性角度出发分析Android应用权限滥用情况。但是,随着进一步研究,
物流文本信息作为物流管理各个环节都会涉及的重要信息,对整个物流系统起着环节衔接的作用。随着现代物流电子化、智能化发展,物流行业中使用的文本数据信息快速增长,如何对海量的物流文本信息进行压缩,从海量的物流文本信息中挖掘出重要的信息,提升阅读效率、协助物流行业进行优化升级已成为当下研究的热点问题。本文以物流文本信息摘要生成方法为研究对象,将主题关键词作为文本结构框架对摘要生成过程起到主题引导作用,并结
判断一个搜索引擎的成功与否,用户对搜索结果的满意度起了关键作用。由于通用搜索引擎搜索到的内容数量过多,且相关率低、重复率高、内容复杂,用户如果想要在通用搜索引擎中查询某一领域或专业的相关网页,检索过程还需花费大量精力去排除无用信息。垂直搜索引擎的出现正是为了解决这一问题。传统搜索引擎在博客网页信息数据的搜索上效率不高,不能满足想搜索特定博客用户的需求。本文重点研究了搜索引擎中网页相关性排序算法的改
自然语言生成(Natural Language Generation,NLG)是自然语言处理领域的一个重要分支,它将输入资料转换成自然语言表述。实现丰富流畅的自然语言生成是人工智能走向成熟的标志之一。本文关注的自动评论生成任务是NLG技术的应用领域之一。然而,目前基于生成模型的自动评论生成的工作中,生成的评论通常只包含与文章相关的信息,而极少包含人在进行真实评论时所具有的由文章内容联想出的信息——