论文部分内容阅读
视频内容语义结构分析和视频内容检索是目前国际国内多媒体研究领域最为活跃和快速发展的课题。新闻视频脚本在视频内容语义分析中占有非常重要的地位,然而,一般的自动语言识别都有大量的识别错误,其结果也没有格式特征。随着网络技术的发展,新闻网站的出现,视频中的新闻故事通常会在网上找到相同或相似的新闻网页。新闻网页的文本没有视频脚本中的那些缺点,更有意义的是,新闻网页保存了大量的额外信息。如果将新闻网页和视频很好的联系起来,网页信息将很好的帮助我们分析新闻视频。
本文提出了一种借助互联网信息对中文新闻视频进行内容分析的方法。其基本思想是:首先对新闻视频进行故事单元分割,抽取故事单元的新闻脚本,然后从新闻脚本中提取新闻故事的关键词,并通过模糊计算词语的相关度和词语与事件的相关度优化搜索关键词,最后利用搜索引擎从互联网上获得与新闻事件相关的网页,并利用网页主题内容分析和Hownet语义网的相关技术进行网页过滤。本文提出的提取搜索关键词算法和获得相关新闻网页的算法,对以后新闻视频摘要的提取、新闻视频的分类与检索都有直接帮助。
本文的主要创新点在于:提出了从脚本中抽取搜索关键词并优化的算法和新闻视频与Web新闻网页的关联算法。通过对TRECVID2005视频集内中文新闻视频CCTV4_NEWS的数据集进行的实验表明本文的方法是有效的。