基于网络的多媒体节目编目信息抽取技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:rrttwytpic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着数字多媒体业务的不断扩展,数字多媒体业务的观众对多媒体节目编目信息的要求也随之而来。而目前尚没有此领域的研究来满足观众的这一迫切需求,这也正是本文研究的背景和选题的动力。Internet的飞速发展使WEB数据不断增长,导致了大量半结构(semi-structured)数据的产生,因特网上存在的大量与多媒体相关的描述信息使得我们从中获取多媒体节目编目信息成为可能。为了获取多媒体节目的编目信息,论文着眼于Internet资源,将多媒体节目编目信息的网络自动抽取技术作为研究的目标和任务。论文首先研究了WEB信息抽取技术的一般分类和WEB信息抽取系统的一般实现方法。在此基础上,结合多媒体节目编目信息的特点,提出了一个多媒体节目编目信息网络自动抽取系统NMPIES,该系统设计比较简单,结构清晰,理论上可以完成实现论文所提的目标。WEB预处理和网页自动分类是编目信息抽取的前提,也是论文的研究重点。传统的WEB预处理技术一般只涉及到HTML的噪音过滤、文本抽取等技术,利用这些简单技术很难为多媒体节目编目信息的抽取做好准备。因此,论文在研究了HTML网页的特点后,提出了一套适用于多媒体节目编目信息抽取的WEB预处理技术,其中包括HTML-Tree中心内容确定方法、基于HTML-Tree方法的网页特征提取等关键技术,通过这些关键技术的实现,很好地达到了对WEB信息进行预处理的目的,提高了网页自动分类的查准率和查全率。然后论文研究了多媒体节目编目信息抽取的主要实现技术,使用了基于主题的信息抽取方法,该方法通过多媒体节目编目信息模板的构建、主题相似度的判断和模式匹配最终得到较为完整的多媒体节目编目信息,该方法可以较好地完成预期目标,获取一些简单的常用的编目信息。最后,论文在Java平台上实现了论文所提出的多媒体节目编目信息自动抽取系统NMPIES,并进行了大量的实验,取得了较好的结果。
其他文献
混沌现象是确定性非线性动力系统中一种类似随机的过程。混沌运动的动力学特性可用来描述和量化许多复杂现象。混沌信号具有遍历性、非周期、连续宽带频谱、似噪声且确定可再
摘要:冷藏库的设计要满足制冷设备及制冷工艺的要求,还必须做好外围护结构的隔热,防潮设计。随着制冷技术的不断革新,冷库建筑设计也必然应进行相应的改进,可以说这是冷库设计成败的关键。  关键词:隔热设计;防潮隔湿设计;地坪防冻;冷桥处理    引言  目前,全国冷库的总容量为700多万立方米,随着我国经济的发展,人们的生活质量要求越来越高,由于反季节消费,食品、饮品等生产企业仓贮等需要冷藏过渡贮存的食
期刊
现代战场电磁环境的日趋复杂,对无线电探测系统的性能提出了严峻的考验,要求目标探测系统能够在干扰信号存在的情况下仍能获得速度和距离信息。伪随机码跳频(Pseudo Random N
1946年,Gabor将Fourier变换的变换核即复指数函数,与一类可时移的窗函数乘积,构造了一新的可时移和频移的变换核(即基函数),从而提出了基于Fourier变换的复值Gabor变换。虽然
高速下行分组接入(HSDPA)是第三代移动通信合作伙伴项目标准化组织(3GPP)在R5协议版本中提出的一种为了提高频带利用率、加快信息传输速率和增加系统容量的WCDMA的加强技术。
本文以广东科技展览馆中的比特球展项为背景,对项目中涉及到的图像实时采集,图像处理和图像传输等重要模块进行了详细描述,设计和实现。  论文主要是研究人脸检测和人脸特
进入20世纪90年代后期,民用和军用两方面需求都推动着宽带多媒体通信卫星系统的发展。在民用通信领域,由于多媒体业务已经深入到人们的日常生活当中,全天候、多地域、大容量的多
在我国广播电视事业不断发展的过程中,电视信号监测系统也在不断发展和更新着。随着数字电视的推广普及,广播电视监测也从模拟电视信号的监测转向数字电视信号的监测,并且由
近年来,公路运输业在各国都得到了快速发展,给人们带来方便的同时也带来了很多压力,如车辆超载导致公路寿命缩短。随着车辆的日益增多,使得交通运输的管理和车辆检测成为社会的一