WWW图像语义信息提取方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:jiffylube
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对日益增长的网络图像,本文研究了基于HTML文档的WWW图像语义信息提取方法,在语义层次上实现了对图像的自动标注和分析。本项研究对基于内容和语义的WWW图像检索具有重要意义。 HTML文档作为WWW图像的外部信息源和载体,蕴涵了丰富的描述图像内容的文本信息。HTML文档中的图像名、图像注释、图像周围文本、图像URL、图像所在网页URL及标题、图像超链接网页URL及标题等在一定程度上反映了图像的关键内容和语义。为了从这些与图像相关的文本中提取图像的语义信息,本文根据图像的视觉属性和语义属性提出了一种图像语义表征模型,并建立了相应的语义词典,包括图像主题词分类词典、图像主体词分类词典、图像主体属性词典和用来翻译汉语拼音、英文单词或缩写词的图像主题词对照词典。 根据图像的相关文本和语义词典提取图像语义信息的基本过程分为三步:(1)利用图像主题词翻译词典,将图像相关文本中出现的汉语拼音、英文单词或缩写词翻译成中文主题词;(2)将图像相关文本自动分词和词性标注;(3)利用图像语义词典,采用基于规则与基于统计相结合的方法,从图像相关文本的分词标注字符串中提取反映图像语义信息的主题词、主体词及其属性词。 基于上述思想,本文研发了一个WWW图像语义提取系统。该系统由图像元搜索和预处理、图像语义信息提取及主题词在线学习三个模块构成。图像元搜索和预处理模块负责从Google与Baidu上搜索图像与相关网页,并提取图像相关文本。图像语义信息提取模块负责从图像相关文本中提取图像主题词、主体词及其属性词。主题词在线学习模块负责主题词分类词典的在线学习与自动添加。 本文最后给出了提取WWW图像语义信息的实验结果。实验表明,提取图像主题词、主体词及其属性词的平均覆盖率为52%,平均准确率为44%。实验说明,这种图像语义信息提取方法,在基于内容和语义的WWW图像检索中具有较高的应用价值。
其他文献
我国的大众传媒已经告别精英文化步入了大众文化时代。电视作为最普遍的媒体门槛也逐渐降低,越来越多的普通人能够参与到电视节目中来,出镜对大众来说已经是极为普通的事情了。
3年一届的美国拉斯维加斯工程机械展览会(CONEXPO-CON AGG)在2020年3月10日拉开帷幕,作为中国工程机械行业佼佼者,山河智能携最新满足美国排放标准要求的T4F全系列挖掘机、滑
期刊
建筑工程类大型钻机通过钻具进行工程钻孔,可以达到工程预期的目的.钻具的质量决定锚固施工的快慢.锚固钻具在不同地层的使用寿命并不相同,锚固钻具的使用寿命主要与整个钻孔
软轴式变速操纵系统具有换挡阻力小、行程空距短、布置灵活、质量轻等优点,被广泛应用于液力推土机中.在推土机作业过程中,软轴式变速操纵系统出现故障的频率较高,本文对此类
1台旋挖钻机连续作业5h后,旋挖钻机显示器显示液压油温超过80℃并报警停机.根据该机散热系统与主卷扬系统原理分析故障可能原因,并逐步排查,最终发现K口单向阀处有异物.清理K
动臂是挖掘机进行工作的重要部件之一,其动臂的结构优化是一项必须持续进行的工作.在挖掘,回转,甩方等一个工作循环状态下,其应力变化具有典型的周期性.重点分析采用最大挖掘
当前的初中英语教学仍然存在着费时较多、收效较低的问题,这直接导致学生各个方面的素质没有得到全面、均衡、和谐的进步和发展.英语教学存在的这种问题的主要原因就是教师的
目前,互联网已经成为人们获取信息的重要途径,网上信息的检索变得尤为重要。基于内容的图像检索(CBIR)作为多媒体信息检索的一个重要组成部分,是近几年来人们研究的一个热点课题