基于三维分类模型语义搜索的设计与实现

被引量 : 0次 | 上传用户:zhouqin1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展和普及,人们进入了开放的信息时代。信息时代给人们的学习和工作带了很大的便利,互联网也随之成为人们信息交流和共享的平台。但是互联网本身存在的动态性、异构性和无序性使人们很难快速、准确地找到自己想要的信息资源。针对互联网存在的问题,互联网的创始人Tim Berners-lee于1999年提出了语义网的构想。语义网上的资源有很好的定义,能够使人们更好的进行信息交流和协作。随着语义网思想的不断进步,人们也逐渐意识到基于语义网信息搜索的重要性,提出了一种新的信息检索方式—语义搜索。较传统的导航式的信息检索方式,语义搜索是语义层面的信息检索,能够提高信息检索的查全率和查准率,正迎合了人们对下一代搜索技术的需求。自从语义搜索提出以后,学者们对此投入了大量的研究,取得不少的成绩。但是,因为目前网络资源的海量性和广泛性,人们对语义搜索获取信息资源的效率并不满意。在此基础上,本课题将分类思想引入到了语义搜索领域,设计了一种基于三维分类的语义搜索模型。通过对信息的来源、存储和显示进行分类处理,以提高语义搜索的查全率和查准率。本课题主要研究内容和先进性有以下几点:一、本课题将贝叶斯和粗糙集的相结合,实现一种基于朴素贝叶斯加权的文本分类方法,将信息的来源进行了分类处理。通过对网页文本的分类,然后进行特征提取,从而使特征库具有了类别信息。二、本课题采用一种自底向上的本体概念选取方法,基于分类特征库,根据类别权重的高低来决定本体概念的选取,从而降低了本体概念选取的困难性。三、本课题基于以上的研究,设计了三维分类模型,将信息的来源、存储和显示进行了分类处理,提高了信息检索的查全率和查准率。本课题对语义搜索引擎进行了深入的研究,设计出一个语义搜索三维分类模型,并对模型的各模块进行了设计和实现,再结合实验对模型的可行性进行了论证。
其他文献
紫色芽叶是茶树常见的性状之一,茶树上紫色芽叶数量很大,传统的茶叶加工理论认为紫色芽叶不利于红绿茶品质的形成,如何有效地开发利用是生产中面临的实际问题。本文通过测定
我国水泥工程承包商凭借拥有自主知识产权的新型干法水泥生产核心技术、完整的工程产业链和价格优势,全面迅速地占领了国际水泥工程建设市场。由于发展速度过快,缺乏国际工程
目的本研究旨在客观评估城市上班族的午餐营养及生活质量,揭示该人群真实的营养消费需求,并初步探讨上班族的营养干预模式,为合理搭配和选择上班族的营养午餐,以及建立上班族
<正>近年来,中国改性塑料行业随着国民经济的稳定健康发展而实现了跨越式发展,连续十年经济技术指标稳步较快递增,但受到技术因素的制约,目前国内改性塑料产品仍以中低端产品
美国儿童家庭寄养经历了学徒制、安置和寄养三个时期,在儿童价值、政府责任和专业化发展等儿童福利价值取向方面,对正在发展中的我国儿童家庭寄养具有重要的借鉴意义。
本文对咸宁市三所普通中学进行问卷调查,分析表明:中学生的整体物理学习水平较低。
麦金太尔出版《德性之后》一书后,德性伦理学真正走入人们的视野。现代德性伦理学重归亚里士多德的德性论,是简单回归,抑或是基于新的道德问题进行的理论重构?麦金太尔虽然对
随着互联网及其应用的快速发展和普及,现代社会信息化程度逐渐提高,各行各业都发生了巨大的变化。高等学校的学生规模逐年攀升,传统的学生管理方式已经不能适应高校学生管理
当前,我国英语新闻的传播与发展,主要从跨文化视角出发。本文主要围绕我国英语新闻的内容展开分析。通过本文的探讨,可以发现,我国英语新闻通过极具个性化和多元化的传播方式
商标功能的发展与市场竞争密不可分。知识产权与反不正当竞争法的关系一直是学术探讨的话题,尤其是在当今权利客体日益新兴化,对二者关系的厘清以及权利救济的边际的认定愈加