基于Cluster-FCA-Merge算法的本体构造

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:GoAndSeek
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体是共享概念模型的明确的形式化规范说明,是下一代因特网的核心与基础。在信息管理、知识挖掘和知识共享等方面有着重要而广泛的应用。本体构造是一种自动或者半自动构造本体的技术。它是本体应用的起点,因而它是一个重要的研究方向。本文首先介绍了课题的研究背景和相关技术---文档聚类,并且综述了本体构造的研究现状和趋势。然后,针对现有本体构造的算法的时间与空间效率不高以及输出本体的质量不好的问题,根据“分治的思想”本文提出了Cluster-FCA-Merge本体构造算法:(1)使用改进的k-means算法对文档进行聚类。这种改进的k-means文档聚类算法的特点是在于它确定了聚类的起始点,而没有按照传统的k-means那样随机的选择聚类起始点,从而改善了聚类的效果和质量。(2)根据聚类的结果,基于每个“簇”分别构造一个本体。(3)计算每个本体之间的距离,使用FCA-Merge合并距离小于某一阀值的2个本体。最后,将使用Cluster-FCA-Merge得到的本体与手工构造的本体进行比较,得出它们之间的词全度和词重度。
其他文献
Web服务技术是当前基于Internet构造跨企业分布式应用的标准框架,是基于SOA的企业业务集成解决方案的支撑技术。Web服务组合技术用于实现服务之间的有效集成,成为衔接以Web服
本文主要研究对象是实时数据库系统中的历史数据库,构建实时数据库系统VegeBam的基本层次结构和研究历史数据库中的多维空间索引技术,并在研究的基础上开发一个具有自主知识
在程序设计语言考试中,编程题的计算机自动出题技术及自动评分技术是非常有实用价值的应用,也是实现编程题在线考试功能的关键技术。根据试题难度及实际考试情况的不同,专家
分类是数据挖掘任务之一,KNN算法是一种思路简单,易于实现的分类算法。KNN根据未知样本的K个近邻样本来预测未知样本的类别,近邻样本的选择是根据一定的距离公式判定的。距离的
天然卫星的高精度天体测量能够改进行星及其卫星的轨道理论,对太阳系起源和行星物理的研究具有基础性的意义,天然卫星的高精度定位观测对空间探测也具有基础性和前瞻性的意义,如
煤与瓦斯突出一直是国内外煤矿安全生产方面关注的焦点问题。多年来尤其是近几年我国煤矿存在着多种安全隐患方面的威胁,煤与瓦斯突出最为严重和常见。由于预测手段的落后,不
学位
随着空间信息技术的发展,目前空间信息服务主要有客户端/服务器(Client/Server)和浏览器/服务器(Brower/Server)两种结构,代表软件分别为ArcGIS和WebGIS。以C/S结构为主的胖
由于嵌入式系统具有体积小、性能好、功耗低、可靠性高以及面向行业应用的突出特征,目前已广泛应用于军事国防、消费电子、信息家电、网络通信、工业控制等领域。研发适用于
随着计算机网络技术的迅速发展,出现了带宽大于10Gbps的高速网络,而且带宽还有不断增加的趋势。一些应用如科学协作、远程诊断和实时检测利用高速网络从远程探测器如卫星、雷