基于维基百科分类体系的多语海洋叙词表构建

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:aiwo2516
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自古以来,海洋的重要性就不言而喻,一方面它作为生命的摇篮孕育了生命,另一方面它作为资源的宝库蕴含了十分丰富的资源。但是海洋是浩瀚而神秘的,作为海洋大国的我国,海岸线就长达18万公里,我们只有运用科学的调查方法和规范的管理手段才能逐渐揭开海洋的神秘面纱。随着经济、科技的发展以及经费和人力的不断投入,我国的大洋科学考察事业得到长足发展。一方面加强了国际间的合作:我国不仅积极参与国际合作调查项目,还积极组织建立国际调查项目,吸引了多个国家组织的参与;另一方面我国自主开展的大洋科学考察航次越来越多,使用的科学实验设备也越来越先进,获取了大量的珍贵的样品及数据。基于以上现状,如何科学规范的管理这些科研数据,对海洋事业的发展尤为重要。本文以海洋数据管理为出发点,致力于研究以维基百科为语义资源来构建多语海洋叙词表的问题,以期实现海洋叙词的科学有效管理,为其他海洋数据的使用和管理提供便利。主要工作包括:1.研究维基百科的组织特点,分析维基百科作为语义资源的可行性。2.研究叙词表的编制标准及微观结构,形成维基百科链接关系与叙词表微观结构的映射关系。3.研究当前利用维基百科来计算语义相关度的算法,并根据这些算法的特点对其分类。4.研究维基百科转储数据的特点,使用相关算法和工具抽取并保存维基百科转储数据中的相关信息。5.研究支持向量分类机的特点,并结合一定的语义相关度算法实现相关信息的分类。
其他文献
基于用户会话的测试技术主要依赖于收集的用户会话数据集:数据的数量越多,测试能力就越强。但是随着数据量地递增,用于分析、存储这些用户会话的成本也会迅速地增加。因而,需
无线Mesh网络(Wireless Mesh Network,简称WMN),是一种新型的无线通信网络。无线Mesh网具有自组织性和自愈的特点,是一种多跳的宽带无线网络结构,也是一种高容量、高速率的分
本文对高校计算机排调课问题进行了详细分析,并对排课问题的多目标进行了详细的描述且加以量化;结合UML分析方法对排课需求进行数据库建模;通过分析遗传算法和模拟退火算法,
用例对遗留系统的理解、维护、移植和再工程有重要意义。目前,遗留系统用例挖掘的研究主要是通过检查和分析面向对象系统的代码来实现。但是许多遗留系统是在面向对象的设计
教育信息化是以现代信息技术为基础的新教育体系,在“虚拟”的数字化校园中,依托丰富的网络信息资源,通过信息管理软件系统可以提高教学管理水平。 实验教学则是高职院校教学
数据挖掘(Data Mining)是指从大量结构化和非结构化的数据中提取有用的信息和知识的过程,数据挖掘的研究已经取得了重大的进展,而且被应用到众多的领域。关联规则是数据挖掘
随着web应用的日益广泛和网络安全环境日益恶化,网站的安全问题日益突出,WWW服务器防护技术的研究日益得到重视。入侵检测技术作为一种积极主动的安全防护技术,提供了对内部
信息资源集成融不同的信息技术和领域为一体,从集成的角度对这些信息功能单元实施重组;在各个“信息孤岛”之间架起桥梁,就成为企业信息资源集成管理的首要任务。信息资源集成技术作为一门新兴学科,广泛应用于各行各业中,已经成为各界关注的热点。本文将经典信息资源集成思想的核心概念引入到电力企业,针对电力行业特色和供电企业调研结果,得到电力企业信息系统的集成功能构架;讨论了信息资源集成在电力企业实施中重点要解决