藏文名词短语结构类型分布与统计研究

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:qq540531049
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据策略和深度学习方法已经成为藏语自然语言处理领域的主流技术。当前,知识资源和标注语料库的匮乏已经影响到了藏语智能化研究的进程,尤其是像WordNet、HowNet和框架语义一样的词汇语义资源和句法结构标注、语义角色标注以及篇章信息标注等资源,还未形成统一的规范模式,深度学习等主流的学习方法不能用于实际训练。因此,资源库建设已经成为藏文信息处理领域中一项基础而艰巨的任务。名词短语、动词短语和形容词短语研究是句法树库构建所面临的核心问题。本文在藏语句法树库框架下,对藏语名词短语及其结构展开分类统计研究,其目的是检验藏语短语结构分类归纳的准确性,提高藏语短语分析的效率,加快藏语句法树库构建的进程。文章主要分为八个章节进行叙述,首先讨论了短语的研究背景和研究现状,进一步去了解了英语和汉语中名词短语的相关句法分析理论和构建名词短语结构库所需的语料。其次,对英语、汉语和藏语的名词短语的概念进行叙述,并通过藏语文本真实语料对藏语中构成名词短语的结构进行分析,将词类修饰构成的名词短语进行分类归纳,通过分类归纳建立了藏语名词短语的标记集。最后,通过藏文真实语料中对名词短语结构的统计结果构建了名词短语结构库、名词短语词性标注库和名词短语结构标注软件。文章整体采用了语料实证、对比分析、统计分析、人工标注以及人工校对的研究方法,建立了藏语基本名词短语结构库和词性标注语料库。总之,藏文名词短语结构类型分布与统计研究为藏语句法语义分析和树库构建提供基本资源,为信息检索、搜索引擎、机器翻译、文本分类、模式识别、多媒体教学、网络等应用技术领域提供一定的理论与技术支持。
其他文献
"产业生态化和生态产业化"的首次提出为资源利用和生态保护平衡发展指明了方向。产业生态化和生态产业化既有各自独立的含义,又相互联系、互为前提。文章对当前二者逻辑内涵
高职学生的环境意识现状:1.在环境知识方面,高职学生的环境知识不够丰富。他们对自己日常生活范围外的环境知识和对一些操作型的环境知识还不太了解。2.在环保行为方面,高职
当代西方左翼思潮从资本主义替代到现代性批判之旨趣转换,包含着一个重大困境:由于价值共识和政治承诺缺乏,虽然在理论表象上它似乎愈发激进了,但在政治上实际退却了。通过当
利用1998~2009年中国省级面板数据,考察了体育发展与经济增长之间的关系。实证结果表明:中国体育发展能够有效地促进经济的增长,与此同时,教育与体育发展之间形成了良性互动
电力系统安全稳定计算的关键之一是建立准确的系统数学模型以及获取符合实际的系统动态参数。系统辨识技术在电力系统中有着重要的应用价值。提出了一种基于Prony算法的参数
二语习得研究以及外语教学实践充分说明第二语言习得的时体习得一直以来都是个难点,尤其是当两种语言差别较大时更是如此。因此,对英汉这两种差别较大的语言类型进行跨文化对
<正>一、小学数学教学现状分析在我国义务教育阶段,数学学科是所有学科当中思维性最强、逻辑性最强、创造性最突出的学科。在一般学校中,数学课程所占有的课时最多,对于学生
未来节能减排调度环境对发电企业提出了新的要求。燃煤发电企业需向交易中心申报自己的能源消耗和污染排放,同时,还要分析其能耗成本、环境成本以及其他成本,据此确定其应该
自中国加入世贸组织以来,受国外企业的影响,国内企业竞争日益激烈。许多企业开始重视工商企业管理,并把健全有效工商业业管理作为企业竞争取胜的法宝。文章将对工商企业管理
依法行政是法治建设的重要组成部分。在政府依法行政的总体进程中,地方政府依法行政的状况在很大程度上决定着政府整体依法行政的水平。但是,在推进地方政府依法行政过程中仍