蒙汉英语言知识库的构建

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:kingsword001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过本研究,构建了蒙汉英语言知识库。论文中主要介绍了“蒙汉英词典”数据库、蒙古语词法变化形式库、多语句对齐语料库的构建工作以及建库平台、蒙汉英语言知识库用户界面的研发等内容。“蒙汉英词典”数据库,共收录20551条记录,设置了词形、音标、读音、结构、词性、语义类、对译语、与别的库连接的连接数字等方面的25个属性字段。蒙古语词法变化形式库,共有2442960条记录。记录为“蒙汉英词典”数据库所收录记录的词法变化形式。共设置了序号、词根、词根词性、词法变化形式等10个属性字段。该库记录是通过制定规则,用程序自动生成的。多语句对齐语料库是以两种形式构建的,分别为文本文件库和Access 2007数据库。共收录了4174对蒙汉单向句级对齐句子和25000个多向句级对齐的蒙、汉、英句子。句子选自当代正式出版物。以Access 2007数据库形式构建的语料库,共设置了序号、蒙古语句子、汉语句子、英语句子、来源出版物等9个属性字段。构建蒙汉英语言知识库的目的有三个:一、为蒙古语母语教学和第二语言教学提供工具,为汉语、英语等第二语言教学提供资源。二、为蒙古语跨语言检索提供语言知识。三、为机器翻译提供机器词典和对齐语料库。出于以上目的,同一个表述对象设置了几个属性字段,比如音标,设有2个属性字段,即内蒙古大学制定的拉丁转写形式和“蒙古文正字法词典(修订本)”所使用的拉丁转写形式。建库平台由词性标注、复合词类别标注、词法变化形式生成、与语料库连接的连接数字、与词法变化形式库连接的连接数字、词形生成、建立语料库单词索引等功能模块组成。这些功能模块都用于构建数据库,所以把它命名为建库平台。蒙汉英语言知识库用户界面是为了给用户提供方便而构建的。它具有精确查询和模糊查询功能,查询词可以用蒙科立蒙古文输入法输入,也可以用微软蒙古文输入法输入,或用内大拉丁形式录入。显示项为基里尔蒙古文、汉文、英文、同形词、同音词、同根词、同语义类词、语法变化、例句、名词术语等。可以显示全部,也可以显示一项或多项。本论文,也介绍了构建数据库时遇到的问题及其解决的方法。
其他文献
本文采用了整群抽样的方法,对校内2012级所有选修健康教育学的班级通过调查问卷的方式,对中医院校医学生对于目前健康教育学课程重要性的认识,以及对最终教学效果进行了评价
旨在以大量中小企业的保险数据为依托,通过对近五年大数据进行分析,通过对其进行分类,给予不同程度承保控制,降低商业保险公司企财险赔付率,并通过价格杠杆使中小企业自觉改
介绍在Delphi编程中实现对Dbase数据库被逻辑删除的记录进行恢复还原及其物理删除记录,做到真正删除无用记录.
数学高考命题注重知识的整体性和综合性,重视知识的交互、渗透,突出在知识网络的交汇点设计试题,旨在考查考生综合运用所学知识分析和解决问题的能力.解析几何是一门用代数方
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
《春秋左傳》成書年代確定、口語化程度高,較好地反映了先秦語言的面貌。然而在後世流傳中,由於語言的發展變化,一些詞句逐漸不被後人理解,於是產生了很多分歧的解讀,這就是
汉语文字是中华民族灿烂文化的结晶和载体,不仅记录了古代先民的物质生产、生活和精神风貌,而且还积淀了相当多的传统文化内涵,从文化学角度分析汉语言文字,可以发现女性在社会的
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本课题在前贤的研究基础上,以认知语言学的基本理论为指导,从普通话与闽南方言的对比视角,通过四个专题的形式,对现代汉语趋向范畴中的表上向的“起”、“上”组趋向动词的相
我国并没有规定自白任意性规则,理论界对此也没有统一的观点,但随着人权保障观念、正当程序理念和权利保护意识的增强,完善自白任意性规则势在必行,本文从理论基础、国外理论