词干提取相关论文
结合理论和实验比较分析用于词形规范的词形还原方法和工具。归纳现有词形还原方法的主要分类,分析各类方法的特点和不足。介绍7种......
随着信息化的高速发展,世界变成了信息的海洋,如何从大量信息中迅速有效地提取所需信息成为急待解决的问题。由于分类可以在较大的程......
伴随着网络的发展,文本分类技术成为信息处理领域中重要的研究方向,通常用于处理和组织大量文本数据。蒙古语在中国来说是少数民族......
词是语言中最小的能独立运用的单位,是自然语言处理的基本单位。词法分析是自然语言处理的一个基础课题,其主要研究内容是进行词语......
自然语言处理是计算机科学领域与人工智能领域中的一个重要的方向,它能实现人与计算机之间用自然语言进行有效沟通的各种理论和方法......
命名实体识别(Named Entity Recognition,NER)是根据各种识别和搜索技术识别输入的文本对象中的人名实体,机构名实体,地名实体。命......
神经网络的发展及其在自然语言信息处理任务中的优异表现给多语种信息处理,尤其是维-哈-柯语言的信息处理带来了新的机遇。神经网......
针对哈萨克文本分类中词干提取效率低以及传统框架下特征表示维度高、数据稀疏、分类准确率不高等问题,提出基于哈萨克语形态分析......
开发一个多语言统一用户界面的集成信息处理软件环境,对少数民族自然语言处理研究工作特别是派生类语言的文本及语音等信息处理带......
首先介绍柯尔克孜语形态特征对词干提取的作用,之后探讨柯尔克孜语词类划分、词类的形态特征.介绍基于规则、词典以及词典和规则相......
黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大.现有的乌兹别克语词干提取任务仍依赖基于......
摘要:哈萨克语是组成结构复杂的黏着性语言,哈萨克语词干提取词缀提取对哈萨克语信息处理领域具有很重要的意义。从哈萨克语粘着性特......
摘要:维吾尔语单词的构形词缀按照一定的规则连接到词干。维吾尔语的黏着语特点和构形词缀连接规则使得可以构造维吾尔语构形词缀的......
从自然语言处理以及深度学习的基本理念、原则出发,为基于中国手语的维吾尔文本信息处理研究提供数据资源,为面向手语信息的手语合......
句子相似度计算是基于实例机器翻译的主要方法.对基于实例的哈萨克语机器翻译,哈萨克语句子相似度衡量的准确性直接影响到最终翻译......
维吾尔语单词的构形词缀按照一定的规则连接到词干.维吾尔语的黏着语特点和构形词缀连接规则使得可以构造维吾尔语构形词缀的有限......
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法......
期刊
针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏......
[目的/意义]旨在为俄语词形规范化方法研究和应用提供参考。[方法/过程]运用文献研究法和比较研究法对已有俄语词形规范化方法进行......
哈萨克语词干提取是哈萨克语信息处理的重要的基础环节,文章采用基于规则、字典查找和最大匹配相结合的哈萨克语词干提取方法,首次......
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结......
蒙古语形态分析中,我们之前的有向图模型取得了较高的性能。这种建模方式以图状结构刻画句中词干和词缀之间的概率关系,从而借助上......
针对现有维吾尔语形态分析研究中存在的数据稀疏、模型构建复杂等问题,提出一种基于机器翻译的维吾尔语形态分析模型,即将维吾尔语词......
本文主要阐述哈萨克语词干提取使用的名词构形词缀分析DFA的构造过程。哈萨克语属于黏着语,所以哈萨克语自然语言处理系统必须实现......
介绍了词干提取和词形还原两种词形规范方式以及基于规则和基于词典的两种词形规范实现方法,阐述了基于术语原形化的同义词群构建的......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
期刊
为了实现哈萨克语文本分类,根据哈萨克语语法规则,给出了哈萨克语文本词干的提取方法;结合DFR特征选择方法和VSM文本表示模型实现......
随着计算机技术的发展,尤其是计算机网络的广泛普及和迅速发展,自然语言处理也越来越多地受到了广大计算机工作者的重视。在这样的......
学位
维吾尔语是形态变化复杂的黏着性语言,维吾尔语词干词缀切分对维吾尔语信息处理具有非常重要的意义,但到目前为止,维吾尔语词干提......
文本分类为一个文档自动分配一组预定义的类别或主题。文本分类中,文档的表示对学习机的学习性能有很大的影响。根据哈萨克语语法......
随着因特网的迅速发展,互联网的数据信息量越来越大。如何快速有效的获取,管理和使用这些数据已成为数据挖掘的重要研究内容。文本聚......
本文主要论述了汉哈萨克双语电子词典构建和相关技术的研究。汉哈萨克双语电子词典的构建是为Windows平台下实现汉语和哈萨克语词......
首先,论述词干提取和语言形态学的关系。其次,对词干提取的主要算法和相关技术进行详细分类。而后,对词干提取方法的主要特点进行......
建设高质量的标注语料库是维吾尔语信息处理领域的基础性工程。目前,在机器翻译、信息检索、Web文本挖掘等许多领域对语料库的使用......
翻译系统的性能与语料库规模是密不可分的,语料库质量也直接影响到最后的翻译结果。因此自动词性标注与词干提取作为创建标注语料......
维吾尔语是形态变化复杂的黏着性语言之一,词的构成和其词义都是依赖于形式复杂的词缀连接来表示的。词缀不仅改变词根的词义,也会......
该文主要阐述维吾尔语词干提取中使用的名词构形词缀分析DFA的构造过程。维吾尔语属于黏着语,所以维吾尔语自然语言处理系统必须实......