汉语自动分词相关硕士博士期刊学术论文

汉语自动分词相关论文

《信息处理用词汇研究》九五项目结题汇报信息处理用现代汉语分词词表

一　引言建立一个“信息处理用现代汉语分词词表”是国家社科研究“九五”规划重大项目《信息处理用现代汉语词汇研究》之子课题 9......

期刊

汉语分词分词单位汉语自动分词词汇研究结题计算语言现代汉语分词系统同义词词林字母词

基于人工免疫系统的信息过滤技术研究

伴随着互联网技术的飞速发展,信息获取已经逐渐成为人们生活工作必不可少的内容。但是由于信息量的日渐庞大,信息种类的复杂繁多,......

学位

信息过滤人工免疫系统汉语自动分词垃圾邮件过滤

基于统计机器学习算法的汉语分词系统的研究

在词汇级的中文语言处理中，存在两个基本的问题：其一是汉语自动分词，其二是中文命名实体识别。通常的系统都把这两个任务分开处理，也就......

学位

统计语言模型汉语自动分词中文命名实体识别基于词的三元语言模型基于类的语言模型

具有中文人名识别功能的汉语自动分词算法研究

随着信息技术的飞速发展,中文信息处理技术已经渗透到计算机应用的各个领域。词处理平台技术是中文信息处理的中间环节,是连接字处......

学位

汉语自动分词中文人名识别歧义切分最大匹配

基于中文文本分类的自动诊病系统

本文研究基于文本分类技术的自动诊病系统。已有病案记录了疾病现象与疾病种类的关系，利用机器学习方法构造分类器，可以习得疾病现象......

学位

自动诊病文本分类贝叶斯算法汉语自动分词

汉语自动分词中若干关键技术的研究

该文设计并实现了一个汉语自动分词系统,对系统中采用的关键技术进行具体介绍.词典查找是影响系统切分速度的重要因素.该文提出一......

学位

中文信息处理汉语自动分词最大匹配词典组织机制歧义字段切分未登录词识别信息集成

基于多步处理策略的汉语自动分词研究

自然语言处理是人工智能的一个重要分支。汉语自动分词是中文自然语言处理的一项基础性工作，也是中文信息处理的一个重要问题。汉语......

学位

自然语言处理汉语自动分词统计语言模型时间语词计算机应用技术

专题搜索引擎关键技术的研究

随着Internet技术的飞速发展，WWW已成为人们进行信息交流不可缺少的巨大的信息空间。面对如此巨大的海量信息，人们在寻找自己所需的......

学位

信息聚类专题搜索引擎汉语自动分词向量空间模型专题词典

基于最大匹配的书面汉语自动分词研究

书面汉语自动分词是中文信息处理中的重要步骤,它是文本校对、机器翻详、文本分类、文本检索、计算机人机接口等诸多中文信息应用......

学位

汉语自动分词最大匹配二字词歧义切分伪歧义未登录词识别查准率

基于双数组的分词词典研究与实现

分词词典是汉语自动分词系统的一个基本组成部分,词典的查询速度直接影响到分词系统的处理速度。在因特网上的中文文本检索、汉字......

学位

分词词典双数组 PAT 词典机制

基于知网语义相关度计算的汉语自动分词方法的研究

汉语自动分词方法一直是中文信息处理乃至人工智能领域的重要研究内容。其中歧义消解作为该领域最重要也是最困难的两个研究重点之......

学位

汉语自动分词语义相关度词性标注知网

基于向量空间的中文科技文献信息检索系统研究

在实际信息检索系统中，信息检索系统的查全率和查准率都不是很高，针对不同的文献集，信息检索系统的性能也不一样，很多系统尽量适应各种......

学位

信息检索向量空间模型汉语自动分词矩阵摄动偏移距离

SVM和最大熵相结合的中文机构名自动识别

未登录词的识别是汉语自动分词的难点之一，而中文机构名是未登录词的一个重要部分，涉及广泛，种类繁多，形态各异，且绝大多数未收入到词典......

学位

中文机构名驱动式最大熵支持向量机

汉语自动分词中排除歧义字段算法的研究

自然语言处理是计算机科学领域中的一个重要研究方向,是人工智能的一个重要分支。汉语自动分词是中文信息处理的重要基石。困扰汉......

学位

自然语言处理中文分词交集型歧义组合型歧义隐马尔科夫模型词性标注支持向量机

基于条件随机场的汉语自动分词技术研究

随着科学技术的发展和海量信息的涌现,信息处理技术已经成为当今世界发展不可或缺的一部分,要在海量的信息中提取有用的知识,就必......

学位

条件随机场汉语自动分词信息提取自然语言理解机器学习马尔科夫模型

中文分词技术在信息检索系统中的应用研究

随着信息化时代的不断进步和发展,人们获取信息的手段也在不断的发生着变化,从原始的手工查找到现在的计算机搜索引擎。计算机技术......

学位

中文分词信息检索系统搜索引擎汉语自动分词歧义词切分词典算法

基于最大熵模型的中国人名自动识别

汉语自动分词是中文信息处理的基础工程，中国人名的自动识别则是汉语自动分词的难点之一，已经成为制约汉语自动分词系统准确率的一大......

学位

最大熵模型中国人名自动识别汉语自动分词中文信息处理熟语料特征模板库 viterbi算法

面向汉外机器翻译的自动分词系统

自动分词技术是汉外机器翻译的基础工程。汉语自动分词不仅是汉外机器翻译的必要环节，也是各种汉语信息处理包括语音处理、词频......

学位

自然语言理解机器翻译汉语自动分词歧义处理专名识别自动分词技术汉语翻译

文本自动分词方法研究

汉语分词是中文信息处理的基础，它是由计算机自动识别文本中的词边界的过程。从计算机处理过程上看，分词系统输入的是连续的字符串(C......

学位

汉语自动分词切分歧义消解最大匹配算法中文信息处理自动识别

基于N最短路径和隐马尔科夫模型的中文POI分词系统的研究

汉语自动分词是中文自然语言处理的一项基础性工作,也是中文信息处理领域的一项基础性课题。本文从理论上分析和比较了目前各种汉......

学位

汉语自动分词 POI 语料库隐马尔科夫模型交集型歧义

消解中文三字长交集型分词歧义的算法

汉语自动分词在中文信息处理现实应用中占据着十分重要的位置.三字长交集型分词歧义是分词歧义的主要类型之一,在真实文本中的出现......

期刊

计算语言学中文信息处理汉语自动分词交集型分词歧义分词歧义消解算法

基于二字词位图表的汉语自动分词词典机制

根据汉语中二字词较多的特点，提出了一种新的分词词典机制．该机制在词典数据结构中添加二字词检测位图表，在分词时，利用位图表可快速判......

期刊

汉语自动分词分词词典机制二字词检测位图表 Chinese word segmentation dictionary mechanism two-word

基于组合度的汉语分词决策算法研究

提出了汉字组合的组合度概念,讨论了组合度与组合的成词能力之间的关系,利用决策树的方法挖掘了组合度与分词模板的关系.在此基础......

期刊

汉语信息处理汉语自动分词组合度汉语分词决策算法分词模板决策树 Chinese word segmentation combination degre

中文文语转换引擎SmartTalk研究与实现

随着汉语日益走向世界以及语音技术的发展,让计算机能讲汉语便自然成为了一种需求。介绍了一种汉语文语转换(TTS:Text—To—Speech......

期刊

汉语自动分词文语转换语音合成中文信息处理 Automatic Segmentation of Chinese Word ITS Speech Synt

一种基于搭配信息的汉语组合型消歧方法

首先从大规模语料中采集到组合歧义字段，进而对其搭配信息进行统计．最后应用多元对数似然比计算出消歧参数进行消歧，实验中考虑了歧义......

期刊

汉语自动分词组合型切分歧义搭配信息消歧 chinese word segementation combinatorial ambiguities col

利用上下文信息解决汉语组合型歧义

汉语自动分词问题是制约中文信息处理发展的瓶颈之一，歧义切分又是影响分词系统切分精度的重要因素。在对已有方法深入分析的基础上......

期刊

汉语自动分词组合歧义消歧 Chinese word segmentation combinatorial ambiguities disambiguati

汉语自动分词中中文地名识别

以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名......

期刊

中文地名识别汉语自动分词未登录词识别 Chinese place names recognition Chinese automatic segmenta

基于PATRICIA tree的汉语自动分词词典机制

分词词典是汉语信息处理系统的一个基本组成部分,其查询和更新效率将直接影响汉语信息处理系统的性能.本文采用PATRICIA tree的数......

期刊

信息检索 PATRICA TREE 汉语自动分词信息处理 information retrieval PATRICIA tree Chinese word s

基于SVM和k—NN结合的汉语交集型歧义切分方法

本文提出了基于支持向量机(SVM)和k-近邻(k-NN)相结合的一种分类方法,用于解决交集型伪歧义字段.首先将交集型伪歧义字段的歧义切......

期刊

支持向量类代表点交集型歧义汉语自动分词歧义切分 SVM k-近邻分类方法 support vector representative point cr

基于分解与动态规划策略的汉语未登录词识别

未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名，中国地名和外国译名进行整体识别为目标，采用分解处理策略降低了整体......

期刊

未登录词识别分解处理动态规划汉语自动分词路径搜索整体识别 unknown word resolution leveled strategy dynam

盲人用计算机软件系统中的语音和自然语言处理技术

本文介绍了智能技术与系统国家重点实验室开发的“北极光”盲人用计算机软件系统中涉及的语音和语言处理技术。该系统能够获取和分......

期刊

计算机应用中文信息处理语音合成文本分析汉语自动分词语言模型 computer application Chinese information pro

一种中文分词词典新机制——双字哈希机制

汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率.本文首先分析......

期刊

汉语自动分词汉语信息处理分词词典机制双字哈希机制分词速度分词效率 computer application Chinese information p

基于语境信息的汉语组合型歧义消歧方法

组合型歧义切分字段一直是汉语自动分词的难点，难点在于消歧依赖其上下文语境信息。本文采集、统计了组合型歧义字段的前后语境信息......

期刊

计算机应用中文信息处理自然语言处理汉语自动分词组合型切分歧义对数似然比语境信息 computer application Chinese info

汉语交集型歧义切分字段关于专业领域的统计特性

交集型分词歧义是汉语自动分词中的主要歧义类型之一。现有的汉语自动分词系统对它的处理能力尚不能完全令人满意。针对交集型分词......

期刊

计算机应用中文信息处理汉语自动分词专业领域语料库交集型歧义切分字段伪歧义真歧义 computer application Chinese info

书面汉语自动分词专家系统设计原理

本文深入地分析了歧义切分字段产生的根源和性质,把歧义字段从性质上划分为四类,并给出了消除每一类歧义切分字段的有效方法。在对......

期刊

汉语自动分词分词系统歧义现象系统设计原理字串语义问题分词方法语法分析自然语言理解句子意义

基于数学设计的计算机自动分词算法

采用数论的思想结合计算机的算法设计技术,提出了一种新的基于统计学的计算机中文自动分词数学模型CNET及其算法.......

期刊

汉语自动分词互信息 CNETM Chinese word sehmentation Mutual information CNETM

基于FAQ的自动答疑系统的设计与实现

设计并实现了一个基于FAQ的自动答疑系统。阐述了自动答疑过程的主要环节和基本流程，介绍了系统实现的关键技术，包括改进的汉语自动......

期刊

自动答疑常见问题库汉语自动分词同义词变换候选问题集相似度计算 automatic answering FAQ automatic Chinese

汉语自动分词与词性标注软件的组件化

介绍了软件组件结构一般模型及Microsoft公司的组件对象模型,并在此基础上,探讨如何将汉语自动分词与词性标注软件组件化.......

期刊

中文信息处理汉语自动分词词性标准软件组件化 component COM Chinese automatic characte r segmentation

汉语自动分词理论对英语教学的启示

计算语言学是从语言学中分离开来的学科交叉的门类。汉语自动分词是计算语言学中的一个热门研究方向,研究发现,汉语自动分词的语料......

期刊

语言学计算语言学汉语自动分词英语教学 linguistics computational linguistics Chinese word segme

基于知网语义相关度计算的词义消歧方法

歧义字段处理一直是中文信息处理领域中最关键也是最困难的问题之一,至今该问题仍没有得到完全而有效的解决,使得以此为基础的多个......

期刊

汉语自动分词词义消歧语义相关度知网 Chinese automatic word segmentation word sense disambiguat

论自然语言检索

情报检索语言是一种表达文献情报内容概念及概念之间相互关系的标识系统,是根据情报检索的需要而创制的一种人工语言.情报检索语言......

期刊

情报检索语言自然语言检索情报检索汉语自动分词词间关系自然语言 information retrieval retrieval language nat

一种基于概率模型的分词系统

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述。接着引出一......

期刊

概率模型分词系统 EM算法语料库系统仿真汉语自动分词中文信息处理 word segmentation EM algorithm corpus H

基于CNET模型的无词典汉语自动分词算法研究

提出了一种新的汉语统计模型CNET,在此基础上提出了一种汉语无词典自动分词算法。该算法首先学习要进行处理的汉语语料,构建CNET,......

期刊

汉语自动分词互信息 CNET Automatic Chinese word segmentation Mutual information CNET

一种自组织的汉语组合型歧义消歧方法

组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识，提出使用搭......

期刊

自然语言处理汉语自动分词组合型切分歧义自组织方法消歧 natural language processing Chinese word segment

基于无指导学习策略的无词表条件下的汉语自动分词

探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法,以期对研制开放环境下健壮的分词系统有所裨益.全部分词知识源自从生......

期刊

无指导学习汉语自动分词汉字Bigram 互信息 t-测试差线性叠加统计量中文信息处理应用系统 Algorithms Computer applicat

电子商务领域本体知识库的构建及应用

本文利用本体丰富的语义知识和语法结构及其共享性,构建了电子商务领域的本体知识库,用于解决数据的结构异构和语义异构问题。同时......

期刊

本体领域本体知识库汉语自动分词 ontology domain ontology repository automatic Chinese word seg

基于最大熵模型的交集型切分歧义消解

利用最大熵模型研究中文自动分词中交集型切分歧义的消解.模型输出的类别为两种:前两个字结合成词和后两个字结合成词.模型采用的......

期刊

中文信息处理汉语自动分词交集型歧义最大熵模型 Chinese information processing Chinese automatic word

基于动态规划的最小代价路径汉语自动分词

基于最长次长匹配的方法建立汉语切分路径有向图，将汉语自动分词转换为在有向图中选择正确的切分路径，其中有向图中的节点代价对应单......

期刊

汉语自动分词最长次长匹配最小代价路径切分歧义消解未知词特征词 chinese word segmentation maximum and second-

基于三数组Trie索引树词典查询机制的分词系统

基于三数组Trie索引树的分词系统采用由短词及长词的确定性工作方式，在对汉字串的一遍扫描过程中就能得到结果，避免了整词二分词典查......

期刊

汉语自动分词索引树 TRIE

一种改进的高效分词词典机制

汉语自动分词是中文信息处理的基础,在中文信息处理系统中具有广泛的应用。作者在研究几种分词词典机制的基础上提出了一种新的分......

期刊

汉语自动分词 Hash索引算法中文信息处理 Chinese automatic word segmentation hash index algorithm

看过本文同时还关注