有关汉语词类分析的若干问题研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:dgqshwf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言文语料库的较高水平分析中,自动的词类分析是非常重要的组成部分.其中一个重要问题是,当词用于具体的上下文中时,获得正确的词类分析.提高词类分析的精确率,将导致更好的机器翻译系统,信息系统,等等.该文提出一种基于约束规则与无监督学习的词类分析策略.该方法开始于独立于语料库的手工制作的约束规则集合,通过无监督学习,学习约束规则所使用的一些约束条件.同时,使用未进行词类加标的语料库,其中所有词汇项已被标注具有所有可能的词法分析,评价由存在歧义的上下文所获取的约束,来消除其它的词法分析歧义.在整个实现过程中,未以牺牲查全率为代价来减少词类歧义,而查准率相应提高.该方法可有效地完成汉语文本的自动词类分析,基于分析过程所提供的正确知识信息,可顺利进行其它相关处理过程.同时,建立了汉语词类分析中知识体系的架构.其中,包括汉语电子词典的建立、语料库构建以及词类分类表的制定.汉语电子词典在整个知识库体系当中处于基础性的位置,是实现词类分析的最为重要的知识源,也是必不可少的资源.在汉语自动词类分析中,这三类知识通过合理地组织与有机地结合,形成一个完整良好的知识体系.基于知识体系的成功构建,可进行有效且准确的汉语词类分析,实现高质量的汉语分析与处理.最后,基于所完成的各项研究工作,建立了汉语词类分析模型,通过对其性能的实验测试,可以看出该模型的有效性、可行性及其实用性.
其他文献
在测试领域,随着被测试对象和测试仪器的日益复杂和先进,自动测试替代人工测试成为现代测试技术中的重要手段.但测试软件发展相对缓慢,主要存在如下一些缺陷:集成度低,功能单
在对称密码算法中,加密密钥和解密密钥是相同的,或能从加密密钥很容易的推导出解密密钥.因此,在这种体制中,有加密能力就意味着必然有解密能力.例如DES,3DES,IDEA等算法.它们
抗抵赖服务旨在生成、收集、维护已声明的事件或动作的证据,并使该证据可得并且确认该证据,以此来解决关于某事件发生或未发生而引起的争议。抗抵赖服务用于对网络的交互动作
随着经济全球化及中国加入WTO,企业的竞争加剧,传统的决策方法已不能满足各企业、行业领导人的需要,怎样提高管理决策水平,怎样从历史数据及管理经验中发现更多地不为人知的
网络新闻服务具有内容服务领域最普遍的"Rich Data,Poor Information"现象,要想更好的发展下去,就必须以满足新闻读者的个性化新闻阅读为目标.基于Web服务架构的网络新闻服务
本文根据NewsML数据和Xquery的处理模式特点,将结构化函数内联方法应用到结构上递归的Newsml查询中,在类型信息的指导下对Newsml递归查询进行了优化.由于NewsML数据结构化和
本项目针对埃塞俄比亚的Hilton Addis酒店服务系统存在的问题,成功设计与开发了一个使用多层体系结构的酒店在线预订系统.本项目重点研究了使用多层体系结构设计与开发该系统
本文主要根据宽带IP城域网的可用性,可靠性,可扩展性,可管理性和安全性等五个方面简要论述大连数码科技宽带IP城域网络的建设和运营情况。 大连数码科技宽带IP城域网络已
构件的表示和检索机制的研究一直是构件库研究的热点。本文研究基于刻面分类和人工智能相结合的软构件分类方法,给出构件分类系统模型,重点提出了聚类分析和自组织映射算法在软