一种新的并发分词算法的研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:Phoenix164
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语的词法分析是汉语理解的基础,是汉语信息处理领域的一个重要课题。本课题提出一种新的并发检索-综合排歧的分词方法,目的是利用并行的特点,使分词与分词之间、分词与排歧分析之间能够并行处理,从而更高效、合理地实现词法分析,进一步提高分词方法的切分精度和切分效率。 本文在目前汉语词法分析方法基础上,提出了一种并行分词方法,并特别指出了全切分普遍存在的并发检索和持续检索问题,进而,给出了并发检索-综合排歧分词方法的算法模型。该方法在输入的同时进行切分,同时维护多个词库检索对象,并在分词的同时进行简单的句法分析,最后通过多种排歧方法,实现输入与切分、切分与歧义分析的并行运算,在输入结束时即刻得到分词结果。本文提出了该分词方法的体系结构模型,设计了并发检索算法,并建立了模拟实验系统。经过在模拟实验,证明该方法是一种可行而且高效的分词方法,达到了预期的目的。 该方法具有一定的理论和应用价值。它利用并行计算技术实现了词检索的并行以及检索和歧义分析的并行,克服了传统串行分词方法在实现高复杂度的全切分和歧义消解方法上存在的效率和复杂性方面的困难,有效地利用了丰富的硬件资源,提高了切分的速度。它在并行机上的实现,为高速实用工程的实现提供了可能,从而也为大规模并行中文信息处理奠定了基础。
其他文献
图像压缩是根据图像数据存在冗余和人眼视觉特性来实现的。基于小波变换的图像压缩技术是当前研究图像压缩的主要方向之一,在满足所需图像质量前提下,如何进一步提高压缩比和压
随着Internet的迅猛发展,电子商务、远程教育和网络出版等全新领域异军突起,逐渐发展成为互联网世界重要的组成部分,大量的应用基于网络展开。作为一种全新的标记语言,XML以其扩
随着计算机图形学技术和高速网络技术的发展,基于网络的协同设计系统走上设计舞台成为了可能。本文结合MCAM建模设计特点,提出了一个具有多领域特点的同构模式协同设计系统——
作为一门先进的人机交互的技术,手势合成的研究具有广阔的实际应用前景和学术研究价值。如:聋哑人与正常人之间的交流、虚拟现实中的多模式接口、手语新闻、智能人机接口等。研
随着移动通信技术的发展,互联网上已经出现了越来越多的移动终端,来自EMC 的统计数据显示,截止2003 年底,全球移动用户已达到13.54 亿。传统采用电路交换的无线网络将逐步被
目前计算机网络正处于一个高速发展的时期,因此对网络的管理提出了更高的要求。原有的网络管理系统功能单一、操作复杂、效率低下,已不能满足运营商的发展需要。如何有效地、安
学位
近年来,无人飞行器已经在农业植保、灾难搜救、电影制作、低空监测等多个领域广泛应用。在这些应用中,无人飞行器的自主导航是关键技术,实现无人飞行器自主导航的传统方法是结合
随着人们对移动通信日益增长的需求,移动通信技术得到了快速发展和普及。移动自组织网络以其灵活机动、组网快速等优势,广泛应用于军事领域、灾后营救等重要领域。由于MANET无
基于构件的软件开发是解决软件危机的有效途径。在基于构件复用的软件开发过程中,构件库系统扮演了重要角色。在Internet技术下如何实现构件库对构件的有效的管理和检索,成为本