【摘 要】
:
随着自然语言应用系统的进步,对自然语言处理的基础部分,自动分词分句的准确率的要求也越来越高。汉语自动分词分句的自动评判系统的研究已经成为一项亟待解决的紧迫课题。虽
论文部分内容阅读
随着自然语言应用系统的进步,对自然语言处理的基础部分,自动分词分句的准确率的要求也越来越高。汉语自动分词分句的自动评判系统的研究已经成为一项亟待解决的紧迫课题。虽然学术界不断有研究人员提出自动评判的部分机制,但仍存在很多不足之处。例如,大部分机制都仅仅支持部分词类或部分搭配的评判;评判的召回率和准确率偏低等。汉语自动分词分句的自动评判的研究总的来说还处在刚刚起步的阶段。从事这方面研究的人员还不是很多,公开发表的论文也比较少。本文在目前汉语分词分句技术和各种评判机制的深入研究和分析的基础上,借鉴了人们在类似问题上的思考模式,选择以语义知识库为问题的突破口,利用汉语词与词之间详细而复杂的关系网络,试图找到一种度量方法以确定其是否搭配。本文通过对现今主流语义知识库的研究和分析,提出了以知网为支撑,以语义距离为骨架的新概念:搭配距离。本文详细介绍了搭配距离的概念定义和计算方法,并给出部分计算实例。从实例就能很明显的看到,搭配距离能很有效地度量词与词之间搭配的准确度。与其他分词、分句方法相结合,能产生相当好的结果。本文通过实验证明了这一点。从实验中还发现,搭配距离对简单歧义句和语法错误有一定判别能力。最后指出了搭配距离在实验中体现出的一些不足之处以及下一步的主要工作方向。
其他文献
随着32位嵌入式微处理器性能的不断提高及无线网络技术的快速发展,将ARM微处理器、嵌入式实时操作系统及无线局域网技术引入电力系统,为其提供了新的安全稳定的防误操作手段,
随着计算机工业的发展,各种软件应用日趋复杂,对软件的性能和可靠性的要求也越来越高。计算机硬件的高速发展能够部分的解决这些问题,但高性能的硬件设备因其价格昂贵而难以
本文的主要目的就是在第一类权函数神经网络理论的基础上,类推出第一类Padé权函数神经网络的拓扑结构,然后推导出第一类Padé权函数神经网络的算法复杂度,并且给出误差分析。然
随着网络速度的不断提高,规模的扩大,应用需求的多样化,网络上的数据流变得复杂而多变。这都给网络管理和维护以及网络安全提出了更新、更高的要求。网络管理软件、防火墙软
在工业生产过程中,测试是必不可少的重要环节,缩短测试周期就意味着提高产能。然而缩短测试周期和保证测试质量常常又是相互矛盾的。本文以电子产品的测试为例,对于既要保证
KVM是J2ME的核心部件,是一个简化的java虚拟机,广泛应用于各种资源受限的设备中。但KVM在应用中也存在一些问题,特别是由于资源受限,导致KVM的性能存在问题,难以支持复杂且实时性
若字母表A上的语言X,Y,Z满足方程XZ=ZY,则称语言X,Y是共轭的。若式中的X,Y为字母表A上的字时,目前已知:若xz=zy,则存在p,q∈A*,使得x=pg, y=qp,z∈(pq).p.若式中的X,Y为语言时
本文基于在TalentBase3.0的组织管理系统及其辅助工具的开发过程中所做的技术研究与实际开发工作,阐述了系统中诸多开发重点的设计和实现,并论述了其中遇到的技术难点的解决方
随着无线通信技术的不断发展,移动Ad hoc网络的应用也越来越被重视,该网络不仅应用于军事领域,在民用领域中也得到了广泛的应用。移动Ad hoc网络不依赖于基础网络设施,是一种能够
无线传感器网络作为物联网的基础,将实际存在的客观世界与虚拟的信息数据世界紧密的联系在一起。无线传感器网络应用的前提是高效的收集数据,即传感器节点将通信范围内的数据采