兼语句的知识分析与获取方法研究

来源 :江苏科技大学 | 被引量 : 1次 | 上传用户:lkzhlk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
兼语句是兼语短语充当谓语的一种汉语句式,兼语句中的的谓语是由一个动宾短语套接一个主谓短语组成,其中动宾短语中的宾语兼做主谓短语的主语,它是文本知识中较为常见又比较特殊的一种句式结构。对兼语句进行知识获取方面的研究是文本知识获取的一个重要研究方向。本文在以前学者的研究基础上从语义类的角度出发对兼语句进行了重新分类,构建了新的兼语分类体系;并且设计了兼语语义类描述框架,从兼语文法和兼语谓词的角度对兼语句进行了形式化的描述。本文具体研究内容如下:(1)对兼语语义类进行分类是兼语知识获取的基础,为构建一种新的兼语分类体系:首先从句中第一个谓词的角度出发将兼语句式分为八大类,并在语义分类和描述框架的基础上,对这八大类进行进一步细分;然后从兼语中第二个谓词发生的时序角度出发进行归纳分类;最后,对于不能充当兼语句式中第一个谓词成分的语义类,从语义的层级上分析总结了其原因和规律。该分类体系比已有的分类体系更全面更细致,它几乎涵盖了文本知识中所有的兼语句。(2)设计兼语语义类描述框架:设计兼语文法和兼语谓词,通过分析总结兼语文法和其对应的组成词对的基本语义文法之间的规律,设计一种兼语文法组合模式,实验结果表明,该组合模式是有效可行的,准确率高到96.6%,最终通过此组合模式得到37637条兼语文法和与之对应的谓词表示形式,并通过该文法和谓词获得了兼语句的形式化表示方式,实现了兼语句的知识获取。
其他文献
随着计算机应用范围的不断扩大和Internet的全球普及,在各种应用系统中积累了越来越多的数据,这就很容易造成了“数据爆炸”问题,它已经悄悄来到我们的身边,甚至更严重的“数
随着网络通信、计算机技术的快速发展,股市数据分析、天气预测、卫星监测、网络流量监控等多个领域都产生了数据流。由于数据流具有快速、连续与动态变化的特征,传统的数据挖
随着当今软件规模的日益发展,软件质量问题也日益突出,它可能造成软件成本不断增加、交付延期。软件产品质量的提高依赖于软件过程质量的提高,而软件过程缺陷度量能够保证软
本文以真实的网上银行系统项目为研究背景,根据网上银行系统总体开发目标、特点及系统项目建设要求,对网上银行系统的总体架构进行了设计与实现,包括J2EE软件体系架构、网络拓扑
本文针对当前地市级VHF/UHF频段无线电监测网络所存在的不足,根据信息产业部无线电管理局关于省级VHF/UHF无线电监测网的指导意见,通过对VHF/UHF频段的无线电波传播特性以及V
随着社会的发展,人们不满足于只对个体宏观层次的评价,而是希望能从被试的实际作答反应中获得更多有关被试认知结构的信息,以便对被试做出更具体更客观的评价,并且给出相应的
道路交通拥堵问题日益严峻,对经济、环境、交通安全、交通效率等造成诸多不良影响。虽然基于地磁线圈、视频等技术的传统智能交通应用在检测、缓解交通拥堵方面起到了重要作
地理信息与知识是组成客观知识世界的重要内容。互联网上大量的地理信息都以非结构化的文本形式存在,如何利用智能化的方法,从网页上不计其数的文本中获取知识,是当前知识获
海量存储系统中需要保存Terabyte、Petabyte级别甚至更大规模的数据。数据的元数据如文件的名字、属性、保存地址和访问授权等信息一般由元数据服务器进行管理。在访问海量存