论文部分内容阅读
现代汉语中,同样是时间词和时间词的组合,却可能造成不同的结构关系。由相同词性的词构成的短语叫做同类词短语,同类词短语是计算机判断短语结构关系时经常碰到的语言现象。歧义问题也是计算机对自然语言进行识别与处理时经常碰到的语言现象。时间词和时间词组合成短语,短语的结构关系存在多种可能性,所以“时间词+时间词”属于同类词短语,也可称作歧义结构。文章以时间词为主要研究对象,对“时间词+时间词”结构关系进行系统性研究,并在研究基础上为计算机对“时间词+时间词”结构关系的自动识别提出相应的识别策略。全文共分为六章:第一章是绪论,主要介绍了文章的研究内容、研究价值、理论依据、研究方法,并从时间词、结构歧义、计算机识别与处理这三个方面对前人的研究成果进行了较为系统的梳理。第二章对“T1+T2”①的结构分化情况进行了考察。首先对时间词进行了明确的界定,选取了 202个时间词,然后以组合数学中的“排列”概念为依托对选取的时间词进行了两两排列,基于“时间词连用”的定义从排列结果中选出了短语“T1+T2”,最后对所有短语“T1+T2”的结构关系进行了判定,并对时间词在主谓短语“T1+T2”、偏正短语“T1+T2”、以及联合短语“T1+T2”中的分布状况进行了整理。第三章对主谓短语“T1+T2”进行了多方面的考察与分析。通过对主谓短语“T1+T2”的初步考察,将主谓短语“T1+T2”分为了依赖上下文语境的与不依赖上下文语境的,以及语序可逆的与语序不可逆的。从语义关系的角度对主谓短语“T1+T2”进行了分析,主语T,与谓语T2之间的深层语义关系是显性等同关系、隐性等同关系、或者包含关系,主谓短语“T1+T2”与上下文语境之间的依赖关系是由主谓间的深层语义关系决定的。运用语义特征分析法对谓语T2的语义特征进行了分析,在[+推移性]语义特征的作用下,时间词临时取得了陈述功能,能作谓语的时间词同时具有[+推移性]、[+循环性]、[-指示性]这三个语义特征。对主谓间基于等同关系的语义双向选择结果与基于包含关系的语义双向选择结果进行了整理,时间词在语义双向选择性原则的作用下,两两之间基于等同关系、包含关系进行双向选择,最后形成语义互相匹配的、自足的语言结构。第四章对偏正短语“T1+T2”和联合短语“T1+T2”进行了多方面的考察与分析。第一部分是偏正短语“T1+T2”,首先对偏正短语“T1+T2”进行了初步考察,偏正短语“T1+T2”的语序是不可逆的,中心语T2具有非指示性要求;然后从时间范围、时间层级、定语T,与中心语T2之间的“限制”语义关系三个角度对偏正短语“T1+T2”的语序不可逆性进行了解释,“T1-T2”需满足“大范围-小范围”、“高层级-低层级”、“限制-被限制”;最后对定中间基于限制关系的语义双向选择结果进行了整理,并对部分“T1+T2”的结构两可情况作了说明。第二部分是联合短语“T1+T2”,首先对联合短语“T1+T2”进行了初步考察,联合短语“T1+T2”的语序是可逆的,汉语中的大多数时间词都处在某个时间序列中;对联合短语“T1+T2”的语序可逆性作了解释,并列项T1与并列项T2之间基于并列关系进行语义双向选择,并列项T1与并列项T2可以互换位置。第五章从中文信息处理的角度对“T1+T2”进行了重新审视,将汉语本体研究与计算语言学相结合,为计算机自动识别“T1+T2”的结构关系提出了两种识别策略。总结了主谓短语“T1+T2”、偏正短语“T1+T2”以及联合短语“T1+T2”的形式特点,在此基础上提出了“T1+T2”结构关系的计算机识别策略一;给出了语义关系知识库的构建方法,在此基础上提出了“T1+T2”结构关系的计算机识别策略二。第六章是结语,总结了文章的基本结论与观点,提出了文章的创新点及不足之处。由两个时间词构成的短语属于同类词短语,同类词短语不仅是汉语本体研究经常碰到的语言现象,同时也是中文信息处理经常碰到的语言现象,汉语本体研究关注的是同类词短语在语法结构关系上的多元性,中文信息处理关注的是计算机对同类词短语的多元结构关系的识别与判断。文章从汉语本体研究的角度,对“T1+T2”的结构关系、T1与T2之间的语义关系、T1与T2之间的语义双向选择等进行了系统的研究,并从中文信息处理的角度,为计算机对“T1+T2”结构关系的识别与判断提出了相应的策略,实现了汉语本体研究与中文信息处理的结合研究,在汉语本体研究方面和中文信息处理领域都具有一定的价值。