论文部分内容阅读
反讽是日常交流中一种普遍存在的语言表达形式。作为一种常见的语言现象,它能够传递字面含义以外的隐含信息,这一隐含信息的呈现方式是否与语言特征有关尚有待探究。基于前人对识别反讽言语标准的研究和隐性展示理论(Utsumi,2000),本文试图通过计算语言材料的特征值获得具体的信息,从而找出在近似语境下两种语言之间具有讽刺意味的标识语用特征的相同点和不同点,验证适用于英文反讽识别的六类核心特征,即n元词位语法值、n元词性语法值、有趣性数值、词极值、情感值和愉悦值是否能适用于中文环境下反讽的识别。研究语料来自于2011年至2015年间的互联网资料,其中,正向集选自新浪微博网站中含有反语和讽刺语义的汉语评论和英文亚马逊网站中的四星以上的客户评论,为了研究的全面性作为对照组的负向集则选自微博中汉语箴言名言等以及英文旅行顾问网上的客户评论,共计21万余词,4万余句话。语料经过POS特征标注和提取后,相关数据通过SVM和NB分类器训练方法进行分析。实验结果表明:在言语反讽核心特征上,用于识别英文文本是否具有反讽特征的核心特征同样适用于中文的反讽识别,即六类特征在区分汉语文本中的反讽特征中扮演重要角色,每个类别的特征值在中文反讽识别中呈现出有异于英文反讽识别的排列特性。具体而言,在识别英文反讽时,n元词位语法值的功能标识起重要作用,其次是n元词性语法值和愉悦值;而在识别中文反讽方面,词极值和n元词性语法值共同承担类似作用,其中词语的极性特征在中文的反讽识别上发挥了比前者更为重要的作用。另一方面,情感值特征在中文和英文反讽识别上具有相似的作用。本研究通过分析互联网环境下的真实语料,将反讽特征量化,利用数学模型自动识别具有反讽特征的语句,并对比分析互联网环境下中文和英文在反讽识别中呈现出的异同点。将隐性展示理论有效地运用于实验分析,拓展了其理论应用范围,为传统的语用分析提供了新的分析视角和分析模式。研究结果将有助于互联网中文言语信息的更准确的处理,同时可以帮助汉语中级和高级学习者更有效地把握字面含义下所隐藏的真正意图,从而为第二语言学习中的语用习得提供一手的资料。