论文部分内容阅读
利用语料库进行语言研究是近年来方兴未艾的一种研究方法。在占有大量语料的基础上进行统计分析,用丰富的数据客观真实地反映词汇的使用情况,有助于推动词汇研究的深入开展。近年来,利用语料库对现代汉语词汇通用度进行统计分析的做法比较多见。然而,利用语料库对近代汉语词汇通用度进行统计分析的做法相对较少。论文尝试在这一方面进行探索。首先,多方收集元明清小说语料的电子文本,统一格式,再按标点符号分行,然后导入VFP表,建立一个1400万余字的元明清小说语料库。同时用手工输入的方法制作一个收录12162个词的近代汉语复音词表。之后,利用VFP命令进行检索,统计每个近代汉语复音词在元明清小说中出现的次数(词频),同时将可能出现歧义的近代汉语复音词及其所在的语句另行提取出来,用人工干预的方法进行判别,消除歧义,之后使用人工判断结果修正词频数字,再利用公式计算出通用度值。最后通过对统计结果进行排序、比较,得出结果,形成一系列表格。通过对这些表格进行分析,得出近代汉语复音词在元明清小说中使用状况的相关结论。同时,希望这些表格能为今后的近代汉语词汇研究提供参考数据。论文在研究过程中采用定量统计分析的方法,以具体数据作为依据,力求使论证科学可靠。