儿童语料库建设与幼儿词汇语义分类

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:yanchao0424
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个体母语习得实际上表现为个体认知语义网络的建构过程,这一网络的内核在五岁以前逐步形成。为便于研究,可依据年龄段将五岁前儿童的语义网络划分为两岁、三岁、四岁、五岁等不同阶段。 作为儿童语义网络建构研究的基础性工作,本研究的主要任务是:1.五岁前儿童口语语料库的研制;2.幼儿(两岁和三岁儿童)语料的词频统计及普现词提取;3.幼儿普现词的语义分类;4.义类自动标注方案的制定及其在计算机上的实现。 第一步,采集儿童口语语料并转写为电子文本,进行自动分词和词性标注并辅以人工校对,先后建成含成人对话者语料的A库(113万字)和纯儿童语料的B库(30万字)。第二步,对B库中两岁和三岁儿童语料进行词频统计,通过与已有儿童词表的对比,提取出两岁儿童普现词(多种词表共现,在本语料库中频度较高或多个儿童使用的词)354个和三岁儿童普现词940个。第三步,基于11个语义大类(人类、事物、时空、行动、状态、属性、数量、限制、情态、功能、语助)的框架,对两岁与三岁儿童的普现词分别进行语义分类。第四步,制定语义词类(义类)自动标注方案,研制语义词类自动标注软件(贺胜老师研制),实现对两岁和三岁儿童语料的初步义类标注。 本研究坚持实地调查和文本采集、人工和机器、比较和分析的方法,研究的主要成果包括儿童口语语料库、幼儿普现词表以及幼儿词汇语义分类框架,其特色成果“语义词类自动标注软件”及“义类标注儿童语料库”属于原创,为儿童语言的语义语法和语义网络建构研究提供了必要工具并奠定了坚实基础。
其他文献
宝宝的问题“脸色”:脸色苍白  “6个月大的小跳跳最近精神一直不好,脸色和嘴唇都是苍白的。平时总不愿意吃饭,而且谁都不让抱,手脚摸着都是一片冰凉,小身子也变得越来越瘦!”  【可能的原因】  1.造血原料不足,如铁、叶酸、维生素B12、蛋白质等缺乏。  2.造血功能障碍,有的宝宝得过肝炎或服用过氯霉素、磺胺类药物,骨髓的造血功能会发生一定的障碍。  3.红细胞被破坏或丢失过多,由于某些原因使血液少
陈染和林白作为“个人化写作”的代表作家,以自觉的性别意识和反传统的美学追求对男权中心进行反抗和颠覆,并在解构的同时致力于新型女性话语的建构。本文主要结合陈染、林白的
图像愈来愈成为我们这个时代的典型文化符号,但图像的泛滥也带来了图像的贬值和知识的平面化。电影作为一门综合性的艺术,以其具有深度意义的影像,成为读图时代人类的审美救