HSK动态口语语料库的语料转写研究

来源 :第七届全国语言文字应用学术研讨会 | 被引量 : 0次 | 上传用户:wuweiguowwg32691819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文将借鉴国内外相关语料库的做法,重点探讨这个问题,主要包括转写内容、转写中遇到的问题和转写规则三个部分.口语语料库建设最关键也是最耗时、耗力的工作是语料的转写与标注,在真实性原则与完整性原则的指导下进行。转写中遇到的最大问题是单纯汉字转写的不准确性,转写时对于非正常停顿的呈现是非常必要和有意义的,学习者在口语表达中还会出现各种重复在转写过程中也应该进行相应的呈现。针对单纯汉字转写的不准确性问题,建议采用拼音汉字双重转写。第一层是汉语拼音层,第二层是汉字层。关于停顿,运用语图仪等设备,采用科学的研究方法,研究停顿的时间问题,探讨其可能负载的语用意义,进而进行科学有效地转写。关于重复的问题,建议只转写一次,然后在重复的单音节字词后面加[wr],短语后面加[pr],句子后面加[sr]。对于内容无法分辨或完全听不清的部分,借鉴英语口语语料库的转写方法,无法辨别的用“”表示,一个“”代表一个音节,像一些人名地名;如果是整个语句没有听清,我们用[X]表示。对于数字的转写,建议不用阿拉伯数字,而使用汉字。
其他文献
目的观察抗脑抗体对脑胶质瘤细胞C6的增殖、凋亡和侵袭力的影响。方法将C6细胞分为实验组和对照组,实验组加入不同浓度的抗脑抗体,对照组不加抗脑抗体;分别采用MTT法、流式细胞
在介绍了蒙特卡罗(Monte Carlo)分析方法基本原理的基础上,对发动机点火工作中大电流恒流源电路进行了MonteCarlo分析。系统以高速运算放大器为核心,采用PID控制,应用Multisim
伴随三峡工程10年建设的脚步,库区各级政府10年来开展了大规模的新城建设和城乡移民安置,应该说:任务艰巨,困难重重,成效显著!
目前有关太阳能电池的数学模型已有不少,但是大部分都太理想化和实际差距比较大。基于此讨论了满足工程应用精度且便于运算的太阳能电池数学模型。该模型的特点是仅采用生产
在本工作中,通过在氮气保护下热解Pt纳米颗粒结合的ZIF-67制备了由ZIF-67原位产生的氮掺杂碳负载Pt Co合金纳米颗粒组成的Pt Co-NC复合催化剂。通过X射线衍射,扫描电子显微镜