大数据语音语料库的社会标注技术研究与实现

被引量 : 0次 | 上传用户:laopoxqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文给出了大数据语音语料库的社会标注策略。首先,引入了针对语音数据标注的六元组模型,将语音资源的自身特征考虑进去,并将标签对象扩展为更为广义的标记。然后,提出基于"兴趣+收获+报酬"的标注模式,并建立标注质量的三层检验机制。通过工程实现和应用,验证了本文方法在效率、质量和成本等方面都具有明显优势。
其他文献
多年以来,我国的英语教学,如同其他学科的教学一般,深受应试教育观念的影响。在这样的教育理念引导之下,学生仅仅是机械式的记忆和背诵,而教师则扮演着灌输式的传榆知识的角色。如
目的了解糖尿病(DM)患者超声乳化白内障吸除术后干眼症相关指标的变化。方法收集2013年10月至2015年1月期间广东省湛江中心人民医院眼科行超声乳化白内障吸除术的80例(80只眼)白
导课对于教师来说很平常,且似乎很简单.但是,许多老师对于“什么是导入?”、“导入的作用是什么”和“导入的方式有哪些”等并不一定很清楚,因此就有深入研究的必要.导入又叫