基于多示例学习的话者属性分类研究

来源 :江苏师范大学 | 被引量 : 0次 | 上传用户:lzxldf2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
话者属性分类是指计算机根据话者语音确定其性别与地域信息的过程。它在多语言信息处理、机器翻译、公安刑事侦查和军事情报搜集等领域有广泛的作用。多示例学习是解决模式多义性的一种有效的机器学习算法,它在图形检索、文本分类等静态模式分类中得到了广泛的应用,但在语音识别、话者识别等动态模式分类领域还缺少研究。本文重点研究多示例学习算法在语音性别识别和方言辨识中的应用。主要做了以下创新性工作:1.对汉语方言语音数据库进行扩展与标注。主要对北方方言、闽方言、湘方言、赣方言、吴方言、粤方言、客家方言七种汉语方言和普通话的电话语音数据库进行扩展。对每段语音标注说话人的相关信息,如性别、年龄、录制时间和所在城市。2.提出多示例时变模式学习算法。提出语音信号的包生成算法,把多示例学习算法运用到语音信号处理中,由于语音信号的连续性,人工把语音信号切割成时间相等的语音段,提取语音信号的声学特征,用K均值算法得到包中的示例。3.建立语音信号双点模型。本文提出双点模型代替单点模型,在尺度变换下,利用EM-DD算法分别求出不同类别的最大多密度点。4.设计了Bags-kNN分类器。在后端分类阶段,解决了集合与集合之间的距离测度问题,取代了传统的阈值判断,提高了分类器的性能。
其他文献