【摘 要】
:
说话人识别属于生物特征识别技术的一种,根据声纹中所反映的说话人个人信息的特征参数,自动识别说话人身份,具有广阔的市场应用前景。本文研究了基于模糊聚类分析和核函数的
论文部分内容阅读
说话人识别属于生物特征识别技术的一种,根据声纹中所反映的说话人个人信息的特征参数,自动识别说话人身份,具有广阔的市场应用前景。本文研究了基于模糊聚类分析和核函数的说话人识别方法,主要内容包括:1针对说话人识别方面的特点,对高斯核函数进行了改进,研究了基于样本方差的模糊高斯核说话人识别方法,该方法可根据不同的人确定核函数的宽度,实现了参数的自适应调整。为了避免模糊聚类时容易陷入局部极小值的情况,在基于样本方差的模糊高斯核说话人识别中引入具有全局优化特性的粒子群算法,并对基本粒子群算法进行了改进,提出了基于改进粒子群的模糊高斯核矢量量化算法,获得了全局优化的码本,提高了识别率。2针对模糊核聚类时聚类准确性差和对噪声敏感的问题,将可能性模糊聚类引入说话人识别中,研究了基于核的可能性模糊矢量量化说话人识别方法,该方法提高了识别率;为了利用样本邻域信息,在特征空间的可能性模糊聚类目标函数中加入局部邻域约束,提出基于邻域约束的可能性模糊核说话人识别方法,进一步提高了说话人识别率。3针对模糊熵中存在参数难以调整及说话人识别率有待提高的问题,研究了基于核函数的模糊可能性矢量量化和基于可能性聚类的模糊核熵矢量量化说话人识别方法,并利用模拟退火方式优化两种方法中的参数,实验表明两方法都具有更好的分类准确性和识别性能。
其他文献
随着多媒体技术和互联网技术的快速发展,互联网上的图像数量呈爆炸式增长。同文字信息相比,基于视觉的图像更加生动、易于理解,这种优势使得数字图像的应用范围非常广泛,比如
随着宽带业务发展和智能终端设备的广泛普及,网络服务已经逐渐融入社会各个行业,业务种类更加趋于多样化和宽带化。传统光网络采用WDM技术实现端到端业务的通道化“透明”传
随着数字时代的发展,每个人都可以成为多媒体资源的发布者,每时每刻都有海量的图像被上传到分布在世界各地的服务器中,图像检索也逐渐成为各个搜索引擎不可或缺的一部分。其
随着科技的发展进步,制造工艺及水平都己进入到全新的时代,但是制造技术的发展、水平的提高却无法保证产品质量绝对可靠。任何时候,从工厂生产出产品都有好坏优劣之分,而不经
传动轴功率的测试研究主要是针对运载工具中动力传动系统效率开展研究的,动力传动系统是运载工具动力装置的重要组成部分,其传动轴功率参数为检验其动力能否达到设计要求提供了
绩效管理是近年来在企业广泛推行的新型管理举措,是一种以企业战略目标为导向的、先进的员工评估制度。通过系统的方法开展绩效考核管理工作,对于提高企业管理水平,提升职员工作积极性,增加企业的经济效益,具有深远意义。随着网络计算机技术的飞速发展,企事业单位对各自的信息化建设也提出了更高的要求,纷纷建立计算机网络平台和软件应用系统。科学的体现先进管理思想和高效的实施企业战略的绩效管理软件系统不仅可以作为企业
电力线载波通信(Power Line Communication, PLC)利用现有的电力线网络资源,不需要重新布线,大大降低了通信网络成本,这种通信方式可将一定区域内的用电设备组合起来,非常便