语音信号听觉心理特征参数的研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:loopdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从听觉心理的角度出发,研究了语音信号中反映人类听觉感知的特征参数,目的在于使计算机能够更好的模仿人耳对声音的感知,模仿人耳在声音中能提取自己感兴趣的信息的能力。这种应用于语音处理的听觉心理的研究可以广泛应用在语音编码质量评价、通信网络质量评价、人机交互式的家电、玩具、身份识别、权限验证等等方面,能够大大提高计算机为人类工作的能力和方便性。   本文主要的研究工作包括:   1.研究了语音处理的听觉心理因素。探讨了听觉心理与物理的关系,寻找出能反映各种听觉特性的语音特征参数,让参数矢量模拟人的感知。   2.在前人所用过的方法的基础上,提出了几种用于客观音质评价的新方法。包括基于听觉要素的Mel谱测度(HFCC),频率加强MFCC测度,频率带距离测度,以及基于听觉感知的改进滤波器的BSD测度。本文通过AMR、MP3编码语音主客观评价实验、纯音失真测度实验、双频失真测度实验等证明,这几种测度方法不但提高了主客观评价结果的相关度,而且对频率失真的敏感度也比前人所用的方法要高。   3.分别根据语义识别和说话人识别的不同要求,以模拟人类听觉感知特点为出发点,提出了孤立字识别和说话人识别的改进方法。主要是研究了它们对特征参数的选择和处理。前者改进了聚类方法,使语义识别结果不会因语音能量的变化而容易发生变化;后者则综合LPCC、HFCC、ERBBSD等几种能反映听觉心理不同特性的参量进行说话人确认。本文通过新旧特征和方法的识别比较实验证明,改进后的基于听觉心理的识别方法,都能获得更高的识别准确率。   本文的研究工作证明,对反映听觉心理的特征参数的选择和处理问题能直接影响到语音处理系统的性能。如果能让计算机更好的模拟人类的感知能力,将会有更广的应用前景。
其他文献
同步对并行多处理机的性能有很大的影响。并行程序通常使用路障对并行进程达成同步。在到达路障时,处理机必须进行空闲等待直到所有的处理机都到达路障。用软件方法实现路障需
随着IC技术和网络技术的飞速发展,人们对通信的需求逐渐转向以音视频通信为主的多媒体通信上来。与图像通信紧密相关的流媒体技术正逐渐改变和替代传统的媒体发布形式,在高效的
随着光交换技术的发展,人们逐步提出了光路交换(OCS)、光分组交换(OPS)以及光突发交换(OBS),前两者各有特点,但同样也存在缺陷,而光突发交换是光路交换和光分组交换的一个有
非合作通信作为非授权接入的通信方式,是在不干扰合作通信双方正常通信的条件下接入到合作通信系统的通信方式。在非合作通信方式下,由于发端信息未知性以及信道干扰的复杂性
目前,我国广播电视系统,正处在由模拟向数字的转变过程中。与此同时,网络传输低码率视频流的需求与日俱增。应用于这个领域的低码率视频编码标准也应运而生,目前主要有 MPEG-
本文设计了一种基于DSP的视频采集压缩系统,该系统采用了PHILIP公司的视频A/D芯片SAA7113H,将模拟视频信号转换成数字信号,同时CPLD控制将数据流写入DSP进行压缩处理。最后将压
有线/无线转接器能实现无线电台和有线电话之间的转接,是解决短波无线电台与电话网互连的专用通信设备。有线/无线转接器的关键技术是如何有效地抑制回波,以提高通信质量。 AT