论文部分内容阅读
目前的语音识别系统普遍采用PC或者服务器的形式作为系统的工作平台,这种方式不可避免地存在体积大、功耗高、不便于携带、实用性低等问题。并且通常的语音识别系统由于噪声、混响等实际情况而导致语音增强处理的过程过于复杂,无法在嵌入式系统中顺利的使用。针对以上问题,本文在总结传统语音增强技术的基础上,展开了对嵌入式语音识别系统的研究,并就课题中所涉及到的相关理论和关键技术进行了深入的探讨,主要包括以下几个方面的工作。首先,介绍了嵌入式系统和语音识别中语音信号增强技术的发展和研究现状,指出了目前语音增强技术存在的问题,论述了课题的主要研究内容;并在介绍几种常用的阵列麦克风拓扑结构设计方案的基础上,全面的分析了各种阵列麦克风语音增强方案的性能指标。其次,研究了一种高效实时的在混响环境下带干扰噪声的语音信号增强方案。该方案以阵列麦克风为前端语音拾取设备,对每个麦克风之间采样得到的语音信号进行多径角度分集接收处理,通过分析语音信号之间的相位关系,多波束形成,对相干信号延时处理并加权合并提高信噪比以实现对采集得到的语音信号的增强处理,并通过调整权值矩阵滤除非语音频段信号和噪声,进而进一步降低可能引入的噪声污染。再次,对系统的硬件平台进行了详细的设计,介绍了嵌入式操作系统的特点及其移植的相关知识;在基于S3C2440的硬件平台上,详细的阐述了系统引导程序BootLoader的编写及Windows CE 6.0的移植过程;并介绍了系统软件的总体设计和关键的语音增强算法的详细研究过程。最后,对系统进行了大量的综合仿真试验,总结系统的各方面能力并分析存在的问题,为进一步的研究提供了方向和宝贵的经验。