声源辨别及定位的并行化方法的研究与实现

来源 :江苏科技大学 | 被引量 : 3次 | 上传用户:zhoubujin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“互联网+”和大数据时代的到来,智能终端的语音交互体验广受关注,三维立体声音在实时人机交互中占有重要地位,声源辨别及定位技术被广泛应用于民用和军事领域,具有良好的发展前景。声源辨别定位算法较高的计算复杂度与较大的数据处理规模,制约了其应用的实时性。为此本文设计了声源辨别及定位的并行化方法,基于拾音阵列和GPU并行计算开展了如下工作:(1)以现有声源辨别及定位方法为基础,研究了语音信号预处理的相关技术,介绍了声纹辨别与声源定位的常用方法,分析了基于拾音阵列的声源辨别及定位模型。(2)在传统声纹辨别神经网络的基础上,引入深度学习技术,设计了基于深度信念网络(DBN)的声纹辨别模型,克服了传统神经网络学习能力不足的缺点;给出了针对目标范围内声源辨别的改进方法。(3)在原有TDOA声源定位模型中,将信号的包络分析技术融入时延估计算法中,设计了基于包络匹配法的广义互相关时延估计算法,研究对比了不同声源定位模型的位置解算方法及其性能;利用拾音阵列的位置特性,研究了基于时频掩蔽的目标语音分离和增强方法。(4)针对语音信号处理具有独立性强、方法一致的特点,使用基于CUDA架构的并行计算方法,分别对DBN模型的训练过程、时延估计中的信号分析和信号融合的时频掩蔽算法等操作进行并行化改进,提高了辨别定位方法的处理速度。实验表明,基于拾音阵列的声源辨别及定位的并行化方法能有效实现对目标声源身份的辨别和位置的确定,抗噪性能较好,并行算法的效率有了明显提高,满足实时性的需求。该方法为大数据环境下语音信号的高性能处理提供了一种实现方式。
其他文献
采用不同的TMCP工艺,轧制了16mm厚的Q345建筑钢板材。对钢材的金相组织进行了观察,对抗拉强度和屈服强度进行了测试。结果表明,随着精轧温度区间向较低的轧制温度推移时,钢材
灌输是思想政治教育的基本原则,但是它容易被滥用。且单讲灌输原则,也难以同一些现代教育方法相衔接,因此应当以平等原则和灌输原则作为思想政治教育之共同基础:灌输原则为平
周大新的新时期军旅小说创伤大体可分两类-战争小说与和平军营题材小说,在战争小说创作中,周大新在英雄形象的平凡化塑造及战争小说形式的创新上都进行了可贵的探索,取得了长足的
传统民法学界认为合同解除具有溯及力,就意味着合同消灭,回到未订立合同之前的法律状态,恢复原状,但是这种恢复原状的做法过于僵硬。对于合同解除的溯及力问题提出了质疑,确
儿时看的《幼儿画报》里有我最早接触的漫画,时至今日,我还记得"掘井九仞而不及泉"的典故,虽然当时并不知道孟子为何人,但坚持、不放弃的这种品质一直影响着我。后来,随着识字
随着我国信息技术与互联网技术的逐步发展,极大程度上的拓展了人们的视野,新型教学模式应运而生,进一步提高了教学效率和质量。计算机网络安全教学具有较强的实践性和理论性,
Q345GJB钢主要应用于高层建筑钢结构。通过对该钢的焊接性能分析,发现其具有一定的焊接冷裂纹敏感性,在焊接厚板时需要一定温度的预热,且需要保持一定的层间温度。针对其焊接
汉字教学是对外汉语教学的重要组成部分。对于母语为非汉语的学习者,学习汉字的时往往会在书写上出现偏误,这些书写偏误普遍存在于学习者的学习过程中,有一定的普遍性和规律
面向对象开发思维是当代软件工程领域重要的行为规范,是软件工程学生必须要掌握的基本理论。该文论述了运用Python语言作为面向对象课程实践工具的起因、优势和具体实践过程,
全球零售商自有品牌呈增长态势,实施自有品牌战略为提高零售商市场竞争力发挥重要的作用,本文就自有品牌战略实施对策提出几点建议。