基于i-vector的语种识别系统设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:gf930
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的快速发展和国际化交流的不断深入,多语言交流需求在不断增大,语种识别技术在智能语音领域中的重要性也在不断提高。然而,当前的语种识别技术主要停留在算法研究阶段,已有的语种识别系统也主要依赖用户上传的语音文件进行识别,交互方式单一且繁琐。若能实现一个方便高效的语种识别系统,能使语种识别技术向应用化更近一步。本文针对目前语种识别系统级实现较少且已有系统交互方式单一且繁琐的问题,设计并实现了一个基于i-vector的语种识别系统,具体研究内容如下:本文完成了基于i-vector的语种识别系统设计。采用了高内聚、低耦合的分层设计方案,从系统需求出发,完成了语种识别系统的总体设计和分层设计。系统设计包括数据采集层、数据传输层、算法分析层、系统管理层以及系统可视化层这五个层次的设计。其中数据采集层由实时数据采集模块和离线文件采集模块组成,数据传输层由语音数据传输模块和系统信令传输模块组成,算法分析层包括语音预处理、特征提取与融合、i-vector提取以及语种判别这四个部分,系统管理层包括用户管理、设备管理以及数据管理这三个模块,系统可视化层包括前端交互页面展示和图表可视化这两个部分。本文完成了基于i-vector的语种识别系统实现。在完成语种识别系统设计的条件下,先后完成了系统中数据采集层、数据传输层、算法分析层、系统管理层以及系统可视化层的实现。其中数据采集层支持麦克风模组拾音和离线文件两种语音数据采集方式。数据传输层负责将语音数据和系统信令传输到业务后台,然后由业务后台调用算法分析层的语种识别算法对语音数据进行分类识别。系统管理层和系统可视化层支持用户和设备更为友好的接入系统并对语种识别数据进行管理。最后进行了详尽的测试和分析,结果表明本系统可以在14s内完成整个语种识别任务,且识别准确率在87%以上。
其他文献
飞机表面蒙皮伤痕是威胁飞行安全的一大主因,因此,航空公司在飞机转航停场期间对蒙皮伤痕进行检测是保障飞行安全的重要工作。目前较为先进的检测方法是基于计算机视觉的伤痕检测法,该方法将采集到的飞机蒙皮图像传输给伤痕检测服务,进行基于人工神经网络的图像处理以识别伤痕类型及位置信息,从而判断蒙皮受损程度,保障飞行安全。由于检修飞机数量多、检修时间短,该方法在图像传输、处理过程中需要进行大量的数据传输和计算。
语音增强作为语音任务的前置预处理技术,在语音识别、语音分离等中得到了广泛的应用。语音增强主要是从含噪语音中去除掉噪声语音,恢复纯净语音。在过去的研究中,主要分为传统算法和基于深度学习的方法。传统的算法包含了许多假设,在低信噪比环境下会出现语音失真。现在基于深度学习的算法被证明效果要优于传统的算法。本文主要工作是提出了基于时域的语音增强算法。过去利用深度学习来进行语音增强时,往往工作在频域,需要将含
科学的体育运动能够改善人体的健康状况,对人们日常生活中的体育运动进行定量分析,能够有效避免不当运动带来的损伤及达到运动促进健康的最优效果。步行作为人们日常生活中最主要的运动方式,步态数据对于评价人体健康程度具有十分重要的研究价值。随着5G商用的逐步推进,物联网(Internet of Things,IOT)的快速发展带动了人们对体联网(Internet of Bodies,IOB)的探索,基于可穿
当今的许多大中型企业中总有数目繁多的科技项目亟待立项,这些待立项的科技项目常常会在特定的时期需要大量的相关行业专家来进行评审,然而这时仍沿用传统的人工遴选项目评审专家的方式,想在短时间内找出一批合适的项目评审专家无疑是十分困难的。对此本文以科技项目的评审专家遴选问题为研究背景,选用电力行业内真实的项目申报材料作为研究样例,应用自然语言处理模型预测出每篇科技项目与电力行业内相关研究领域之间的关联度,
源代码缺陷检测技术作为一种重要的软件测试技术,具有缺陷检测效率高、故障定位准确和自动化程度高等特性。然而人们在实际应用该技术的过程中,发现其检测结果存在警报量大、重复率高以及误报等问题,需要专业的技术人员投入大量时间对检测出来的缺陷进一步确认,这也就导致了人工确认效率低下的问题。针对该问题,本文在对缺陷模式分类的分析上,提出了基于触发路径约束求解的警报自动确认方法。本文的具体研究内容如下:(1)程
众所周知,自然界中的频谱资源是有限的,随着航天事业的飞速发展,频谱资源越来越紧张。在卫星对地的传输过程中,卫星的信号能被地面上的若干个地面站和接收船所接收,这些接收设备的环境各不相同,而设备接收信号的顺序会影响该频段的资源利用率,因此如何合理且高效地进行频谱资源的调度是航天测控领域中重要的问题。本文在航天测控系统单信道和多信道的场景下,对无线资源的管理与调度进行了研究。本文提出一种基于切片循环神经
随着网络发展,人们对网络的需求丰富,路由器需要对数据包完成更复杂的处理从而为用户提供更多的功能和更好的服务质量(QoS)。而高性能路由器单端口速率越来越快,为处理链路拥塞时缓存的海量数据包,通过无限增大路由器存储空间,对于路由器工艺设计来说难以实现,且因更复杂处理流程而增加的端处理延时无法改善。可以从路由器存储体系入手,增加路由器存储体系带宽,使单位时间内能够处理更多网络数据包,以进一步提升路由器
随着信息化时代的高速发展,网络上的数据得到爆炸式增长,呈现种类繁多、结构复杂等特点,传统推荐算法逐渐不能有效解决信息过载的问题。伴随各类社交应用的涌现,融合社交信息的推荐技术开始成为学术界和工业界的研究重点。社交推荐算法在评分数据的基础上引入了用户社交网络的信任信息,可以有效缓解数据稀疏和冷启动问题。但是,大多数社交推荐算法仅对用户自身的购买偏好建模,忽略了用户信任朋友的偏好信息,且没有充分挖掘用
报纸
近年来,在人口老龄化趋势逐渐显现的同时,年轻人猝死和患癌的新闻也层出不穷。随着亚健康人群比例的逐年增高,我们的医疗资源却远远不能满足人们现有的需求,让每个人都经常去正规医疗机构检测是不现实的,与此同时,我国2019年在国家规划层面也将医疗物联网的发展政策纳入了基于健康中国总体规划的智慧医疗互联网医疗政策体系。故而结合物联网技术的智慧医疗平台的设计不管是对个人还是对国家都是具有重大意义的。论文针对以