基于能量的音频流分割和多模式自动机控制系统

来源 :西南师范大学 西南大学 | 被引量 : 0次 | 上传用户:wangbohan1991
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别即语音信号处理是当今信息科学研究领域中的一个重要分支,它是将数字信号处理与语音学相结合,解决现代通信领域中人与人之间、人与机器之间的信息交换问题。 让人与计算机自由地交谈,机器能听懂人讲话,是语音识别技术最终将实现的目标。进入九十年代,语音识别方面的研究进一步升温,出现了诸多实用化的研究方向。作为语音识别和应用的前期步骤和首要条件很早就受到人们的关注。随着计算机应用的普及、性能的提高以及语音识别和实时音频流领域的研究逐步成熟,语音的应用越来越成为现实,因此对语音分割的研究也正在受到越来越多的重视。 本文首先归纳和分析了当前语音检测的典型算法,通过综合比较,然后提出了一个基于能量的应用于教学系统的实时音频流分割的算法,首先对语音进行滤波除噪的预处理,然后利用语音的能量特征进行分割,最后利用有限自动机进行多模式控制。本系统具有实时性好,准确性高等特点,并且投入实际应用后,已经取得了很好的使用效果。 本文对各级操作都给出了简单实用的算法,在Microsoft Windows 2000平台上visual c++6.0开发环境下,采用上述算法编制了语音分割和多模式控制的软件。一共使用了10段,大约六十多分钟的英语听力材料进行实验,并利用实验结果对程序的一些参数做相应的调整。实验证明软件能够对音频流进行正确实时检测和相应的控制。
其他文献
该课题来自国家"863"项目《多源空间数据挖掘技术》.数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一.随着INTERNET的大
作者的论文题目为"一阶规则挖掘系统的研究与实现",该项目得到了国家自然科学基金、北京市自然科学基金的资助.该文是对作者研究生期间所作研究工作的总结.数据挖掘技术是当
Internet的飞速发展,使得基于Web的分布式数据库应用也越来越广泛,但传统的通过远程调用(remote procedure call)或消息传递(message passing)等访问远程数据库的方式,对网络的
遥感(RS)影像承载着丰富的信息量,如何识别遥感影像中的地物信息是当今遥感领域的研究热点。遥感影像分类是指将影像中的像元进行相似度归类,理论依据可以追寻到统计模式识别技术。常用的遥感影像分类识别技术有监督分类和非监督分类:监督分类法需要先选取地物类型和样本数,在确认分类的情况下利用分类器将未分类的像元归属到已定义的类别中;非监督分类法利用相关算法直接根据像元光谱或纹理信息的特征差异将遥感影像分类,
随着网络规模的日益扩大,网络服务需求已超过了网络服务容量,对具有QoS服务的应用产生了严重的影响。为了增强服务的可用性和改善网络流量分布,通常的方法是在网络中复制服务器
三维几何数据是继文本、图像、音视频后的一种新数据类型,并且通过互联网大量传输.传输设备的热噪声、周围环境的干扰、网络拥塞以及缓冲区溢出等问题,都可能导致包丢失或随
分布式多媒体监控系统,是一个集多媒体信息的多样性、计算机的交互性、通信的分布性和监控的实时性等技术于一体的综合系统,国外称之为3GSS(Third-Generation Surveillance Sys
随着网络技术的发展,Internet已逐渐成为人们生活、工作中不可缺少的一部分,成为全球经济、生活的重要组成部分。Internet用户正在急剧的膨胀,用户对网络所能提供的服务种类和服
软件过程对软件项目开发的成败起着重要作用。目前软件工程领域可供选择的软件过程很多,有轻量级的软件过程如XP,重量级的软件过程如RUP,以及目前流行的CMM等。这些软件过程
Agent技术是人工智能(Artificial Intelligence,简称AI)领域中目前最主要的研究方向之一。Agent技术包括智能Agent、移动Agent、实时推理—规划—决策、多Agent系统以及面向Ag