基于隐含语义分析的语种识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zhuce121566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种识别是利用计算机对一定长度的语音材料进行处理,判别其所属语言种类的过程,是语音识别的一个重要研究方向。随着经济全球化的不断深入,语种识别在日常生活、国防军事和公共安全等领域都有着极为广泛的应用前景。   一般来说,每一种语言都具有各自相对独立的音素集、韵律、词汇和句法、语法,这些差异为语种识别的实现提供了可能。根据建模思路的不同,主流的语种识别方法可以分为两大类:基于声学模型的方法和基于语言模型的方法。其中,基于语言模型的方法首先使用语音识别技术将语音信号符号化为音素序列,然后利用不同语种中音素的搭配呈现不同的规律进行语种的识别。这种方法的优点是性能稳定,扩展性好,颇受国内外研究人员的推崇。   本文即围绕语言模型方法,在基于音素搭配关系的框架下,对语种识别方法进行了较为系统的研究,首先搭建了从音素识别器到统计语言模型的完整系统,然后着眼于降低算法复杂度、提高系统识别性能等方面。同时,借鉴信息检索中词袋(Bag of words)的思想,引入特征选择和隐含语义分析等方法,挖掘不同语种统计语言模型中的区分性特征和隐含语义结构,并取得了一定的进展。具体的研究工作包括以下几个方面:   第一,比较了在音素识别前端相同条件下用不同解码方式对语种识别系统性能的影响,通过实验表明了用词图的输出结构比最优序列能够得到更为丰富的音素识别信息,同时构造了新的核函数,较大程度地提高了语种识别的准确率。   第二,在音素识别结合支持向量机的语种识别系统中,针对特征矢量高维、稀疏的特点,对表征每个语音段的特征矢量采用关键词选择的方法筛选特征,降低计算复杂度,减少特征的冗余度,进一步改善了语种识别系统的性能。   第三,分别引入两种隐含语义分析的方法——隐含语义分析方法和概率隐含语义分析方法,选取更加鲁棒和具有代表性的隐含语义特征,缓解了高维和稀疏的问题,降低了算法复杂度,提高了基于音素识别结合支持向量机方法的语种识别准确率。  
其他文献
微地震监测技术在油气藏资源开发中发挥着重要的作用。微地震监测技术通过对已知观测数据的分析,对微地震事件进行定位,用以分析地下的形态结构或指导油气藏开发。微地震定位技
随着雷达技术的发展,由于其回波信号的数据量大、数据率高并且对存储的时间要求长,这就对作为其重要部分的存储系统提出了大容量、高数据率的要求。本文针对此要求,采用了SAR
分布式仿真是当前系统仿真的研究热点,采用高层体系结构(High Level Architecture,HLA)标准协议可以将仿真的功能实现、运行管理以及底层通信分离,为仿真系统提供高度的互操
随着现代计算机技术和互联网技术的发展,多媒体数字作品的获取、复制和传播变得越来越容易,这也使得多媒体数字作品的版权日益受到严重威胁,极大地损害了作品所有者的经济利益,由
近年来,互联网与社会经济发展和人们生活的关系越来越密切。计算机和网络已经成为社会不可或缺的重要部分,而互联网的安全问题也随之而来。其中,网络蠕虫是最大的安全隐患之
从1984年CCITT发布第一个视频编码标准H.120以来,视频压缩编码技术获得了迅猛的发展,一系列视频编码标准陆续公布,从MPEG-1到MPEG-4,从H.263到H.264,这些标准的发布极大推动
Web技术的革新使其逐渐成为网络内容生产和消费的平台,互联网上充斥着无数以网页形式存在的信息源,随着搜索引擎、网络监控和新闻推送等应用和研究工作的深入发展,使得互联网
近年来,地基干涉合成孔径雷达(GB-InSAR)应用于形变监测领域已引起了广泛关注,比如山体滑坡监测、大坝监测以及冰川监测等。该监测系统具有测量精度高、测量距离远,能在几十
在上世纪九十年代,我国著名学者陈难先教授等人提出了无穷级数的Mobius变换理论,开创了应用、推广数论中的Mobius变换解决物理学中各种逆问题的巧妙方法,在1990年就得到了世界著
多模型(MM)滤波和粒子滤波(PF)是当前处理机动目标跟踪中非线性非高斯问题较为有效的目标状态估计方法。粒子滤波用一组采样粒子来描述目标状态的后验概率密度,摆脱了非线性滤