【摘 要】
:
随着现代信息技术,特别是网络技术和多媒体技术的迅速发展,多媒体数据已成为互联网上传送数据的主要部分。音频是多媒体中的一种重要媒体,由于音频数据量的快速增长,如何在大
论文部分内容阅读
随着现代信息技术,特别是网络技术和多媒体技术的迅速发展,多媒体数据已成为互联网上传送数据的主要部分。音频是多媒体中的一种重要媒体,由于音频数据量的快速增长,如何在大规模的音频数据中迅速、有效地检索出所需要的音频信息就变得越来越重要。传统的音频检索技术需要耗费大量的劳动力,而引入机器学习可以降低人工参与,也可以更智能地处理音频数据。机器学习能够根据用户的特定需求从海量数据中建立模型并发现有用的知识。本学位论文将半监督学习策略用于音频检索,提出了一种检测具体应用环境中声音元素的方法。首先,利用小波的多分辨率分析特性,提取3层小波分解后低频系数的MFCC特征、原始音频数据的频谱质心以及具有较好抗噪声性能的谱熵特征,并计算MFCC特征的均值、频谱质心和谱熵的方差,由此构造14维特征向量。其次,针对Tri-training算法学习时会引入噪声,而且对无标记样例的利用率不高的问题,提出了基于辅助学习策略的半监督协同训练学习算法(AR-Tri-training)。该算法在少量的已标记样例基础上,根据所提出的辅助学习策略设计音频学习器,再结合富信息策略,达到在学习过程中消除噪声的目的,从而提高了数据的利用能力。最后,将音频学习器用于特定场景中,提出了一种能够实时检测场景中声音元素的检测算法。以2s时长作为检测单位,提取实时录入音频数据的特征向量之后,将此特征向量输入经训练后的音频学习器,从而检测出声音元素以及时间分布,并分析了检测系统的性能。实验结果表明,本文提出的AR-Tri-training算法与Tri-training算法相比,不仅移除了每次学习过程中可能产生的噪声,而且能够充分利用无标记样例,提高了识别率。构造检测系统后的测试表明,本文算法构造的检测系统性能优于基于Tri-training的系统。
其他文献
<正>藏香猪又名人参猪、琵琶猪,是我国特有的小型地方优良品种和高原放牧型猪种,常年以蕨麻、车前子、天蓝苜蓿、野苜蓿、野豌豆、苦苣、野燕麦、珠芽蓼及森林落果等为食。其
中国宪法和缔结条约程序法规定了重要协定制度。重要协定和非重要协定缔结的国内法程序不同,法律效力也应有所不同。决定重要协定及非重要协定的内在根据是协定事务的重要性,
目的以西洛他唑片为例,利用SOTAX自动溶出仪对溶出度方法作方法学验证。方法采用中国药典西洛他唑的溶出度方法,手动稀释改为自动循环测定(1 mm比色皿)。结果回收率100.1%,重
1病例介绍患者,女性,32岁,腹痛、腹胀、有下坠感一周。自诉“此次月经期延长至半个多月未尽”,近4、5d自觉午后发热。查体:压痛、反跳痛(+),呕吐(+)。Bus:腹水、盆腔7.1cm包块。CT扫描示:右
<正>在当代中国诗人中,张枣可谓是用来验证新诗回归语言的最好的案例。用德国汉学家、诗人及译者顾彬的话来说,张枣"是中文里唯一一位多语种的名诗人。他不仅可以用多种语文
公司高管薪酬的确定属于一种关联交易,内含了特殊的公司利益冲突。法律对高管薪酬的规制非常必要,但其作用又是有限的,且其作用的范围和方式都是特定化的。公司法、证券法上
张枣的十四行组诗《跟茨维塔伊娃的对话》主旨极其复杂。从总体上看,此诗可以从三个"面向"出发加以考察:历史、诗歌与救赎。前两个方面与臧棣所认定的20世纪90年代诗歌的两个
<正>真功夫凭借自主发明的"标准化程序"和合理的经营策略,在2004~2007年,始终保持着年均55%的增长速度。同时,它还制定了一套完备的营运方式——80秒餐到手。这几"招"让真功夫
进入新时代,党中央对做好大统战格局下的基层统战工作提出了新的更高的要求。本文通过调研清远市基层统战工作的新特点,分析当前面临的主要问题,借鉴实践案例经验,对做好大统
构建了磁絮凝处理矿井水实验装置,并使用RS485接口经串口协议与计算机MFC控制程序交换数据。根据实验装置所得数据,采用C++调用Matlab Engine实现GA-BP和GRNN神经网络的训练