基于SVM主动学习的音乐分类

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ymh19900920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来互联网技术与多媒体信息技术的快速发展,宣告了二十一世纪正式开始步入大数据时代,如何从海量的数据信息中检索出有用的信息将非常具有研究意义。互联网的多媒体信息中就包括数量增长迅速的数字音乐,大量歌手涌现,海量专辑和网络歌曲纷纷面世,另外受世界文化发展多元化的影响,各式各样的音乐风格也随之产生,为满足人们根据自己不同的喜好来准确而又快速的找到自己想要查询的歌曲,这就要求音乐检索系统更加高效和快速。然而传统的音乐分类都是先训练音乐样本得到分类模型,然后对未知的音乐样本进行预测,这种传统的分类方法所得到的分类器效果往往取决于训练样本的数量。对海量的训练样本全部进行人工标注显然是不现实的,主动学习方法可以很好的解决这个问题。支持向量机(Support Vector Machine)是一种性能十分优良的机器学习方法,本文将主动学习方法与SVM相结合,并将其应用于音乐流派分类当中。传统的基于SVM的主动学习方法的样本选择策略往往只局限于样本的不确定性,即认为距离分类超平面最近的样本点所包含的价值也就最大。基于这种算法本文做出了如下改进:(1)在选取最有价值样本时,考虑选取那些距离分类超平面较近的样本的同时也考虑保证样本的多样性。由于音乐样本的特征维度较高,本文选取样本之间的角度来作为样本多样性的衡量标准,并由此制定了最终的样本价值评判标准score;(2)“一对其余”方法是SVM应用于多分类时的常用方法,然而这个方法人为的造成了数据集的偏斜,这会对最后的分类效果产生一定的影响,所以本文在进行价值样本选取时,制定了样本平衡性判断标准参数b,当主动学习方法选取的价值样本数量不满足平衡性条件时就对其进行平衡性调整。
其他文献
2M传输线路是我国电信传输网传输系统的基础。在我国,无论是准同步数字体系,还是同步数字体系,都是建立在2M传输线路的基础之上。因而,2M线路的传输性能直接影响我国电信网络
步入“大智移云“(大数据、智能化、移动互联网和云计算)时代,人类之间的联系更加密切,信息的交换也更加频繁。传统的数字采样技术在面临海量数据的时候,由于需要先采样后压
随着多媒体技术和Web技术的发展,基于内容的视频检索系统成为近年来研究的热点。将计算机视觉技术、数字图像处理与传统的数据库技术相结合,建立基于图像和视频内容的检索系
随着汽车电子技术的不断发展和完善。以电子信息技术为主的车载信息娱乐系统,即音频、视频、导航和遥信成为当今研究的热点问题。本文着重研究车载视频播放系统的相关理论和
当今社会,资源越来越匮乏,但人们的生活需求却越来越大,产生的能耗也是急速增长,因此在有限的能源下,怎样使的资源能够最大化的利用是当今讨论的热点,同样在通信系统中也面临
随着网络越来越普及,多种通信方式被相继提出。但是作为数字通信的基础环节的调制方式却发展缓慢。有线宽带ADSL、VDSL采用的DMT和3G、4G采用的OFDM是基于早年提出的多载波原