基于用户评论的自动化音乐分类方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zsk1370826
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐分类作为音乐信息检索(Music Information Retrieval,MIR)领域的一个重要分支,常用于音乐检索和音乐推荐。现有的音乐分类方法从音乐的流派、感情、乐器、艺术家和标注五个角度进行分类。但是这些分类方法都过于局限,它们将音乐的类别限制在了一个固定的范围内,导致用户无法根据音乐的细节信息进行音乐检索。针对音乐分类类别固定、搜索内容过于局限的问题,本文提出了一种基于用户评论的自动化音乐分类方法。此方法不再局限于已有的音乐类别,可以得到更为多样化的分类结果,为用户提供更个性化的检索体验。该方法的出发点为用户对音乐的评论描述更为深入,这些详细的描述对音乐的分类有重要的参考价值。本文的主要工作如下:1)首先利用线性链条件随机场(linear Conditional Random Field,linear CRF)模型识别专业名词。然后使用N元词串提取和紧密度分析方法,利用种子生成的思想得到适合音乐语料分词的字典。此混合方法能获取较为准确和丰富的字典,降低基于统计的分词模型对标注语料的需求。2)使用linearCRF和上述的音乐字典进行分词。接着使用基于词汇紧密度分析的分合测试评估分词结果。接着使用MMSEG(Max Matching Segmentation)模型进行分词修正,使得修正后的分词结果拥有较高的准确率。3)对比多个关键词提取算法,选择TFIDF(Term Frequency-Inverse Document Frequency)算法并优化,削弱了词频在提取过程中的影响,提高了候选标签的准确性。然后再从全局角度对候选标签进行过滤,得到音乐的关联标签。4)建立音乐的多标签概率分类模型,对音乐进行分类。5)尝试对音乐标签按相似程度进行聚类,减小对音乐分类模型的影响。实验结果表明,该音乐分类方法准确率较高,可以无监督地获取音乐多个维度的标签,为个性化的音乐检索提供了保障。
其他文献
目前,低功耗已经成为计算机体系结构的重要研究主题。特别是在移动平台上,功耗问题已经成为制约移动平台发展的瓶颈。游戏应用占据移动应用超过50%的下载量,且由于其交互密集
网格系统通过一体化架构、规范化接口、标准化服务等手段,实现了计算资源、存储资源、服务资源、数据资源等各种资源的集成共享和跨域协同,充分利用互联网上大量的闲置资源。网
Reed-Solomon(RS)码是一种非二进制的循环纠错码,不仅具有纠正随机错误的能力,还具有较强的纠正突发错误的能力,被广泛应用于移动通信、卫星通信、磁记录设备以及数字音频和视频
支持向量机(Support Vector Machine, SVM)是一种基于小样本学习理论的有效分类方法,近年来已成为国内外机器学习的一个研究热点。本文以SVM为基础,对直推式支持向量机(Transdu
人脸识别技术是生物特征识别的一种,它涉及了生理学、心理学、图形学等多个学科知识。和其它生物特征识别类似,人脸识别技术是通过提取人脸这一生物特征对人的身份进行确认。它
随着地理信息系统的广泛应用,它正逐步融入人们的日常生活,得到了越来越多用户的使用。由此空间信息服务系统面临着重大的挑战:大量并发用户的在线请求降低了服务器的性能;海
形式概念分析是一种有效的知识表示与知识发现工具,在数据挖掘、知识发现、信息检索等领域得到了广泛的应用。在形式概念分析的应用过程中,首先要构建概念格,因此建格算法的效率
随着计算机网络的普遍应用,分布式系统已成为计算机应用的基本形式。由于分布式算法是分布式系统中的关键技术之一,并影响着系统的性能,所以它得到了学者和工程师们的高度关
传统群体仿真技术常把群体看成若干个体的组合,但事实上群体是由若干具有相似行为的个体组成的群组所构成的。针对大多数现有群体仿真技术由于没有考虑到上述因素,导致仿真结
分形几何为人们描述客观世界提供了一种比欧式几何更加有效、客观的工具,并在自然科学和社会科学中得到了广泛的应用。本文在研究分形理论后,对传统基于分形维数的边缘检测算法