面向音乐领域的信息抽取技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:guoxxjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络上音乐数量不断增加,相应的音乐信息也飞速增长,人们对于快速准确的获取音乐信息的需求越来越迫切。因此,面向音乐领域的信息抽取具有一定研究意义,其主要研究内容是从自然语言文本描述的音乐信息中进行命名实体识别和关系抽取。音乐领域的信息抽取是音乐知识图谱自动构建的首要步骤,可广泛应用于音乐领域的信息检索、推荐系统、问答系统和对话系统等研究。本文首先定义了需要抽取的音乐实体类型和关系类别,构建了音乐领域的标注语料,然后在此基础上,对音乐实体识别和关系抽取相关技术进行了深入研究。针对音乐领域的命名实体识别任务,本文首先设计实现了基于字符特征的BLSTM-CRF模型作为基准,然后分别采用三种预训练的字符向量改进基准模型的嵌入层:1.使用Word2vec模型训练静态字向量2.使用Flair框架的双向循环神经网络语言模型训练动态字向量3.使用Google官方提供的中文动态字向量BERT-Base-Chinese前两种字向量均由本文使用对应模型在音乐领域的未标注语料上训练得到,第三种字向量为Google使用BERT模型训练的中文字向量。实验结果表明,三种改进后的模型相比基准模型的识别效果在宏平均F值上分别提升了5.1%、9.57%、9.89%,证明了本文改进方法的有效性。针对音乐领域的关系抽取任务,本文以BLSTM-Attention模型作为基准,在输入层中,基准模型仅仅考虑了序列中各个词语本身的信息和实体的位置信息,忽略了实体类别对关系类别的影响,本文提出了利用带有实体类别的位置指示器特征改进基准模型中的位置指示器特征;在注意力层,基准模型中的注意力机制仅仅考虑了序列中每个词语对关系类别的重要性,忽略了每个词语与两个实体的相关程度,本文提出了利用多头注意力机制分别计算不同特征空间下各个词语与目标实体的相关性,使得模型能够加大句子中与实体关联性强的词语的权重。实验证明本文提出的方法比基准模型取得了更好的关系分类效果。
其他文献
城市化进程的加快带来了城市空前的繁荣,然而也使城市交通面临着新的问题和挑战。交通特性研究是进行合理的、科学的交通规划设计和运营管理的前提和基础,文章结合2008年东莞
溶菌酶能够水解细菌细胞壁中β-1,4糖苷键,破坏细胞壁肽聚糖结构,是一种安全性高的药品、饲料食品添加剂。市场上销售的溶菌酶主要是从鸡蛋清中提取。相比于鸡溶菌酶,人溶菌酶(Human lysozyme,hLYZ)具有生物活性高、稳定性好,具有较高的应用价值。受限于原料来源、提纯精制成本等因素,人源溶菌酶制备量较少,不能满足需求。本论文通过共表达分子伴侣Kar2p、ERO1p、转录因子Hac1p及优化
采用MIDAS/Gen和ANSYS有限元分析软件对常德芦荻山收费站全张拉预应力索膜结构的预应力施加过程进行数值模拟,对该结构的初始应力状态进行反复试算,得出最佳索力初始应力;为
目的了解精神科医生心理健康状况。方法应用统一编制的一般状况调查表、焦虑自评量表(SAS)、症状自评量表(SCL-90)对某精神病专科医院临床一线工作的医生,共计159人进行问卷
目的:分析急诊猝死病例临床特点,探讨尸检在临床诊断中的意义。方法:对10例急诊猝死病例回顾性研究,总结临床资料及尸检报告,比较临床诊断与尸检结论。结果:10例患者中,l例患
职业教育立足教育的实践性及就业的针对性特征,在诸多的教育模式下脱颖而出,尤其是面对当今社会经济发展中对专业技术人员的需要趋势的递增引领下,职业教育必将成为我国教育
<正>目的观察ARDS时NF-κB对炎症反应的调节机制及PDTC的治疗作用。方法小鼠分N组、L组、P+L组,腹腔注射LPS复制ARDS模型,P+L组先腹腔注射PDTC,30min后注射LPS,给药2h、4h、8
会议
文化是民族的血脉,是国家繁荣图强和创新发展的动力源泉。推进新疆文化深度融合,对于减少和杜绝暴力恐怖事件、实现社会稳定和长治久安具有基础性作用。本文借鉴Moore(穆尔)
背景:支气管哮喘是一种伴有气道嗜酸性粒细胞浸润,杯状细胞和粘液分泌增多和气道阻力增加的气道感染性炎症,通常伴有肺血管通透性增加导致血浆漏出。强力霉素是一种广泛应用于哮
软土地基由于其厚度大、变形大、含水量高、压缩性大、强度低、承载力差、沉降量大并且其沉降周期长等主要特征,不能满足地基荷载要求。而在公路建设中,经常会不可避免的遇到