音乐领域全局实体关系抽取研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:netchina123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上信息的快速增长,信息抽取技术越来越被关注,而实体关系的抽取又是这些任务中非常重要的一个子任务。经研究发现由于传统的实体关系抽取技术面向句子级,只在一个句子中进行抽取,从而丢失了大量的关系。因此本文提出全局实体关系抽取,对篇章中的任意两个实体进行关系抽取和分类。本文从音乐领域入手,通过详细的统计和分析,发现实体关系抽取会受到实体之间其它关系的影响,比如实体间的等价关系和并列关系。通过实体之间等价关系和非等价关系的融合和简单推理可以实现全局实体关系抽取。本文首先采用基于规则和利用依存句法以及二者结合的多种方法对音乐领域实体的所有表述进行识别;然后在此基础上分别采用基于规则,基于二元分类以及二者结合的多种方法对音乐领域的共指消解进行研究;其次研究了卷积树树核和混合核等在音乐领域实体关系抽取中的应用;最后通过关系间的有效融合和简单推理,实现全局实体关系抽取。评测结果显示,我们的全局实体关系抽取比传统实体关系抽取的F值提高了13.8%,而且我们的技术可以适用于任何领域。最后本文还设计并实现了共指消解实验与应用平台和文本挖掘技术集成平台,为自然语言处理领域研究和应用提供更好的服务。
其他文献
生物医学文本挖掘的目的是借助文本挖掘技术帮助生物医学研究者从海量文献中更有效地找到所需信息、发现隐藏的生物医学知识。通过对孟德尔人类遗传在线(Online Mendelian In
近年来,随着手机用户的不断增长,短信已经在人们的日常生活中发展成为一种非常重要的交流方式,同时,由于短信的高效,低成本和无时空限制等优势受到了越来越多企业的重视。然而,目前
目前,随着网络技术的发展和各种网络应用的普及,与传统的静态HTML页面相比,蕴含数据更加丰富,质量更高的网络数据库正引起研究人员的广泛关注。然而,在特定的应用领域,由于不
在企业管理软件中,业务构件可以通过参数化和配置技术被复用以适应业务需求的变化,这种构件粒度大、可变参数多、结构复杂,难以开发。业务构件是所要处理的业务对象(如业务单
现阶段搭载多核处理器的网络服务器平台越来越普及。而操作系统是在单核处理器时代开发,无法充分发挥多核处理器的强大处理能力,所以对串行协议栈进行并行优化具有重要意义。
基于视频信息的说话者检测,就是不借助音频信息,单从说话者的嘴唇动作来判定谁在说话的检测方法。涉及到的相关技术有视频镜头分割、人脸检测与跟踪、嘴唇区域定位以及唇动判
关键短语抽取是文本信息处理的重要技术。随着网络时代的到来,在线文档呈现出几何级数的增长,“信息爆炸”成为这个时代的主要特征。检索和利用网络信息变得越来越困难,关键
随着Internet呈爆炸式的增长,人们经常会遇到网络拥塞和服务质量低等一系列问题。因此,对大规模网络行为研究已是当务之急。网络模拟作为计算机网络研究的主要手段,以周期小
随着半导体技术和计算机体系结构技术的发展,分片式处理器逐渐成为多核领域的一个发展方向。分片式处理器有效解决和缓解了线延迟、功耗、可扩展性等现代处理器面临的主要问
在组播路由协议中,PIM-SM协议以其协议无关性、组成员显示加入的特性以及共享树(RPT)向最短路径树(SPT)切换等机制,成为了目前应用最为广泛的域内组播路由协议。但是随着网络技术的