【摘 要】
:
跨文本指代是指在多个文档中多个指代词指向同一个实体,它主要面临的问题多名现象和重名现象。跨文本指代消解的任务就是要解决多名现象和重名现象,即进行多名聚合和重名消歧
论文部分内容阅读
跨文本指代是指在多个文档中多个指代词指向同一个实体,它主要面临的问题多名现象和重名现象。跨文本指代消解的任务就是要解决多名现象和重名现象,即进行多名聚合和重名消歧。本文首先介绍如何构建自用语料库,然后通过无监督的聚类方法来研究中文跨文本指代消解的各种技术和方法,具体内容为:(1)描述了跨文本指代消解的基本概念并且确定了其具体任务,对当前所用的几种聚类算法及性能评价方法进行了描述。(2)以ACE2005中文语料库为基础,自行搭建了中文跨文本指代消解研究所用的语料库,利用语料库分析归纳了跨文本指代消解中产生的重名和多名现象,为下一章节的实验提供基础。(3)在之前标注的语料库上进行基于空间向量模型和无监督聚类的跨文本指代消解的研究,实现了参数调优以及对各种实体类型分别进行了聚类分析,除此之外,我们根据实体名称构词特点,将实体表述自身特征和空间向量特征结合起来进行了基于无监督聚类跨文本指代消解的研究。实验结果表明,相比于向量空间特征而言,实体表述特征更有助于跨文本指代消解,对于各种实体类型(如PER、ORG和GPE),均取得了90%左右的较好性能。
其他文献
数据模型是XML数据管理研究领域的核心问题之一,用来给出XML数据以及数据上操作的精确语义,是XML数据查询处理和优化的基础。目前数据的不确定性普遍存在于经济、军事、物流、
农业是支撑国民经济建设与发展的基础产业。如何利用有限的农业资源,借助先进的科学技术手段来提高生产效率、环境效益和经济效益已经成为农业领域的研究重点及热点。 近
人脸识别覆盖了计算机科学、数学、认知科学、神经科学以及心理学等多门前沿学科,是模式识别理论的一个典型应用,更是一个具有挑战性的研究课题。目前已有的人脸识别算法在可
人体检测技术是计算机视觉领域的重点和难点,人体检测在公共安全、人机互动、灾难救援等方面已被广泛应用。但是由于人体检测与其他目标检测相比存在非刚性、姿态复杂、外观不
复杂服务系统,是支撑大型现代服务业企业或行业运营、模式创新和业态演化的大型、复杂服务计算系统或平台,如电子商务、大型云服务系统、大型智慧城市系统等。业务流程建模是复
随着计算机软件、网络技术不断发展,基于B/S架构的.NET应用程序因其实用性强被广泛地应用于各种管理系统。当前高职高专教材管理使用的单机版或C/S架构为主的教材管理系统还
当下,我们生活在一个信息爆炸式增长的时代。为了缓解人们面临的“信息过载”问题,推荐技术应运而生。推荐技术旨在利用用户的兴趣信息向其推送其可能感兴趣或可能需要的信息。
近年来无线传感器网络(Wireless Sensor Network, WSN)凭借其广泛的应用以及潜力受到各国杰出研究者的追捧,掀起了一股研究热潮,而基本所有应用都涉及到节点如何定位的问题。所谓
旋转轴是机械设备的核心部件,通过检测、分析旋转轴振动信息能够及时地获取设备的运行状况,因此旋转轴振动信号检测对设备状态诊断具有重要意义。为满足市场对小型化、低成本