人名消歧相关论文
近年来,互联网技术快速发展,各类信息剧增,互联网上每天有海量信息在生成、传播和存储。作为人的标识之一的人名,在互联网检索中有......
人名存在歧义性,给人物信息检索、实体语义知识库构建、实体信息抽取等带来了严重的困难。人名消歧技术研究如何将同名人物实体指称......
随着互联网的普及,向搜索引擎提交查询进行信息检索已经成为人们获取网络信息的主要方法。人名检索是最常见的检索之一,通过搜索引......
对于金融信息服务而言,用户希望能够全面掌握一个公司或个股的重大事件以及事件的前因后果。金融门户网站存在着覆盖面不广和众多......
人名消歧是信息检索、数据挖掘等领域非常亟需解决的问题之一。目前,学术界对于人名消歧的研究已经取得了显著的成果,提出了很多人......
人名歧义是一种身份不确定现象,现实中同一个姓名可能被多个实体人物所使用,这种情况都会产生人名歧义。随着Internet的发展,网页......
随着互联网的高速发展,网络信息成爆炸式增长。如何快速、准确的从这些海量数据中获得有用的信息成为了人们关注的焦点。目前通用......
搜索引擎旨在帮助用户有效的获取信息。现有的搜索引擎,存在精度不高,查全率偏低的缺点,迫切需要新的搜索模型的出现,语义搜索就是尝试......
词汇语义关系是自然语言处理中至关重要的研究之一,词汇语义关系不仅是基础语义知识库构建的基本资源,而且在信息检索、机器翻译、情......
校友资源作为学校建设最重要的资源之一,在学校发展传承中有着其特殊而重要的作用,如何挖掘、整合与利用好校友资源是一个重要的课......
本文采用规则和模板相结合的策略,提出了一种维吾尔人名消歧的方法.该方法首先采用一系列规则,对维吾尔人名进行初步消歧,其次通过......
传统人名消歧算法中,每类特征仅反映人物实体的部分信息,且不同聚类算法各有优缺点。提出了一种基于聚类集成的人名消歧算法。从文本......
重名问题在Web人物搜索过程中是很普遍的现象.研究了Web人名消歧相关问题,提取与待消歧人名相关的不同特征集,运用向量空间模型构......
在构造文本特征空间的基础上,提出融合句义分析的三阶段人名消歧方法.该方法针对查询词常作为普通词出现的特点,在文本预处理后采......
为解决中文检索系统中重名问题带来的自引统计不准确问题,设计了一种基于规则的人名消歧算法,包括作者机构、作者名、学科分类和来......
集成第三方系统中已有的知识产出元数据是机构知识库内容建设的重要途径.文章分析了常见的知识资源管理系统中元数据共享方式,并确......
人名歧义性是自然语言处理中亟待解决的问题.首先介绍了人名消歧的研究背景与研究意义;其次,给出了基于聚类的人名消歧与基于实体......
搜索引擎中关于人名的相关文档往往数据量庞大,且数据为增量式更新过程,新文档出现的时间与规模都存在不确定性。现有的方法多为全局......
针对人物搜索的核心问题Web人名消歧进行了研究。根据网页的主题相关性和名字上下文噪音小等特性,提出一种基于主题模型LDA和上下......
人名消歧问题属于文本聚类范围,但有其自身的特殊性,即参与聚类的文本集采用向量空间模型表示以后具有较高的维度,导致数据在聚类......
人名歧义是一种身份不确定的现象,指的是文本中具有相同姓名的字符串指向现实世界中的不同实体人物。人名消歧很长时间一直是一个......
研究互联网中的人名消歧问题。抽取与网页文本中人名关键字实体相关的依存特征及命名实体等辅助特征,利用二层聚类算法,根据依存特......
通过对文本聚类算法DB-SCAN算法优化对文献著者人名进行消歧,结果表明,相对标准文本聚类算法来说,优化后的算法能取得更好的人名消歧......
[目的/意义]技术研发的核心是人才。研发团队是各领域技术发展的重点关注对象,也是机构研发实力的重要体现。[方法/过程]以德温特......
传统的犯罪查询的查询条件是文本信息,查询结果是有序的文档列表,这种方式无法展示结果之间的关系.基于异构信息网络以信息网络的......
CLP2010(CIPS-SIGHAN Joint Conference on Chinese Language Processing)的人名消歧评测的任务是个聚类问题:对给定的一组文档,按......
互联网技术的快速发展和网络数据的爆发式增长,使得Web上积累了海量的信息资源,Web成为人们获取信息的重要渠道。人是客观活动的主......
人名歧义是由于现实中同一姓名可能被多个实体人物共同使用而带来的一种身份不确定现象。中文人名搜索是互联网用户日常需求之一。......
利用层次聚类算法针对多文档中文人名消歧工作进行研究,通过实验提出能够较好区分人名的特征。在特征权重的计算中,使用TF的计算方......
【目的】实现对机构知识库作者名消歧的高度自动化处理,并在适当的时机提供人工介入机制。【方法】分析机构知识库作者名消歧的特......
Web个人信息指存在于网页中与一个人相关的信息,依照存在方式不同,可分为以结构化形式表达的个人直观属性和隐藏在非结构化文本中......
人名歧义是指现实生活中多个人物实体共用同一个人名而造成身份不确定的现象,这在国内外文本中普遍存在。在信息爆炸的互联网时代,......
随着移动互联网时代的到来,网络使用的便捷性不断提高,终端数量不断增加,使得信息发布的速度加快,信息量飞速增长搜索与特定人物相关的......
人名歧义是一种身份不确定的现象,指的是文本中相同的人名指向现实世界中的不同实体人物。人名消歧具有很大的实际应用价值,是搜索引......
人名消歧已经成为自然语言处理和信息抽取应用中亟待解决的重要问题。运用中文自然语言处理和信息抽取系统识别命名实体和实体关系......
跨文本人名消歧是判断出现在不同文本的相同人名是否指称现实中相同实体的过程。跨文本人名消歧是准确获取感兴趣人物相关信息的基......
针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库......
针对现有很多基于人物属性特征的人名消歧方法不适用于文本本身特征稀疏的问题,提出一种基于句义结构分析中文人名消歧方法。通过句......
人名歧义是一种实体对象的身份不确定的现象,是自然语言处理领域中的一个重要问题。随着全球互联网技术的发展以及大数据时代的来......
本文针对人名消歧任务中,由于歧义人名处于相近领域而区分困难的情况,提出了基于人物属性互斥与非互斥的两阶段人名消歧义方法。该方......
针对现有很多基于特征的人名消歧方法不适用于文档本身特征稀疏的问题,提出一种借助丰富的互联网资源,使用搜索引擎查询并扩展出更......
职业是人物实体的代表性特征,能够有效地区分人物实体。传统人名消歧算法仅把职业当作一个普通的特征,忽视了它的重要性。针对以上......
互联网作为一个信息交流平台,其中蕴含了大量人物信息。如何有效地从海量异构网页中抽取人物相关信息是自然语言处理领域的一个重......
将名词、形容词、动名词和命名实体作为文本特征,考虑词序与词频,结合特征项的语义,提出一种基于改进最长公共子序列的文本聚类(LCS......
文献著者消歧是人名消歧的一种,近年来引起了学术界的广泛关注。其中,文献聚类方法是文献著者消歧的重要方法,但其实验效果往往不佳。......
中文图书作者中一人多名和多人同名现象普遍存在;且各属性描述参差不齐。融合特征消歧算法处理过程中准确率有所下降。本文将作者......