基于Web的专家搜索研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:peng7330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
所谓专家,是指具有一定专业技能的人员。在当今信息量骤增的时代,在企业内部网络上与万维网上搜索专家,是一个越来越重要的需求。然而,现有的专家搜索技术和工具无法满足这种需求。对于企业内部网络的专家搜索已有一些相关研究,但目前仍没有一个统一的理论框架,并且检索效果仍无法满足用户实际需求,而对于万维网上专家搜索的研究目前寥寥无几。为了弥补这些研究上的空白,本文提出基于Web的专家搜索的研究。具体来讲,本文主要深入研究以下几个课题。专家的发现和识别是指自动的发现文档集中的所有专家,并将专家出现的位置进行识别和标记。它是建立一个专家搜索引擎的首要问题。本文提出了一种通过分析E-mail的方法,来自动获得文档集中的专家列表,并提出一个高效的识别专家在文档集中出现位置的算法。专家搜索模型是在给定专家列表的情况下,针对给定的查询在文档集中有效的进行专家检索。本文提出一个基于证据的专家搜索模型。在这个模型中,一个专家与查询的相关程度由文档集中的证据决定。实验证明,本文提出的检索模型可以有效的在Web文档集中检索相关专家。为了区别专家和普通用户,本文提出静态排名(Static Ranking)的方法来发现专家的重要程度。本文提出了基于链接分析专家排名算法(ExpertRank),并进一步发展出主题敏感的专家排名算法(Topic Sensitive ExpertRank)。在万维网上,人名的歧义现象很严重。一个人名的搜索结果往往对应着多个不同的个体。这成为了专家搜索的一个必须解决的问题。本文针对该问题提出了一种利用额外的反馈页面进行分类的框架,并在该框架下提出两种用于分类的特征:“关键词(Key Token)”和“主题(Topic)”。实验证明,这两种特征在提高消歧效果上有着重要的作用。此外,本文也深入讨论了不同分类方法的效果,并利用不同的取样方法处理数据不平衡带来的稳定性问题。
其他文献
无线传感器网络作为一项新兴的信息技术,目前正成为计算机领域的一个活跃的研究分支。而由于无线传感器网络自身能量有限的特点,现有的无线路由技术并不适用于传感器网络,因
网格是一种无缝的、集成的资源共享和协作环境,它将网络上分散的各种计算机、存储设备、科学仪器等连接在一起,整合成一台巨大的虚拟超级计算机,以实现计算资源、存储资源、
三维重建技术已广泛应用于多种领域,作为人的最主要特征,人脸的三维信息描述若应用于三维人脸识别、医学整容等方面意义重大,然而既有的三维扫描仪主要是用于刚体部件的三维
随着Internet的发展和大规模应用需求的不断涌现,单个甚至多个Web Services也往往不能很好地满足一些复杂的应用。而目前对Web Services的研究多集中在开发、发布和部署方面,本
听觉反馈是研究言语生成与感知的重要手段。1994年Kawahara教授提出使用变换听觉反馈(Transformed Auditory Feedback,TAF)技术分析基频曲线,评估听觉反馈对言语生成与感知的
如今,信用卡消费已逐渐成为一种重要的支付手段,通过信用卡交易既让消费者节省了交费时间,同时也令银行从中获得了很大利润。对账单是用户高度关注的单据,它不仅是信用卡的单纯附
监控系统提供了收集信息和辅助保障安全的功能,随着科技不断的发展,如今越来越先进的摄像设备提供了大量移动对象的轨迹数据,例如行人、车辆、船舶、飞机等,而船只的突然停止
德国互联网调研机构ipoque称,P2P技术已经彻底统治了当今的互联网,其中总流量的50-90%都来自P2P程序。P2P技术由于其固有的优点,如非集中性、自治性、容错性和可扩展性等,已
随着对等网络规模和用户数量的增加,P2P环境下的信息量也随之飞速增长,给用户在搜索、定位和获取信息资源上都带来了巨大的困难。对等网络信息搜索技术是解决这一问题的重要
一个实用的智能信息处理系统无法回避对时间元素的处理,在智能规划领域尤其是这样。正因为如此,时态规划吸引了智能规划研究者的广泛重视,成为近年来规划领域一个重要的研究主题